這世界不隨機!談班佛定律(Benford's Law - Medium

文章推薦指數: 80 %
投票人數:10人

談班佛定律(Benford's Law). Source: Needpix.com. 身處大數據時代,數字,無所不在。

從小至個人身分證、信用卡、消費行為、薪水,大至一個國家的 ... GetunlimitedaccessOpeninappHomeNotificationsListsStoriesWritePublishedinAndrea’sDiscovery這世界不隨機!談班佛定律(Benford'sLaw)Source:Needpix.com身處大數據時代,數字,無所不在。

從小至個人身分證、信用卡、消費行為、薪水,大至一個國家的人口、GDP、土地面積......任何分秒,任何位置,任何事物,都能用數字來量化。

直覺上來說,這些不論是經由人的行為、或是大自然自然發生的事件,所產生的數字,應該要是隨機的吧?就像擲骰子一樣,每個數字出現的機率都是六分之一。

但如果仔細觀察,這些數字,竟然背後都有一個神奇的模式。

這讓我想到愛因斯坦的名言,「上帝不會擲骰子。

」雖然這項定律目前就我看來與量子力學八竿子打不著,但同樣說明了--世界不是那麼隨機的。

班佛定律(Benford'sLaw),是從Netflix影集《大數據時代》(Connected),第四集談論「數字」時學到的。

乍聽之下會以為是一個名叫Benford的人發現的,不過其實它的現身,是1881年由美國天文學家紐康(SimonNewcomb)揭露的。

書的翻頁痕跡...描繪出神奇定律Source:WikimediaCommons當時,紐康正在圖書館讀和對數相關的書籍,他發現這些書前面的書頁比後面的破舊,也就是說,數字比較小的前幾頁比較多人查閱。

他認為,由於某種原因,人們對開頭為1的數字進行的計算,會比對開頭為8或9的數字使用的還要多。

他潛心研究觀察到的「骯髒頁面效應」,並發表了班佛定律的數學公式。

舉例而言,現今社會大多使用十進位制,因此以數n起頭出現的機率,會等於以10為底的log(1+1/n)。

首位數是1的數字,出現的機率即為log(1+1/1)=log2=0.3;首位數是2的數字,出現的機率為log1.5=0.176;首位數是9的數字,出現的機率是log(10/9)=0.046。

這些遞減的機率將如下圖呈現:Source:WikimediaCommons但因為我腦中的對數早就忘光光,我也不知道到底是怎麼推斷出這個公式的,就連物理學家班佛(FrankBenford)也無法好好解釋這項定律的存在,不過他抓取了兩萬多筆資料,發現他們竟全都遵循這個公式,因此「班佛定律」正式誕生。

謎一般的定律這裡、那裡到處都是好,因為這個定律實在太玄了,如果要探討它的歷史就會變得不有趣了,那來看看它可以怎麼運用?美國各州各郡人口數,某由網友利用R程式分析英式足球,攻方在被攔截前成功傳球的次數破火山口覆蓋面積、年齡與火山噴發持續天數“LesserFaith”byJ.SyreusBach音樂中的頻譜數值,同由R網站網友分析圖片中像素的顏色值分布甚至一名攝影師個人攝影的習慣想造假?定律立刻揪出來!好啦,它很神奇,但有什麼用?談到班佛定律,就不得不提,它對於造假數字有多麼敏感。

照理來說,所有數據都應該符合班佛定律,但如果有人為蓄意造假,比例就會出現偏離,啊,那就抓到了。

抓到什麼?抓到會計表中的假帳、選舉人票數做假、圖片移花接木、殭屍社群媒體帳號......數字不會騙人。

舉個目前最夯的例子好了,COVID-19病例數,有沒有人在隱瞞?中國?由彭堯好博士發布的研究報告,運用數學分析發現,中共政府提供的疫情數據有眾多異常之處;當所有其他國家的病例數都遵循班佛定律(當然並不完美),中國的模式卻截然不同,引人深思。

定律並非萬能Source:Needpix.com這項定律實際運用上還有不少限制。

第一,收集資料樣本要夠多,至少要3,000筆以上;第二,不可有「人為限制」,比如說想探討全台北的平均房租,因為已有固定價格區間而將不符合班佛定律,或是身分證、電話號碼這些人為制定數字也不符;第三,跨越越大量度越能準確預測,像是身高、體重、年齡這些具有上下限的數據就不滿足;第四,真正隨機的數字也不符合班佛定律,比如真的去擲骰子。

結論,我還是不知道到底是為什麼,但過了100多年,相信班佛定律的應用,仍值得人們進一步探索。

10MorefromAndrea’sDiscoveryThisiswhereIwritesomefunandinterestingstuffIlearnedinbooksorvideos.ReadmorefromAndrea’sDiscoveryGetstartedAndreaDai32FollowersHieveryone,thisiswhereIoccasionallysharesomeworth-sharing,interestingfunfacts,knowledgeandpersonalnotes.FollowRelatedHow2KeepHumidity-LovingPlantsHappyWhenyoufirsttellsomeonethatyouliveinAustralia,andthey’reun-Aussie,theyoftenthinkofcoastalsummerdaysthatarefilledwith…DrinkUp:MoreWaterCanHelpYouDestressTodayTheBafangCrankDrive—APersonalReview48HoursinAustin,TX — ATravelGuideIwillbethefirsttosaythat48hoursinAustin,Texasisnotnearlyenoughtimetocheckoutallthatthecityhastooffer.Ispent…HelpStatusWritersBlogCareersPrivacyTermsAboutKnowable



請為這篇文章評分?