這世界不隨機!談班佛定律(Benford's Law - Medium
文章推薦指數: 80 %
談班佛定律(Benford's Law). Source: Needpix.com. 身處大數據時代,數字,無所不在。
從小至個人身分證、信用卡、消費行為、薪水,大至一個國家的 ...
GetunlimitedaccessOpeninappHomeNotificationsListsStoriesWritePublishedinAndrea’sDiscovery這世界不隨機!談班佛定律(Benford'sLaw)Source:Needpix.com身處大數據時代,數字,無所不在。
從小至個人身分證、信用卡、消費行為、薪水,大至一個國家的人口、GDP、土地面積......任何分秒,任何位置,任何事物,都能用數字來量化。
直覺上來說,這些不論是經由人的行為、或是大自然自然發生的事件,所產生的數字,應該要是隨機的吧?就像擲骰子一樣,每個數字出現的機率都是六分之一。
但如果仔細觀察,這些數字,竟然背後都有一個神奇的模式。
這讓我想到愛因斯坦的名言,「上帝不會擲骰子。
」雖然這項定律目前就我看來與量子力學八竿子打不著,但同樣說明了--世界不是那麼隨機的。
班佛定律(Benford'sLaw),是從Netflix影集《大數據時代》(Connected),第四集談論「數字」時學到的。
乍聽之下會以為是一個名叫Benford的人發現的,不過其實它的現身,是1881年由美國天文學家紐康(SimonNewcomb)揭露的。
書的翻頁痕跡...描繪出神奇定律Source:WikimediaCommons當時,紐康正在圖書館讀和對數相關的書籍,他發現這些書前面的書頁比後面的破舊,也就是說,數字比較小的前幾頁比較多人查閱。
他認為,由於某種原因,人們對開頭為1的數字進行的計算,會比對開頭為8或9的數字使用的還要多。
他潛心研究觀察到的「骯髒頁面效應」,並發表了班佛定律的數學公式。
舉例而言,現今社會大多使用十進位制,因此以數n起頭出現的機率,會等於以10為底的log(1+1/n)。
首位數是1的數字,出現的機率即為log(1+1/1)=log2=0.3;首位數是2的數字,出現的機率為log1.5=0.176;首位數是9的數字,出現的機率是log(10/9)=0.046。
這些遞減的機率將如下圖呈現:Source:WikimediaCommons但因為我腦中的對數早就忘光光,我也不知道到底是怎麼推斷出這個公式的,就連物理學家班佛(FrankBenford)也無法好好解釋這項定律的存在,不過他抓取了兩萬多筆資料,發現他們竟全都遵循這個公式,因此「班佛定律」正式誕生。
謎一般的定律這裡、那裡到處都是好,因為這個定律實在太玄了,如果要探討它的歷史就會變得不有趣了,那來看看它可以怎麼運用?美國各州各郡人口數,某由網友利用R程式分析英式足球,攻方在被攔截前成功傳球的次數破火山口覆蓋面積、年齡與火山噴發持續天數“LesserFaith”byJ.SyreusBach音樂中的頻譜數值,同由R網站網友分析圖片中像素的顏色值分布甚至一名攝影師個人攝影的習慣想造假?定律立刻揪出來!好啦,它很神奇,但有什麼用?談到班佛定律,就不得不提,它對於造假數字有多麼敏感。
照理來說,所有數據都應該符合班佛定律,但如果有人為蓄意造假,比例就會出現偏離,啊,那就抓到了。
抓到什麼?抓到會計表中的假帳、選舉人票數做假、圖片移花接木、殭屍社群媒體帳號......數字不會騙人。
舉個目前最夯的例子好了,COVID-19病例數,有沒有人在隱瞞?中國?由彭堯好博士發布的研究報告,運用數學分析發現,中共政府提供的疫情數據有眾多異常之處;當所有其他國家的病例數都遵循班佛定律(當然並不完美),中國的模式卻截然不同,引人深思。
定律並非萬能Source:Needpix.com這項定律實際運用上還有不少限制。
第一,收集資料樣本要夠多,至少要3,000筆以上;第二,不可有「人為限制」,比如說想探討全台北的平均房租,因為已有固定價格區間而將不符合班佛定律,或是身分證、電話號碼這些人為制定數字也不符;第三,跨越越大量度越能準確預測,像是身高、體重、年齡這些具有上下限的數據就不滿足;第四,真正隨機的數字也不符合班佛定律,比如真的去擲骰子。
結論,我還是不知道到底是為什麼,但過了100多年,相信班佛定律的應用,仍值得人們進一步探索。
10MorefromAndrea’sDiscoveryThisiswhereIwritesomefunandinterestingstuffIlearnedinbooksorvideos.ReadmorefromAndrea’sDiscoveryGetstartedAndreaDai32FollowersHieveryone,thisiswhereIoccasionallysharesomeworth-sharing,interestingfunfacts,knowledgeandpersonalnotes.FollowRelatedHow2KeepHumidity-LovingPlantsHappyWhenyoufirsttellsomeonethatyouliveinAustralia,andthey’reun-Aussie,theyoftenthinkofcoastalsummerdaysthatarefilledwith…DrinkUp:MoreWaterCanHelpYouDestressTodayTheBafangCrankDrive—APersonalReview48HoursinAustin,TX — ATravelGuideIwillbethefirsttosaythat48hoursinAustin,Texasisnotnearlyenoughtimetocheckoutallthatthecityhastooffer.Ispent…HelpStatusWritersBlogCareersPrivacyTermsAboutKnowable
延伸文章資訊
- 1班佛定律 - 科學Online
班佛定律(Benford's Law) 國立屏東高級中學數學科楊瓊茹老師. 現行的高中教科書中,有個非常有意思的題目:. 審計工作者會使用班佛法則來查帳,班佛法則是:「銀行存款 ...
- 2拜登得票數不符合「班佛定律」所以是作票? - 報橘
由於台灣人民可自由遷徙到全台368 個鄉鎮,每個鄉鎮的人口數字屬於自然發生、不受限制的觀察值,因此這368 個人口數的首位數,理論上來說會符合「班佛定律 ...
- 3班佛定律 - 科學Online
班佛定律 ... ,這個現象和直覺不相符合,每個數字出現的機率並不一樣。最高位數字愈小,出現的機率愈大!底下,我們用長條圖表示,一目瞭然勝過千言萬語。
- 4一的力量:如何利用「班佛定律」偵破數字詐欺? - 關鍵評論網
尼格里尼知道的事,顯然是亞歷克斯的小叔不知道的,那就是店裡的銷售數字,應該要符合人們在一百多年前意外發現的數學規則,這規則被稱為「班佛定律」。
- 5班佛定律
在數學中,班佛定律(英語:Benford's law)描述了真實數字數據集中首位數字的頻率分布。一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成, ...