班佛定律- 維基百科,自由的百科全書

文章推薦指數: 80 %
投票人數:10人

在數學中,班佛定律(英語:Benford's law)描述了真實數字數據集中首位數字的頻率分布。

一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成, ... 班佛定律 維基百科,自由的百科全書 跳至導覽 跳至搜尋 在數學中,班佛定律(英語:Benford'slaw)描述了真實數字數據集中首位數字的頻率分布。

一堆從實際生活得出的數據中,以1為首位數字的數的出現機率約為總數的三成,接近直覺得出之期望值1/9的3倍。

推廣來說,越大的數,以它為首幾位的數出現的機率就越低。

它可用於檢查各種數據是否有造假。

但要注意使用條件:1.數據至少3000筆以上。

2.不能有人為操控。

[來源請求] 目次 1數學 2不完整的解釋 3應用 4歷史 5參見 6參考文獻 7參考 數學[編輯] 班佛定律說明在 b {\displaystyleb} 進位制中,以數 n {\displaystylen} 起頭的數出現的機率為: P ( n ) = log b ⁡ ( n + 1 ) − log b ⁡ ( n ) = log b ⁡ ( n + 1 n ) , {\displaystyleP(n)=\log_{b}(n+1)-\log_{b}(n)=\log_{b}\left({\frac{n+1}{n}}\right),} 其中 n = 1 , 2 , . . . , b − 1. {\displaystylen=1,2,...,b-1.} 班佛定律不但適用於個位數字,連多位的數也可用。

在十進制首位數字的出現機率(%,小數點後一個位): n P ( n ) {\displaystyleP(n)} P ( n ) {\displaystyleP(n)} 的相對大小 1 30.1% 30.1  2 17.6% 17.6  3 12.5% 12.5  4 9.7% 9.7  5 7.9% 7.9  6 6.7% 6.7  7 5.8% 5.8  8 5.1% 5.1  9 4.6% 4.6  不完整的解釋[編輯] 一組平均增長的數據開始時,增長得較慢,由最初的數字 a {\displaystylea} 增長到另一個數字 a + 1 {\displaystylea+1} 起首的數的時間,必然比 a + 1 {\displaystylea+1} 起首的數增長到 a + 2 {\displaystylea+2} ,需要更多時間,所以出現率就更高了。

從數數目來說,順序從1開始數,1,2,3,...,9,從這點終結的話,所有數起首的機會似乎相同,但9之後的兩位數10至19,以1起首的數又大大拋離了其他數了。

而下一堆9起首的數出現之前,必然會經過一堆以2,3,4,...,8起首的數。

若果這樣數法有個終結點,以1起首的數的出現率一般都比9大。

另一種解釋如下.當數據跨越多個數量級時,更自然的做法是畫在對數坐標中,如果這些數據在對數坐標下的分布是均勻的,那麼班佛定律自然成立。

即使在對數坐標下的機率密度函數不是常數,只要其變化足夠緩慢,且數據跨越了多個數量級,班佛定律也會近似成立,如下圖所示. 這個定律的嚴格證明,可以參見Hill,T.P."AStatisticalDerivationoftheSignificant-DigitLaw."Stat.Sci.10,354-363,1996.。

應用[編輯] 1972年,HalVarian提出這個定律來用作檢查支持某些公共計劃的經濟數據有否欺瞞之處。

1992年,MarkJ.Nigrini便在其博士論文"TheDetectionofIncomeTaxEvasionThroughanAnalysisofDigitalFrequencies."(Ph.D.thesis.Cincinnati,OH:UniversityofCincinnati,1992.)提出以它檢查是否有偽帳。

推而廣之,它能用於在會計學、金融甚至選舉中出現的數據。

華盛頓郵報引用該定律聲稱2009年伊朗總統大選中有造假。

[1] 若所用的數據有指定數值範圍;或不是以機率分布出現的數據,如常態分布的數據;這個定律則不準確。

歷史[編輯] 1881年,天文學家西蒙·紐康發現對數表包含以1起首的數那首幾頁較其他頁破爛。

1938年,物理學家法蘭克·班佛(英語:FrankBenford)再次發現這個現象,還通過了檢查許多數據來證實這點。

2009年,西班牙數學家在質數中發現了一種新模式,並且驚訝於為何現在才為人發現。

雖然質數一般被認為是隨機分布的,但西班牙數學家發現質數數列中每個質數的首位數字有明顯的分布規律[來源請求],它可以被描述了質數的班佛定律。

這項新發現除了提供對質數屬性的新洞見之外,還能應用於欺騙檢測和股票市場分析等領域。

參見[編輯] 齊夫定律 參考文獻[編輯] ^BerndBeber;AlexandraScacco.TheDevilIsintheDigits:EvidenceThatIran'sElectionWasRigged.WashingtonPost.2009-06-20[2020-11-07].(原始內容存檔於2021-03-22)(英語).  參考[編輯] AlexElyKossovsky.Benford'sLaw:Theory,theGeneralLawofRelativeQuantities,andForensicFraudDetectionApplications(頁面存檔備份,存於網際網路檔案館),2014,WorldScientificPublishing.ISBN978-981-4583-68-8. SimonNewcomb.NoteontheFrequencyofUseoftheDifferentDigitsinNaturalNumbers.,AmericanJournalofMathematics,4(1881),p.39[1](頁面存檔備份,存於網際網路檔案館) 2005年6月2日明報D15版,《假帳剋星——班佛定律》,吳端偉博士[2] 以下為其參考: FrankBenford:Thelawofanomalousnumbers,ProceedingsoftheAmericanPhilosophicalSociety,78(1938),p.551 TedHill:Thefirstdigitphenomenon,AmericanScientist86(July-August1998),p.358.10頁的pdf文件 HalVarian:Benford'slaw,AmericanStatistician26,p.65. NewPatternFoundinPrimeNumbersphysorg.com(頁面存檔備份,存於網際網路檔案館) 閱論編機率分布列表(英語:Listofprobabilitydistributions)有限支集離散單變數 本福德 伯努利 β-二項式 二項 分類(英語:Categoricaldistribution) 超幾何 泊松二項(英語:Poissonbinomialdistribution) 拉德馬赫(英語:Rademacherdistribution) 離散均勻 齊夫 齊夫-曼德爾布羅特(英語:Zipf–Mandelbrotlaw) 無限支集離散單變數 β-負二項(英語:Betanegativebinomialdistribution) 鮑萊耳(英語:Boreldistribution) 康威-麥克斯韋-泊松(英語:Conway–Maxwell–Poissondistribution) 離散相型(英語:Discretephase-typedistribution) 德拉波特(英語:Delaportedistribution) 擴展負二項 高斯-庫茲明 幾何 對數 負二項 拋物線碎形 泊松 Skellam 尤爾-西蒙 ζ 緊支集連續單變數 反正弦 ARGUS 巴爾丁-尼科爾斯 貝茨 Β Β矩形 歐文-霍爾 庫馬拉斯瓦米 分對數常態 非中心β 升餘弦 倒數 三角形 U-二次型 連續均勻 維格納半圓 半無限區間支集連續單變數 貝尼尼 第一類本克坦德 第二類本克坦德 Β' 伯爾 χ² χ Dagum 戴維斯 指數-對數 愛爾朗 指數 F 摺疊常態 弗洛里-舒爾茨(英語:Flory–Schulzdistribution) 弗雷謝 Γ Γ/岡珀茨 廣義逆高斯 岡珀茨 半邏輯 半常態 霍特林T-方 超愛爾朗 超指數 次指數 逆χ² 縮放逆χ² 逆高斯 逆Γ 科摩哥洛夫 列維 對數柯西 對數拉普拉斯 對數邏輯 對數常態 矩陣指數 麥克斯韋-玻耳茲曼 麥克斯韋-於特納 米塔格-萊弗勒 中上 非中心χ² 柏拉圖 相型 保利-韋伯 瑞利 相對布萊特-維格納分布 萊斯 移位岡珀茨 截斷常態 第二類岡貝爾 韋伯 離散韋伯 威爾克斯λ 無限區間支集連續單變數 柯西 指數冪 費雪z 高斯q 廣義常態 廣義雙曲 幾何穩定 岡貝爾 赫魯茲馬克 雙曲正割 詹森SU 朗道 拉普拉斯 非對稱拉普拉斯 邏輯 非中心t 常態(高斯) 常態逆高斯 偏斜常態 斜線 穩定 學生t 第一類岡貝爾 特雷西-威登 變異數-γ 福格特 可變類型支集連續單變數 廣義極值 廣義柏拉圖 圖基λ Q-高斯 Q-指數 Q-韋伯 移位對數邏輯 混合連續離散單變數 調整高斯 多元(聯合) 離散 尤恩斯 多項 狄利克雷多項 負多項 連續 狄利克雷 廣義狄利克雷 多元常態 多元穩定 多元t 常態縮放逆γ 常態γ 矩陣 逆矩陣γ 逆威沙特 矩陣常態 矩陣t 矩陣γ 常態逆威沙特 常態威沙特 威沙特 定向(英語:Directionalstatistics) 一元(圓形) 圓形均勻 一元馮·米塞斯 環繞常態 環繞柯西 環繞指數 環繞非對稱拉普拉斯 環繞列維 二元(球形) 肯特 二元(環形) 二元馮·米澤斯 多元 馮·米澤斯-費雪 賓漢姆 退化和奇異(英語:Singulardistribution) 退化 狄拉克δ 奇異 康托爾 族 圓形 複合泊松 橢圓 指數 自然指數 位置尺度 最大熵 混合 皮爾森 特威迪 環繞 取自「https://zh.wikipedia.org/w/index.php?title=本福特定律&oldid=69298318」 分類:​統計學定律經驗法則隱藏分類:​CS1英語來源(en)含有英語的條目有未列明來源語句的條目使用ISBN魔術連結的頁面 導覽選單 個人工具 沒有登入討論貢獻建立帳號登入 命名空間 條目討論 臺灣正體 不转换简体繁體大陆简体香港繁體澳門繁體大马简体新加坡简体臺灣正體 查看 閱讀編輯檢視歷史 更多 搜尋 導航 首頁分類索引特色內容新聞動態近期變更隨機條目資助維基百科 說明 說明維基社群方針與指引互助客棧知識問答字詞轉換IRC即時聊天聯絡我們關於維基百科 工具 連結至此的頁面相關變更上傳檔案特殊頁面靜態連結頁面資訊引用此頁面維基數據項目 列印/匯出 下載為PDF可列印版 其他專案 維基共享資源 其他語言 العربيةБългарскиCatalàČeštinaDanskDeutschEnglishEspañolEuskaraفارسیSuomiFrançaisעבריתMagyarItaliano日本語한국어NederlandsNorskbokmålPolskiPortuguêsРусскийSrpskohrvatski/српскохрватскиСрпски/srpskiSvenskaไทยTürkçeУкраїнськаاردوTiếngViệt粵語 編輯連結



請為這篇文章評分?