貝氏推論- 維基百科,自由的百科全書
文章推薦指數: 80 %
貝氏推論(英語:Bayesian inference)是推論統計的一種方法。
這種方法使用貝氏定理,在有更多證據及訊息時,更新特定假設的機率。
貝氏推論是統計學(特別是數理統計 ...
貝氏推論
維基百科,自由的百科全書
跳至導覽
跳至搜尋
此條目需要精通或熟悉相關主題的編者參與及協助編輯。
(2017年2月2日)請邀請適合的人士改善本條目。
更多的細節與詳情請參見討論頁。
統計學系列條目貝氏統計
理論
允許決策規則(英語:Admissibledecisionrule)
貝氏效率(英語:Bayesianefficiency)
貝氏機率
機率解釋(英語:Probabilityinterpretations)
貝氏定理
貝氏因子(英語:Bayesfactor)
貝氏推論
貝氏推論
事前機率
事後機率
概似函數
共軛先驗
後驗預測分布(英語:Posteriorpredictivedistribution)
超參數(英語:Hyperparameter)
超先驗(英語:Hyperprior)
無差別原理(英語:Principleofindifference)
最大熵原理(英語:Principleofmaximumentropy)
經驗貝氏方法(英語:EmpiricalBayesmethod)
克倫威爾法則(英語:Cromwell'srule)
伯恩斯坦–馮·米塞斯定理(英語:Bernstein–vonMisestheorem)
施瓦次準則(英語:Schwarzcriterion)
信賴區間
最大事後機率估計
激進機率主義(英語:Radicalprobabilism)
方法
貝氏線性迴歸(英語:Bayesianlinearregression)
貝氏估計(英語:Bayesianestimator)
貝氏計算(英語:ApproximateBayesiancomputation)
馬可夫鏈蒙地卡羅
機率與統計主題閱論編
貝氏推論(英語:Bayesianinference)是推論統計的一種方法。
這種方法使用貝氏定理,在有更多證據及訊息時,更新特定假設的機率。
貝氏推論是統計學(特別是數理統計學)中很重要的技巧之一。
貝氏更新(Bayesianupdating)在序列分析中格外的重要。
貝氏推論應用在許多的領域中,包括科學、工程學、哲學、醫學、體育運動、法律等。
在決策論的哲學中,貝氏推論和主觀機率有密切關係,常常稱為貝氏機率。
貝氏定理是由統計學家托馬斯·貝葉斯(ThomasBayes)根據許多特例推導而成,後來被許多研究者推廣為一普遍的定理[1]
目次
1貝葉斯定理的簡介
1.1正式的介紹貝葉斯推斷
1.2非正式的介紹貝葉斯推斷
2貝葉斯推斷的描述
2.1定義
2.2貝葉斯推斷
3應用
3.1電腦應用
4歷史
5參考資料
6相關條目
貝氏定理的簡介[編輯]
貝氏定理的圖示說明。
在表中,3,1,2及6的值是在對應條件及情形下的比重。
分數中的機率是指陰影部份的機率。
可以看出P(A|B)P(B)=P(B|A)P(A)i.e.P(A|B)=P(B|A)P(A)/P(B)。
類似的方式可以證明P(Ā|B)=P(B|Ā)P(Ā)/P(B)
主條目:貝氏定理
參見:貝氏機率
正式的介紹貝氏推論[編輯]
貝氏推論將事後機率(考慮相關證據或數據後,某一事件的條件機率)作為事前機率(考慮相關證據或數據前,某一事件不確定性的機率)和概似函數(由觀測數據的統計模型(機率模型)推導而得)這兩個前因導出的結果。
貝氏推論根據貝氏定理計算事後機率:
P
(
H
∣
E
)
=
P
(
E
∣
H
)
⋅
P
(
H
)
P
(
E
)
{\displaystyleP(H\midE)={\frac{P(E\midH)\cdotP(H)}{P(E)}}}
其中
∣
{\displaystyle\textstyle\mid}
表示將某事件成立作為條件(因此
(
A
∣
B
)
{\displaystyle\textstyle(A\midB)}
表示「假定B事件成立下,A事件發生」)
H
{\displaystyle\textstyleH}
表示假說,其機率可能會受實驗數據(以下會稱為證據)影響。
一般來說會有許多互相矛盾的假說,任務是要確認哪一個假說可能性最高。
E
{\displaystyle\textstyleE}
表示證據。
證據對應新的數據,也就是還沒用來計算事前機率的數據。
P
(
H
)
{\displaystyle\textstyleP(H)}
,事前機率,是觀察到數據
E
{\displaystyle\textstyleE}
(目前證據)之前,假說
H
{\displaystyle\textstyleH}
的機率。
P
(
H
∣
E
)
{\displaystyle\textstyleP(H\midE)}
,事後機率,是在給定證據
E
{\displaystyle\textstyleE}
之後,假說
H
{\displaystyle\textstyleH}
的機率,是希望求得的資訊,也就是在有目前證據時,假說
H
{\displaystyle\textstyleH}
的機率。
P
(
E
∣
H
)
{\displaystyle\textstyleP(E\midH)}
是假定
H
{\displaystyle\textstyleH}
成立時,觀察到
E
{\displaystyle\textstyleE}
的機率。
在
H
{\displaystyle\textstyleH}
不變時,這是
E
{\displaystyle\textstyleE}
的函數,也是概似函數,指出在給定假設下假說和證據的相容程度。
概似函數是證據
E
{\displaystyle\textstyleE}
的函數,而事後機率是假說
H
{\displaystyle\textstyleH}
的函數。
P
(
E
)
{\displaystyle\textstyleP(E)}
有時會稱為邊際概似率(英語:marginallikelihood)。
此係數對所有可能的假說都是定值,因此在判斷不同假說的相對機率時,不會用到這個係數中。
針對不同的
H
{\displaystyle\textstyleH}
數值,只有
P
(
H
)
{\displaystyle\textstyleP(H)}
和
P
(
E
∣
H
)
{\displaystyle\textstyleP(E\midH)}
(都在分子)會影響
P
(
H
∣
E
)
{\displaystyle\textstyleP(H\midE)}
的數值。
假說的事後機率和其事前機率(固有概似率)和新產生的概似率(假說和新得到證據的相容性)乘積成正比。
貝氏定理也可以寫成下式:
P
(
H
∣
E
)
=
P
(
E
∣
H
)
P
(
E
)
⋅
P
(
H
)
{\displaystyleP(H\midE)={\frac{P(E\midH)}{P(E)}}\cdotP(H)}
其中係數
P
(
E
∣
H
)
P
(
E
)
{\displaystyle\textstyle{\frac{P(E\midH)}{P(E)}}}
可以解釋成
E
{\displaystyleE}
對
H
{\displaystyleH}
機率的影響。
非正式的介紹貝氏推論[編輯]
貝氏推論最關鍵的點是可以利用貝斯定理結合新的證據及以前的先驗機率,來得到新的機率(這和頻率學派推論相反,頻率論推論只考慮證據,不考慮先驗機率)。
而且貝氏推論可以迭代使用:在觀察一些證據後得到的後設機率可以當作新的先驗機率,再根據新的證據得到新的後設機率。
因此貝斯定理可以應用在許多不同的證據上,不論這些證據是一起出現或是不同時出現都可以,這個程序稱為貝斯更新(Bayesianupdating)。
貝氏推論的描述[編輯]
定義[編輯]
x
{\displaystylex}
是數據點,可能是一個有許多數值形成的向量(英語:randomvector)。
θ
{\displaystyle\theta}
是數據點分布的參數,也就是說
x
∼
p
(
x
∣
θ
)
{\displaystylex\simp(x\mid\theta)}
。
這也有可能是參數形成的向量。
α
{\displaystyle\alpha}
是參數的超參數(英語:hyperparameter),也就是說
θ
∼
p
(
θ
∣
α
)
{\displaystyle\theta\simp(\theta\mid\alpha)}
。
這也有可能是超參數形成的向量。
X
{\displaystyle\mathbf{X}}
,由觀測到的
n
{\displaystylen}
個數據點組成的一組數據,
x
1
,
…
,
x
n
{\displaystylex_{1},\ldots,x_{n}}
.
x
~
{\displaystyle{\tilde{x}}}
,需預測分布的新數據點。
貝氏推論[編輯]
事前分布是在觀測資料前的參數分布
p
(
θ
∣
α
)
{\displaystylep(\theta\mid\alpha)}
。
事前分布可能不容易確認,此時可以用傑佛里斯事前分配(英語:Jeffreysprior)在更新較新的觀測值時,先獲得後驗分布。
取樣分布(英語:samplingdistribution)是以觀測資料的條件,其參數的分布
p
(
X
∣
θ
)
{\displaystylep(\mathbf{X}\mid\theta)}
。
這也稱為概似函數,尤其是視為是參數的函數時,有時會寫成
L
(
θ
∣
X
)
=
p
(
X
∣
θ
)
{\displaystyle\operatorname{L}(\theta\mid\mathbf{X})=p(\mathbf{X}\mid\theta)}
。
邊際概似率(英語:marginallikelihood)(有時也稱為證據)是觀測資料在參數上的邊際分布
p
(
X
∣
α
)
=
∫
θ
p
(
X
∣
θ
)
p
(
θ
∣
α
)
d
θ
{\displaystylep(\mathbf{X}\mid\alpha)=\int_{\theta}p(\mathbf{X}\mid\theta)p(\theta\mid\alpha)\operatorname{d}\!\theta}
。
事後分布是考慮觀測資料後的參數分布。
可以由貝斯法則(英語:Bayes'rule)確認,也是貝氏推論的核心:
p
(
θ
∣
X
,
α
)
=
p
(
X
∣
θ
)
p
(
θ
∣
α
)
p
(
X
∣
α
)
∝
p
(
X
∣
θ
)
p
(
θ
∣
α
)
{\displaystylep(\theta\mid\mathbf{X},\alpha)={\frac{p(\mathbf{X}\mid\theta)p(\theta\mid\alpha)}{p(\mathbf{X}\mid\alpha)}}\proptop(\mathbf{X}\mid\theta)p(\theta\mid\alpha)}
若用文字表示,即為「後驗和先驗及概似率的乘積成正比」,有時也會寫成「後驗=先驗×概似率,在有證據的情形下」。
應用[編輯]
電腦應用[編輯]
貝氏推論有在人工智慧及專家系統上應用。
自1950年代後期開始,貝氏推論技巧就是電腦模式識別技術中的基礎。
現在也越來越多將貝氏推論和以模擬為基礎的蒙地卡羅方法合併使用的應用,因為一些模雜的模型無法用貝氏分析得到解析解,因圖模式結構可以配合一些快速的模擬方式(例如吉布斯抽樣或是其他Metropolis–Hastings演算法)[2]。
因為上述理由,貝氏推論在系統發生學研究社群中來越受到重視,許多的應用可以用同時估測許多人口和進化參數。
歷史[編輯]
「貝氏」是指托馬斯·貝氏(1702–1761),他證明了一個特例(現在知道是貝氏定理的特例),不過皮埃爾-西蒙·拉普拉斯(1749–1827)推導了此定理的一般版本,應用在天體力學、醫療統計學、可靠度(英語:Reliability(statistics))及法學上[3]。
早期的貝氏推論是用拉普拉斯不充分理由原則(英語:principleofinsufficientreason)所得的均勻先驗,稱為逆向機率(英語:inverseprobability)(因為是由觀測值倒推參數的歸納推理,或是從結果倒推到原因[4])。
在1920年代以後,逆向機率很大程度的被另一群稱為頻率論統計(英語:frequentiststatistics)的方式取代[4]。
二十世紀時,拉普拉斯的概念往下分支為二派,開始出現主觀貝氏方法及客觀貝氏方法。
客觀貝氏方法(或是不提供訊息的貝氏方法)中,統計分析只依照假設的模型、分析的資料[5]以及給定事前分布的方式(不同的客觀貝氏方法會有不同給定事前分布的方式)。
主觀貝氏方法(或是提供訊息的貝氏方法)中,先驗的規格依信念(也是分析希望要呈現的主張)而定,信念可以由專家整理資訊後總結產生,也可以根據以往的研究等。
1980年代發現了馬爾科夫蒙地卡羅方法,讓貝氏方法的研究及應用有大幅的發展,除去了許多運算上的問題,也有越來越多人願意參與非標準的複雜問題[6]。
不過雖然貝氏方法的研究仍在成長,大部份大學本科的教學仍是以頻率論統計(英語:frequentiststatistics)為基礎
[7]。
不過貝氏方法也廣為許多領域接受及應用,例如在機器學習的領域中[8]。
參考資料[編輯]
^DouglasHubbard"HowtoMeasureAnything:FindingtheValueofIntangiblesinBusiness"pg.46,JohnWiley&Sons,2007
^JimAlbert.BayesianComputationwithR,Secondedition.NewYork,Dordrecht,etc.:Springer.2009.ISBN 978-0-387-92297-3.
^Stigler,StephenM.Chapter3.TheHistoryofStatistics.HarvardUniversityPress.1986.
^4.04.1Fienberg,StephenE.WhendidBayesianInferenceBecome‘Bayesian’?(PDF).BayesianAnalysis.2006,1(1):1–40[p.5][2017-02-02].doi:10.1214/06-ba101.(原始內容(PDF)存檔於2014-09-10).
^Bernardo,José-Miguel.Referenceanalysis.Handbookofstatistics25.2005:17–90.
^Wolpert,R. L.AConversationwithJamesO.Berger.StatisticalScience.2004,19(1):205–218.MR 2082155.doi:10.1214/088342304000000053.
^Bernardo,JoséM.ABayesianmathematicalstatisticsprimer(PDF).ICOTS-7.2006[2017-02-02].(原始內容(PDF)存檔於2011-11-10).
^Bishop,C.M.PatternRecognitionandMachineLearning.NewYork:Springer.2007.ISBN 0387310738.
相關條目[編輯]
統計學主題
貝氏統計
貝氏定理
貝斯分析(英語:BayesianAnalysis(journal)),ISBA期刊
貝氏分級模型(英語:Bayesianhierarchicalmodeling)
貝氏機率
歸納機率(英語:Inductiveprobability)
國際貝斯分析協會(英語:InternationalSocietyforBayesianAnalysis)(ISBA)
傑佛里斯事前分配(英語:Jeffreysprior)
貝斯結構性時間序列(英語:Bayesianstructuraltimeseries)(BSTS)
蒙提霍爾問題
閱論編統計學敘述統計學連續變數機率分布集中趨勢平均數(平方 ·算術 ·幾何 ·調和 ·算術-幾何 ·幾何-調和 ·希羅/平均數不等式)·中位數·眾數離散程度全距·變異係數·百分位數·四分位距·四分位數·標準差·變異數·平均差·標準分數·柴比雪夫不等式·吉尼係數分布形態(英語:Shapeofthedistribution)中央極限定理·動差(偏態·峰態)離散變數機率分佈次數(英語:Countdata)·列聯表(英語:Contingencytable)推論統計學和假說檢定推論統計學信賴區間·區間估計(英語:Intervalestimation)·顯著性差異·元分析·貝氏推論實驗設計母體·抽樣·重抽樣(刀切法·自助法·交叉驗證)·重複(英語:Replication(statistics))·阻礙·靈敏度和特異度·區集(英語:Blocking(statistics))樣本量(英語:Samplesize)標準誤·虛無假說·對立假說·型一錯誤與型二錯誤·檢定力·效應值常規估計貝氏推論·區間估計(英語:Intervalestimation)·最大概似估計·最小距離估計(英語:Minimumdistanceestimation)·動差估計·最大間距假說檢定Z檢定·司徒頓t檢定·F檢定·卡方檢定·Wald檢定(英語:Waldtest)·曼-惠特尼檢定(英語:Mann–WhitneyUtest)·秩和檢定生存分析生存函數·乘積極限估計量·對數秩和檢定·失效率·危險比例模式相關及迴歸分析相關性混淆變項(英語:Confounding)·皮爾森積動差相關係數·等級相關(英語:Rankcorrelation)(斯皮爾曼等級相關係數·肯德等級相關係數(英語:Kendalltaurankcorrelationcoefficient))·自由度線性迴歸線性模型(英語:Linearmodel)·一般線性模型·廣義線性模型·變異數分析·共變異數分析(英語:Analysisofcovariance)非線性迴歸非參數迴歸模型(英語:Nonparametricregression)·半參數迴歸模型(英語:Semiparametricregression)·Logit模型統計圖形圓餅圖·長條圖·雙標圖·箱形圖·管制圖·森林圖(英語:Forestplot)·直方圖·分位圖·趨勢圖·散布圖·莖葉圖(英語:Stem-and-leafdisplay)·雷達圖(英語:Radarchart)·示意地圖其他回應過程效度·統計誤用
分類
主題
共享資源
專題
規範控制
GND:4144220-9
LCCN:sh85012506
取自「https://zh.wikipedia.org/w/index.php?title=贝叶斯推断&oldid=71575986」
分類:貝葉斯統計隱藏分類:自2017年2月需要專業人士關注的頁面含有英語的條目有藍鏈卻未移除內部連結助手模板的頁面包含GND標識符的維基百科條目包含LCCN標識符的維基百科條目
導覽選單
個人工具
沒有登入討論貢獻建立帳號登入
命名空間
條目討論
臺灣正體
不转换简体繁體大陆简体香港繁體澳門繁體大马简体新加坡简体臺灣正體
查看
閱讀編輯檢視歷史
更多
搜尋
導航
首頁分類索引特色內容新聞動態近期變更隨機條目資助維基百科
說明
說明維基社群方針與指引互助客棧知識問答字詞轉換IRC即時聊天聯絡我們關於維基百科
工具
連結至此的頁面相關變更上傳檔案特殊頁面靜態連結頁面資訊引用此頁面維基數據項目
列印/匯出
下載為PDF可列印版
其他專案
維基共享資源
其他語言
AfrikaansالعربيةAsturianuCatalàCymraegDanskΕλληνικάEnglishEspañolفارسیSuomiFrançaisGalegoעבריתBahasaIndonesiaItaliano日本語한국어NorskbokmålPolskiPortuguêsRomânăРусскийРусиньскыйСрпски/srpskiSundaSvenskaУкраїнськаTiếngViệt粵語
編輯連結
延伸文章資訊
- 1貝氏定理在生活中很有用,可是它到底怎麼算? - 林澤民的部落格
作者:林澤民、巫俊穎(Photo Credit: Wikipedia) 對於許多上過統計課的學生而言,貝氏定理(Bayes Theorem)是又熟悉又陌生的。
- 2貝氏推論- 維基百科,自由的百科全書
貝氏推論(英語:Bayesian inference)是推論統計的一種方法。這種方法使用貝氏定理,在有更多證據及訊息時,更新特定假設的機率。貝氏推論是統計學(特別是數理統計 ...
- 3貝葉斯推斷和各類機率Bayesian Inference - 資料科學・機器・人
他寫過兩本書,一本和神學有關,另一本和統計學有關,其中包含了當今有名的貝氏定理(Bayes Theorem)的雛形。這個定理之後被廣泛應用於推斷問題,即用來做出有根據的推測 ...
- 4貝氏(Bayesian) 統計資料 - IBM
IBM® SPSS Statistics 提供了下列貝氏(Bayesian) 統計資料的支援。 單樣本和成對樣本T 檢定: 「貝氏單一樣本推斷」程序提供選項,可透過描述事後分配對單一樣本及兩個 ...
- 5Bayesian 統計 - IBM
關於「線性迴歸」的Bayesian 推論是在定量建模中廣泛使用的統計方法。「線性迴歸」是一種基本的標準方法,在這種方法中研究人員使用數個變數的值來說明或預測尺度成果 ...