重尾分布- 维基百科,自由的百科全书
文章推薦指數: 80 %
在機率論中,重尾分布(英語:Heavy-tailed distribution)是一種機率分佈的模型,它的尾部比指數分布還要厚。
在許多狀況中,通常右邊尾部的分布會比較受到重視,但 ...
重尾分布
語言
監視
編輯
在機率論中,重尾分布(英語:Heavy-taileddistribution)是一種機率分佈的模型,它的尾部比指數分布還要厚。
在許多狀況中,通常右邊尾部的分布會比較受到重視,但左邊尾部比較厚,或是兩邊尾部都很厚的狀況,也會被認為是一種重尾分布。
重尾分布之中,又有兩個子類型,分別稱為長尾分布(long-taileddistributions)以及次指數分布(subexponentialdistributions)。
目次
1定義
1.1重尾分布
1.2長尾分布
1.3次指數分布
2註釋
定義編輯
重尾分布編輯
在一個累積分布函數中,一個隨機變量X 的分布狀況,在以下狀況時,被稱為是一個重尾分布。
假設:
lim
x
→
∞
e
λ
x
Pr
[
X
>
x
]
=
∞
forall
λ
>
0.
{\displaystyle\lim_{x\to\infty}e^{\lambdax}\Pr[X>x]=\infty\quad{\mbox{forall}}\lambda>0.\,}
如果以尾部分布函數的方式來呈現時,
F
¯
(
x
)
≡
Pr
(
X
>
x
)
{\displaystyle{\overline{F}}(x)\equiv\Pr(X>x)\,}
最後可以被寫成:
lim
x
→
∞
e
λ
x
F
¯
(
x
)
=
∞
forall
λ
>
0.
{\displaystyle\lim_{x\to\infty}e^{\lambdax}{\overline{F}}(x)=\infty\quad{\mbox{forall}}\lambda>0.\,}
這相當於一個動差生成函數F,MF(t),對所有的t > 0來說,都是無限的[1]。
重尾分布的左尾,與雙尾分布,定義相同。
長尾分布編輯
在一個累積分布函數中,一個隨機變量X 的分布,出現以下狀況時,被稱為是一個長尾分布。
假設對所有t > 0:
lim
x
→
∞
Pr
[
X
>
x
+
t
|
X
>
x
]
=
1
,
{\displaystyle\lim_{x\to\infty}\Pr[X>x+t|X>x]=1,\,}
這相等於
F
¯
(
x
+
t
)
∼
F
¯
(
x
)
as
x
→
∞
.
{\displaystyle{\overline{F}}(x+t)\sim{\overline{F}}(x)\quad{\mbox{as}}x\to\infty.\,}
對一個右尾部形成長尾分布的狀況,我們可以做一個直觀的解釋:假如一個長尾分布的尾部數量超過某個很高的水準,它超過另一個更高水準的機率會接近於一。
也就是說,如果你發現狀況很糟,它可能會比你想像的還要糟。
長尾分布是重尾分布中的一個特例。
所有的長尾分布都是重尾分布,但反之則不然,也就是說,我們可以找出某一個重尾分布,它不是長尾分布。
次指數分布編輯
次指數分布是以機率分佈的摺積定義出來的。
兩個獨立、不同的隨機變數
X
1
,
X
2
{\displaystyleX_{1},X_{2}}
的共同分布函數
F
{\displaystyleF}
,它自己的摺積定義為
F
∗
2
{\displaystyleF^{*2}}
,使用勒貝格-史台傑斯積分(Lebesgue–Stieltjesintegration)
定義為:
Pr
[
X
1
+
X
2
≤
x
]
=
F
∗
2
(
x
)
=
∫
−
∞
∞
F
(
x
−
y
)
d
F
(
y
)
.
{\displaystyle\Pr[X_{1}+X_{2}\leqx]=F^{*2}(x)=\int_{-\infty}^{\infty}F(x-y)\,dF(y).}
n-fold摺積的
F
∗
n
{\displaystyleF^{*n}}
也以同樣方式定義。
其尾端分布函數
F
¯
{\displaystyle{\overline{F}}}
定義為
F
¯
(
x
)
=
1
−
F
(
x
)
{\displaystyle{\overline{F}}(x)=1-F(x)}
。
當以下式子成立,機率分佈函數
F
{\displaystyleF}
在正的中線(positivehalf-line)上,被定義為次指數分布:
F
∗
2
¯
(
x
)
∼
2
F
¯
(
x
)
as
x
→
∞
.
{\displaystyle{\overline{F^{*2}}}(x)\sim2{\overline{F}}(x)\quad{\mbox{as}}x\to\infty.}
這也意味著,對所有
n
≥
1
{\displaystylen\geq1}
來說:
F
∗
n
¯
(
x
)
∼
n
F
¯
(
x
)
as
x
→
∞
.
{\displaystyle{\overline{F^{*n}}}(x)\simn{\overline{F}}(x)\quad{\mbox{as}}x\to\infty.}
註釋編輯
^Rolski,Schmidli,Scmidt,Teugels,StochasticProcessesforInsuranceandFinance,1999
取自「https://zh.wikipedia.org/w/index.php?title=重尾分布&oldid=34424055」
延伸文章資訊
- 1長尾分佈,肥尾分佈和隨機遊走(Heavy-tailed, Long ... - 台部落
長尾分佈(Long-tailed distribution) ... 長尾分佈,或者說長尾理論是一個與互聯網發展分不開的概念。說到這裏就不得不先提一下傳統商業中的帕累托法則( ...
- 2長尾分布:前言,概念,一般描述 - 中文百科全書
長尾理論是網路時代興起的一種新理論,由於成本和效率的因素,當商品儲存、流通、展示的場地和渠道足夠寬廣,商品生產成本急劇下降以至於個人都可以進行生產,並且商品的...
- 3重尾分布- 维基百科,自由的百科全书
在機率論中,重尾分布(英語:Heavy-tailed distribution)是一種機率分佈的模型,它的尾部比指數分布還要厚。在許多狀況中,通常右邊尾部的分布會比較受到重視,但 ...
- 4【AI 訓練路上的絆腳石】數據長尾問題如何解,原來要讓 ... - 報橘
【為什麼我們挑選這篇文章】在機器學習的模型建立時,對於資料來源科學家們會有一個基本假設,就是資料的種類與數量是「平均分布」的。
- 5重尾分布:簡介,定義,解釋,分類,1.長尾分布,次指數分布
重尾分布(Heavy-tailed distribution)是一種機率分布模型,它的尾部比指數分布還要厚。在許多情況下,右邊尾部的部分比較受到重視,但左邊尾部比較厚,或是兩邊尾部 ...