漫步数理统计二十四——伽玛、卡方与贝塔分布

漫步数理统计二十四——伽玛、卡方与贝塔分布本篇博文我们讲介绍伽玛 Gamma 卡方 2 chi 2 与贝塔 beta 分布 在高等微积分中已经证明过 对于 0 alpha0 积分 0y 1e ydy int 0 inftyy alpha 1 e y dy 存在且积分值为正数 这个积分称为 alpha 的伽玛函数 写成 0y 1e ydy Gamma alpha int 0 i

本篇博文我们讲介绍伽玛( Γ ),卡方( χ2 )与贝塔( β )分布。在高等微积分中已经证明过,对于 α>0 ,积分

0yα1eydy

存在且积分值为正数,这个积分称为 α 的伽玛函数,写成

Γ(α)=0yα1eydy

如果 α=1 ,显然

Γ(1)=0eydy=1

如果 α>1 ,用分部积分法可得

Γ(α)=(α1)0yα2eydy=(α1)Γ(α1)

因此如果 α 是比1大的正整数,那么

Γ(α)=(α1)(α2)(3)(2)(1)Γ(1)=(α1)!

因为 Γ(1)=1 ,这表明我们可以取 0!=1

我们用积分形式定义了 Γ(α) ,现在我们引入新变量 y=x/β ,其中 β>0 ,那么

Γ(α)=0(xβ)α1ex/β(1β)dx

1=01Γ(α)βαxα1ex/βdx

因为 α>0,β>0,Γ(α)>0 ,所以

f(x)={
1Γ(α)βαxα1ex/β00<x<elsewhere

满足参数为

α,β
的伽玛分布,写作 X 满足

Γ(α,β)
分布。

1 伽玛分布是等待时间的概率模型;例如在寿命测试中,直到死亡的等待时间是用伽玛分布建模的随机变量。为了理解这个,假设泊松假定以及区间长度 w 是时间区间,特别地令随机变量

W
是得到 k 变化量所需要的时间,其中

k
是固定的正整数,那么 W 的cdf为



G(w)=P(Ww)=1P(W>w)

然而对于 w>0 ,事件 W>w 等价于时间区间 w 内少于

k
变化量的概率,即如果随机变量 X 是区间

w
内的变化量,那么

P(W>w)=x=0k1P(X=x)=x=0k1(λw)xeλwx!

λwzk1ez(k1)!dx=x=0k1(λw)xeλwx!

如果我们接受这个结论,那么对 w>0 我们有

G(w)=1λwzk1ezΓ(k)dz=λw0zk1ezΓ(k)dz

且对于 w0,G(w)=0 。如果我们改变积分变量,将 z=λy 代入的

G(w)=w0λkyk1eλyΓ(k)dy,w>0

且对于 w0,G(w)=0 。所以 W 的pdf为



g(w)=G(w)={λkyk1eλyΓ(k)00<w<elsewhere

满足

α=k,β=1/λ
的伽玛分布,如果 W 是第一次变化的等待时间,即

k=1
,那么 W 的pdf为



g(w)={λeλw00<w<elsewhere

满足参数为

λ
的指数分布。

M(t)=0etx1Γ(α)βαxα1ex/βdx=01Γ(α)βαxα1ex(1βt)/βdx

我们可以令 y=x(1βt)/β,t<1/β 或者 x=βy/(1βt) 得到

M(t)=0β/(1βt)Γ(α)βα(βy1βt)α1eydy

M(t)=(11βt)α01Γ(α)yα1eydy=1(1βt)α,t<1β

M(t)=(α)(1βt)α1(β)

M(t)=(α)(α1)(1βt)α2(β)2

μ=M(0)=αβ

σ2=M(0)μ2=α(α+1)β2α2β2=αβ2

1 令等待时间 W 满足

α=k,β=1/λ
的伽玛pdf,那么 E(W)=k/λ 。如果 k=1 ,那么 E(W)=1/λ ;即对于 k=1 变化的期望等待时间等于 λ 的倒数。

2 X 表示随机变量,使得



E(Xm)=(m+3)!3!3m,m=1,2,3,

那么 X 的mgf为级数



M(t)=1+4!33!1!t+5!323!2!t2+6!333!3!t3+

然而这是 (13t)4 的麦克劳林级数,假设 1<3t<1 。因此 X 满足

α=4,β=3
的伽玛分布。

2 伽玛分布不仅是等待时间的模型,也是许多非负连续型随机变量的模型。例如某些收入的分布可以用伽玛分布来建模,这是因为 α,β 提供了很大的灵活性,图 1 给出了几个伽玛概率密度函数。



这里写图片描述
图1




现在我们考虑伽玛分布的一个特例,即

α=r/2
,其中 r 是一个正数且

β=2
。对于一个连续型的随机变量,其pdf为

f(x)={
1Γ(r/2)2r/2xr/21ex/200<x<elsewhere

那么称该变量满足卡方分布,任意这种形式的 f(x) 称为卡方pdf,卡方分布的均值与方差分别为 μ=αβ=(r/2)2=r,σ2=αβ2=(r/2)22=2r ,我们称参数 r 为卡方分布的自由度。因为卡方分布在统计中扮演着重要角色且经常出现,所以为了简洁

X
χ2 意味着随机变量 X 满足自由度为

r
的卡方分布。

3 如果 X 满足pdf



f(x)={14xex/200<x<elsewhere



χ2(4)
,这里 μ=4,σ2=8,M(t)=(12t)2,t<12

4 如果 X 有mgf

M(t)=(12t)8,t<12
,那么 X

χ2(16)

如果随机变量 X

χ2(r)
,那么 c1<c2

P(c1<X<c2)=P(Xc2)P(Xc1)

。为了计算概率,我们需要像

P(Xx)=x01Γ(r/2)2r/2wr/21ew/2dw

这样的值,这些值有表可供查询。

下面的结论之后还会用几次;因此我们用定理的形式给出。

1 X 满足

χ2(r)
分布,如果 k>r/2 ,那么 E(Xk) 存在且等于

E(Xk)=2kΓ(r2+k)Γ(r2),if k>r/2

注意

E(Xk)=01Γ(r2)2r/2x(r/2)+k1ex/2dx

变量替换 u=x/2 可得

E(Xk)=01Γ(r2)2r/212(r/2)+k1u(r/2)+k1eudu

这就是要求的揭露。 ||

注意如果 k 是一个非负整数,那么

k>(r/2)
总是为真,因此 χ2 分布的所有矩存在且 k 阶矩如定理所示。



5
X

χ2(10)
,那么通过查表可得,

P(3.25X20.5)=P(X20.5)P(X3.5)=0.9750.025=0.95

如果 P(a<X)=0.05 ,通过查表可得

a=18.3

6 X 满足

α=r/2
的伽玛分布,其中 r 是正整数且

β>0
。定义随机变量 Y=2X/β ,我们要求 Y 的pdf。现在

Y
的cdf为

G(y)=P(Yy)=P(Xβy2)

如果 y0 ,那么 G(y)=0 ;但是如果 y>0 ,那么

G(y)=βy/201Γ(r/2)βr/2xr/21ex/βdx

因此 Y 的pdf为



g(y)=G(y)=β/2Γ(r/2)βr/2(βy/2)r/21ey/2=1Γ(r/2)2r/2yr/21ey/2

Y

χ2(r)

伽玛分布最重要的一条性质是其加性。

2 X1,,Xn 是独立随机变量,假设对于 i=1,,n Xi 满足 Γ(αi,β) 分布,令 Y=Σni=1Xi ,那么 Y 满足

Γ(Σni=1αiβ)
分布。

利用独立性与伽玛分布的mgf,对于 t<1/β 我们有

MY(t)=E[exp{
ti=1nXi}]=i=1nE[exp{
tXi}]
=i=1n(1βt)αi=(1βt)Σni=1αi

这就是 Γ(Σni=1αi,β) 分布的mgf。 ||

之后我们会用到 χ2 分布的一个性质,为了方便我们将结论以推论的形式给出,因为 β=2,Σαi=Σri/2

1 X1,,Xn 是独立随机变量,对于 i=1,,n ,假设 Xi 满足 χ2(ri) 分布,令 Y=Σni=1Xi ,那么 Y 满足

χ2(Σni=1ri)
分布。

最后在介绍一个重要的分布,即贝塔分布,它是由一对独立的 Γ 随机变量推导来的。令 X1,X2 是满足 Γ 分布的两个独立随机变量,其联合pdf为

h(x1,x2)=1Γ(α)Γ(β)xα11xβ12ex1x2,0<x1<,0<x2<

。令 Y1=X1+X2 Y2=X1/(X1+X2) ,我们将说明 Y1,Y2 是独立的。

空间 x1x2 平面的第一象限,排除坐标轴上的点。那么

y1=u1(x1,x2)=x1+x2y2=u2(x1,x2)=x1x1+x2

可以写成 x1=y1y2,x2=y1(1y2) ,所以

J=y21y2y1y1=y10

这个变换时一对一的且将 映射到 y1y2 平面上的 ={
(y1,y2):0<y1<,0<y2<1}
的联合pdf为



g(y1,y2)=(y1)1Γ(α)Γ(β)(y1y2)α1[y1(1y2)]β1ey1={
yα12(1y2)β1Γ(α)Γ(β)yα+β11ey100<y1<,0<y2<1elsewhere

的边缘pdf为

g2(y2)=yα12(1y2)β1Γ(α)Γ(β)0yα+β11ey1={
Γ(α+β)Γ(α)Γ(β)yα12(1y2)β100<y2<1elsewhere
0<y1<dy1

的贝塔分布。因为 g(y1,y2)g1(y1)g2(y2) ,所以 Y1 的pdf一定为

g1(y1)={
1Γ(α+β)yα+β11ey100<y1<elsewhere

的伽玛分布。

很容易得出参数为 α,β 的贝塔分布其均值与方差分别为

μ=αα+β,σ2=αβ(α+β+1)(α+β)2

最后这个例子中随机变量的分布是由伽玛随机变量变换推导出来的。

7 (狄利克雷函分布)令 X1,X2,,Xk+1 是独立随机变量,每个都满足 β=1 的伽玛分布,这些变量的联合pdf可能写成

h(x1,x2,,xk+1)={
k+1i=11Γ(αi)xαi1iexi00<xi<elsewhere

Yk+1=X1+X2++Xk+1 表示 k+1 个新变量,相关变换将 ={
(x1,,xk+1):0<xi<,i=1,,k
+1}

={
(y1,,yk,yk+1):0<yi,i=1,,k,y1
++yk<1,0<yk+1<}

,使得雅克比为

J=yk+100yk+10yk+10yk+100yk+1yk+1y1y2yk(1y1yk)=ykk+1

因此 Y1,,Yk,Yk+1 的联合pdf为

yα1++αk+11k+1yα111yαk1k(1y1yk)αk+11eyk+1Γ(α1)Γ(αk)Γ(αk+1)

其余地方为零,这里 (y1,,yk,yk+1) Y1,,Yk 的联合pdf为

g(y1,,yk)=Γ(α1++αk+1)Γ(α1)Γ(αk+1)yα111yαk1k(1y1yk)αk+11

0<yi,i=1,,k,y1++yk<1 在其他地方等于零。有这种联合pdf形式的随机变量



Y1,,Yk

有狄利克雷pdf,而且从

Y1,,Yk,Yk+1
的联合pdf 可以看出

Yk+1
满足参数为

α1++αk+αk+1,β=1
的伽玛分布,

Yk+1


Y1,Y2,,Yk
无关。












版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/228080.html原文链接:https://javaforall.net

(0)
上一篇 2026年3月16日 下午7:52
下一篇 2026年3月16日 下午7:52


相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号