本篇博文我们讲介绍伽玛( Γ ),卡方( χ2 )与贝塔( β )分布。在高等微积分中已经证明过,对于 α>0 ,积分
存在且积分值为正数,这个积分称为 α 的伽玛函数,写成
如果 α=1 ,显然
如果 α>1 ,用分部积分法可得
因此如果 α 是比1大的正整数,那么
因为 Γ(1)=1 ,这表明我们可以取 0!=1 。
我们用积分形式定义了 Γ(α) ,现在我们引入新变量 y=x/β ,其中 β>0 ,那么
因为 α>0,β>0,Γ(α)>0 ,所以
1Γ(α)βαxα−1e−x/β00<x<∞elsewhere
满足参数为
α,β
Γ(α,β)
注1: 伽玛分布是等待时间的概率模型;例如在寿命测试中,直到死亡的等待时间是用伽玛分布建模的随机变量。为了理解这个,假设泊松假定以及区间长度 w 是时间区间,特别地令随机变量
W
k
G(w)=P(W≤w)=1−P(W>w)
然而对于 w>0 ,事件 W>w 等价于时间区间 w 内少于
k
w
如果我们接受这个结论,那么对 w>0 我们有
且对于 w≤0,G(w)=0 。如果我们改变积分变量,将 z=λy 代入的
且对于 w≤0,G(w)=0 。所以 W 的pdf为
g(w)=G′(w)={λkyk−1e−λyΓ(k)00<w<∞elsewhere
满足
α=k,β=1/λ
k=1
g(w)={λe−λw00<w<∞elsewhere
满足参数为
λ
我们可以令 y=x(1−βt)/β,t<1/β 或者 x=βy/(1−βt) 得到
例1: 令等待时间 W 满足
α=k,β=1/λ
例2: 令 X 表示随机变量,使得
E(Xm)=(m+3)!3!3m,m=1,2,3,…
那么 X 的mgf为级数
M(t)=1+4!33!1!t+5!323!2!t2+6!333!3!t3+⋯
然而这是 (1−3t)−4 的麦克劳林级数,假设 −1<3t<1 。因此 X 满足
α=4,β=3
注2: 伽玛分布不仅是等待时间的模型,也是许多非负连续型随机变量的模型。例如某些收入的分布可以用伽玛分布来建模,这是因为 α,β 提供了很大的灵活性,图 1 给出了几个伽玛概率密度函数。
图1
现在我们考虑伽玛分布的一个特例,即
α=r/2
β=2
1Γ(r/2)2r/2xr/2−1e−x/200<x<∞elsewhere
那么称该变量满足卡方分布,任意这种形式的 f(x) 称为卡方pdf,卡方分布的均值与方差分别为 μ=αβ=(r/2)2=r,σ2=αβ2=(r/2)22=2r ,我们称参数 r 为卡方分布的自由度。因为卡方分布在统计中扮演着重要角色且经常出现,所以为了简洁
X
r
例3: 如果 X 满足pdf
f(x)={14xe−x/200<x<∞elsewhere
是
χ2(4)
例4: 如果 X 有mgf
M(t)=(1−2t)−8,t<12
χ2(16)
如果随机变量 X 是
χ2(r)
。为了计算概率,我们需要像
这样的值,这些值有表可供查询。
下面的结论之后还会用几次;因此我们用定理的形式给出。
定理1: 令 X 满足
χ2(r)
证明: 注意
变量替换 u=x/2 可得
这就是要求的揭露。 ||
注意如果 k 是一个非负整数,那么
k>−(r/2)
例5:
χ2(10)
如果 P(a<X)=0.05 ,通过查表可得
a=18.3
。
例6: 令 X 满足
α=r/2
β>0
Y
如果 y≤0 ,那么 G(y)=0 ;但是如果 y>0 ,那么
因此 Y 的pdf为
g(y)=G′(y)=β/2Γ(r/2)βr/2(βy/2)r/2−1e−y/2=1Γ(r/2)2r/2yr/2−1e−y/2
即 Y 是
χ2(r)
伽玛分布最重要的一条性质是其加性。
定理2: 令 X1,…,Xn 是独立随机变量,假设对于 i=1,…,n , Xi 满足 Γ(αi,β) 分布,令 Y=Σni=1Xi ,那么 Y 满足
Γ(Σni=1αiβ)
证明: 利用独立性与伽玛分布的mgf,对于 t<1/β 我们有
t∑i=1nXi}]=∏i=1nE[exp{
tXi}]=∏i=1n(1−βt)−αi=(1−βt)−Σni=1αi
这就是 Γ(Σni=1αi,β) 分布的mgf。 ||
之后我们会用到 χ2 分布的一个性质,为了方便我们将结论以推论的形式给出,因为 β=2,Σαi=Σri/2 。
推论1: 令 X1,…,Xn 是独立随机变量,对于 i=1,…,n ,假设 Xi 满足 χ2(ri) 分布,令 Y=Σni=1Xi ,那么 Y 满足
χ2(Σni=1ri)
最后在介绍一个重要的分布,即贝塔分布,它是由一对独立的 Γ 随机变量推导来的。令 X1,X2 是满足 Γ 分布的两个独立随机变量,其联合pdf为
。令 Y1=X1+X2 且 Y2=X1/(X1+X2) ,我们将说明 Y1,Y2 是独立的。
空间 是 x1x2 平面的第一象限,排除坐标轴上的点。那么
可以写成 x1=y1y2,x2=y1(1−y2) ,所以
这个变换时一对一的且将 映射到 y1y2 平面上的 ={
(y1,y2):0<y1<∞,0<y2<1} 的联合pdf为
yα−12(1−y2)β−1Γ(α)Γ(β)yα+β−11e−y100<y1<∞,0<y2<1elsewhere
的边缘pdf为
Γ(α+β)Γ(α)Γ(β)yα−12(1−y2)β−100<y2<1elsewhere0<y1<∞dy1
的贝塔分布。因为 g(y1,y2)≡g1(y1)g2(y2) ,所以 Y1 的pdf一定为
1Γ(α+β)yα+β−11e−y100<y1<∞elsewhere
的伽玛分布。
很容易得出参数为 α,β 的贝塔分布其均值与方差分别为
最后这个例子中随机变量的分布是由伽玛随机变量变换推导出来的。
例7: (狄利克雷函分布)令 X1,X2,…,Xk+1 是独立随机变量,每个都满足 β=1 的伽玛分布,这些变量的联合pdf可能写成
∏k+1i=11Γ(αi)xαi−1ie−xi00<xi<∞elsewhere
且 Yk+1=X1+X2+⋯+Xk+1 表示 k+1 个新变量,相关变换将 ={
(x1,…,xk+1):0<xi<∞,i=1,…,k+1}
(y1,…,yk,yk+1):0<yi,i=1,…,k,y1+⋯+yk<1,0<yk+1<∞}
,使得雅克比为
因此 Y1,…,Yk,Yk+1 的联合pdf为
其余地方为零,这里 (y1,…,yk,yk+1)∈ 。 Y1,…,Yk 的联合pdf为
0<yi,i=1,…,k,y1+⋯+yk<1 在其他地方等于零。有这种联合pdf形式的随机变量
Y1,…,Yk
有狄利克雷pdf,而且从
Y1,…,Yk,Yk+1
的联合pdf 可以看出
Yk+1
满足参数为
α1+⋯+αk+αk+1,β=1
的伽玛分布,
Yk+1
与
Y1,Y2,…,Yk
无关。
发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/228080.html原文链接:https://javaforall.net
