三大分布密度函数推导
一、χ2分布密度的推导
令Y1,⋯,Yn独立同分布,且每个Yi服从标准正态分布N(0,1),由定义,
X=Y21+⋯+Y2n∼χ2n
令h(x)为任一非负函数,使得h(X)为一随机变量,则
E[h(X)]=∫∞−∞⋯∫∞−∞h(y21+⋯+y2n)(1√2π)ne−12(y21+⋯+y2n)dy1⋯dyn
作多维球坐标变换:
⎧⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪⎨⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪⎩y1=rcosθ1y2=rsinθ1cosθ2y3=rsinθ1sinθ2cosθ3⋮yn−1=rsinθ1⋯sinθn−2cosθn−1yn=rsinθ1⋯sinθn−2sinθn−1
其中0≤r<∞,0≤θi≤π(i=1,⋯,n−2),0≤θn−1≤2π。
变换的雅可比行列式为
J=rn−1sinn−2θ1sinn−3θ2⋯sin2θn−3sinθn−2
由定义有
J=∣∣
∣
∣
∣∣∂y1∂r∂y1∂θ1⋯∂y1∂θn−1⋮⋮⋮∂yn∂r∂yn∂θ1⋯∂yn∂θn−1∣∣
∣
∣
∣∣+=rn−1c
因为其中从第二列开始直至最后一列,每列均可提出一个因子r,将r提出后剩余部分仅与θ1,⋯θn−1有关,记成c,由此
E[h(X)]=∫∞0dr∫π0⋯∫π0dθ1⋯dθn−2∫2π0h(r2)(1√2π)ne−12r2rn−1cdθn−1=c′∫∞0h(r2)rn−1e−12r2dr(1)(2)
其中c′为常数。
进一步简化得到
E[h(X)]=c′′∫∞0h(u)un2−1e−12udu
其中c′′为常数。
为了求c′′,应有
1=c′′∫∞0un2−1e−12udu=c′′2n2∫∞0yn2−1e−ydy=c′′2n2Γ(n2)
即
c′′=(2n2Γ(n2))−1
这就证明了χ2分布的密度函数为
f(x)=12n2Γ(n2)xn2−1e−12x
推导这个式子还可以直接用归纳法,主要利用以下事实:
- 由例1.18知χ2的分布密度为1√2πx−1/2e−x/2;
- 若随机变量X和Y独立,各有分布密度f1(x)和f2(y),则Z=X+Y有分布密度f(z)=∫∞−∞f1(z−x)f2(x)dx;
- 利用上面两个事实对n作归纳法便可导出该式,其中用到贝塔函数的简单性质。
有兴趣的读者可以去试试看,此外,在文献[22]第九章还给出了χ2分布的其它推导法。
二、t分布密度的推导
设X∼N(0,1)与Y∼χ2n独立,则随机变量
T=√nX√Y
的分布是具有n个自由度的t分布。由假设条件可知X和Y的联合分布密度是
Cne−x2/2e−y/2yn/2−1
其中
Cn=1√2π2n/2Γ(n/2)
令h(t)为任一非负函数使得h(T)为一随机变量,于是
E[h(T)]=Cn∫∞−∞dx∫∞0h(√nx√y)e−x2/2e−y/2yn/2−1dy
作变换
{t=√nx√yy=y
或
{x=√yt√ny=y
则变换的雅可比行列式是
J=∣∣
∣∣∂x∂t∂x∂y∂y∂t∂y∂y∣∣
∣∣+=∣∣∣√y/√n12ty−1/2/√n01∣∣∣+=√y/n
代入得
E[h(T)]=Cn∫∞−∞h(t)dt
∫∞0e−yt2/2ne−y/2yn/2−1√y/ndy
上式右端第二重积分是
1√n∫∞0y(n−1)/2e−y2(1+t2n)dy
令
z=(1+t2n)y
则
∫∞0(1+t2n)−(n−1)/2z(n−1)/2e−z/2(1+t2n)−1dz=(1+t2n)−(n−1)/2−1∫∞0z(n−1)/2e−z/2dz=(1+t2n)−(n+1)/2∫∞0z(n+1)/2−1e−z/2dz=(1+t2n)−(n+1)/2Γ(n+12)2(n+1)/2
上面最后一步利用了积分号内的函数是χ2n+1的分布密度(差一个常数),将结果代入到(3.55)中去,得
E[h(T)]=Cn(1√n)Γ(n+12)2(n+1)/2∫∞−∞h(t)(1+t2n)−(n+1)/2dt=Γ(n+12)√nπΓ(n2)∫∞−∞h(t)(1+t2n)−(n+1)/2dt
这就证明了t分布的密度函数为
f(t)=Γ(n+12)√nπΓ(n2)(1+t2n)−(n+1)/2
三、F分布密度的推导
设X∼χ2m与Y∼χ2n独立,则F=(n/m)(X/Y)的分布是自由度为m和n的F分布,由假设条件知X和Y的联合密度为
Cm,nxm2−1yn2−1e−12(x+y)
其中
C−1m,n=2(n+m)/2Γ(m/2)Γ(n/2)
令h(f)为任一非负函数使得h(F)为随机变量,于是
E[h(F)]=∫∞0∫∞0h(nmxy)Cm,nxm2−1yn2−1e−12(x+y)dxdy
作变换
{f=nmxyy=y
或
{x=mnfyy=y
则变换的雅可比行列式为
(mny)
于是
E[h(F)]=Cm,n∫∞0h(f)df∫∞0(mnfy)m2−1yn2−1×e−y2(1+mnf)(mny)dy=Cm,n(mn)m2∫∞0h(f)fm2−1∫∞0ym+n2−1×e−y2(1+mnf)dy
令
z=(1+mnf)y
上式右边第二重积分为
∫∞0(1+mnf)−m+n2zm+n2−1e−z/2dz=(1+mnf)−m+n2Γ(m+n2)2m+n2
因此
E[h(F)]=1B(m2,n2)(mn)m2∫∞0h(f)fm2−1(1+mnf)−m+n2df
这就证明了F分布的密度函数为
f(f)=Γ(m+n2)Γ(m2)Γ(n2)(mn)m2fm2−1(1+mnf)m+n2
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· winform 绘制太阳,地球,月球 运作规律
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人