gamma函数及相关其分布

gamma函数的定义及重要性质

\[\Gamma(x)=\int_0^{\infty}t^{x-1}e^{-t}dt\]

\[\Gamma(x+1) = x \Gamma(x)\]
\[\Gamma(n) = (n-1)! \]
\[\Gamma(0) = 1\]
\[\Gamma({1\over 2}) = 2\int_0^{+\infty}e^{-u^2}du = \sqrt\pi\]

gamma函数的图像

在matlib中，我们可以方便的用下面的代码画出gamma函数的图像。

x = -10:0.001:10;
plot(x,gamma(x));
axis([-10.1,10.1,-4,4]);

随机变量\(Y=X^2\)的概率密度

假设随机变量\(X\)具有概率密度\(f_X(x),-\infty<x<\infty\),求\(Y=X^2\)的概率密度。

\begin{align*}F_Y(y) &=P(Y\leq y)=P(X^2 \leq y) \\
&=P(-\sqrt{y} \leq x \leq \sqrt{y}) \\ &=F_X(\sqrt{y})-F_X{(-\sqrt{y})} \end{align*}

\[f_Y(y)=\left\{
\begin{aligned}
\frac{1}{2\sqrt{y}}[f_X(\sqrt{y})+f_X(\sqrt{-y}], y >0, \\
0, y \leq 0 \\
\end{aligned}
\right.\]

设\(X \sim N(0,1)\)，其概率密度为\(\varphi(x)=\frac{1}{\sqrt{2\pi}}e^{\frac{-x^2}{2}}, -\infty<x<\infty\),则\(Y=X^2\)的概率密度如下：

\[f_Y(y)=\left\{
\begin{aligned}
\frac{1}{\sqrt{2\pi}}y^{-1/2}e^{-y/2}, y>0, \\
0, y \leq 0 \\
\end{aligned}
\right.\]

Gamma分布

\(X \sim \Gamma(\alpha, \theta)\)

\[f_X(x)=\left\{
\begin{aligned}
\frac{1}{\theta^\alpha\Gamma(\alpha)}x^{\alpha-1}e^{-x/\theta}, x> 0, \alpha>0,\theta>0 \\
0, x \leq 0, \alpha>0,\theta>0 \\
\end{aligned}
\right.\]

当\(\alpha= 1 , \theta = \lambda 时，\Gamma(1,\lambda)\) 就是参数为\(\lambda\)的指数分布,记为\(exp (\lambda)\) ；

当\(\alpha= n/2 , \theta = 2 时，\Gamma(n/2,1/2)\)就是数理统计中常用的\(\chi^2(n)\) 分布。

数学期望(均值)、方差分别为

\[E(X) = \alpha\theta\]

\[D(x) = \alpha\theta^2\]

Gamma分布是指在地震序列的有序性、地震发生率的齐次性、计数特征具有独立增量和平稳增量情况下，可以导出地震发生\(i\)次时间的概率密度为Gamma密度函数。

gamma分布的一个重要应用就是作为共轭分布出现在很多机器学习算法中。

gamma的密度函数和分布函数图像如下：

注意：这儿\(\alpha=1.5,\theta = 1/0.6 或者 \beta=0.6\),因为gamma函数有两种表达方式，一种用\(\theta\),一种用\(\beta\),它们的关系是\(\theta=\frac{1}{\beta}\)

x=0:0.1:5;
figure;
plot(x,[gampdf(x,1.5,0.6);gamcdf(x,1.5,0.6)])

Gamma分布的可加性

设\(X \sim \Gamma(\alpha, \theta),Y \sim \Gamma(\beta,\theta)\),\(X,Y\)的概率密度如下：

\[f_X(x)=\left\{
\begin{aligned}
\frac{1}{\theta^\alpha\Gamma(\alpha)}x^{\alpha-1}e^{-x/\theta}, x> 0, \alpha>0,\theta>0 \\
0, x \leq 0, \alpha>0,\theta>0 \\
\end{aligned}
\right.\]

\[f_Y(y)=\left\{
\begin{aligned}
\frac{1}{\theta^\beta\Gamma(\beta)}y^{\beta-1}e^{-y/\theta}, y > 0, \beta>0,\theta>0 \\
0, y \leq 0, \beta>0,\theta>0\\
\end{aligned}
\right.\]

则有\(Z=X+Y\)的分布为：\(X+Y \sim \Gamma(\alpha + \beta,\theta)\)

\(\chi ^2\)（卡方)分布及其性质

设\(X_1,X_2,…,X_n\)是来自总体\(N(0,1)\)的样本，则称统计量

\[\chi^2=X_1^2+X_2^2+…+X_n^2\]

为服从自由度为\(n\)的\(\chi^2\)分布，记为\(\chi^2 \sim \chi^2(n)\)

它的概率密度函数为：

\[f(x,n)=\left\{
\begin{aligned}
\frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2}, x> 0 \\
0, x \leq 0, \\
\end{aligned}
\right.\]

用下面的matlib代码，我们能够画出卡方分布概率密度函数图:

%卡方分布
x=0.0:0.01:30;
y=chi2pdf(x,1);
y1=chi2pdf(x,2);
y2=chi2pdf(x,4);
y3=chi2pdf(x,6);
y4=chi2pdf(x,11);
plot(x,y,'-r',x,y1,'-g',x,y2,'-b',x,y3,'-c',x,y4,'-m');
legend('自由度1','自由度2','自由度4','自由度6','自由度11');
axis([0,30,0,0.2]);

View Code

由上面的式子可以知道：

\[\chi^2=\sum\limits_{i=1}^{n}X_i^2 \sim \Gamma(\frac{n}{2},2)\]

1）若 \(X \sim \chi(n)\),则\(E(X)=n,D(X)=2n\)

2)若\(X \sim \chi(n_1)\), \(Y \sim \chi(n_2)\),且\(X,Y\)相互对立，则有\(X+Y \sim \chi^2(n_1+n_2)\)

posted on 2017-10-14 06:55 迈克老狼2012 阅读(4260) 评论(0) 编辑收藏举报

刷新页面返回顶部

迈克老狼2012