伽马分布

 伽玛分布(Gamma Distribution)是统计学的一种连续概率函数。Gamma分布中的参数α称为形状参数(shape parameter),β称为尺度参数(scale parameter)。
假设随机变量X为 等到第α件事发生所需之等候时间, 密度函数为
 
特征函数为
 
 

Gamma的可加性

编辑
当两随机变量服从Gamma分布,且单位时间内频率相同时,Gamma
数学表达式
若随机变量X具有概率密度
其中α>0,β>0,则称随机变量X服从参数α,β的伽马分布,记作G(α,β).
性质:
1、β=n,Γ(n,α)就是Erlang分布。Erlang分布常用于可靠性理论和排队论中 ,如一个复杂系统中从第 1 次故障到恰好再出现 n 次故障所需的时间;从某一艘船到达港口直到恰好有 n 只船到达所需的时间都服从 Erlang分布;
2、当α= 1 , β = 1/λ 时,Γ(1,1/λ) 就是参数为λ的指数分布,记为exp (λ) ;
3、当α =n/2 ,β=1/2时,Γ (n/2,1/2)就是数理统计中常用的χ2( n) 分布。
4、数学期望(均值)、方差分别为
对于Γ(a ,β ),E( X) =a/β,D ( X) =α / (β*β)
5、(Gamma 分布的可加性):设随机变量 X1 , X2 , …, Xn 相互独立,并且都服从Gamma 分布,即Xi ~Γ(αi , β),i =1 ,2 , …, n , 则:
X1 + X2 + …+ Xn ~ Γ(α1 +α2 + …+αn ,β )
 
 
 
其实你只要记住了Gamma function\Gamma(\alpha) = \int_0^\infty t^{\alpha-1}e^{-t}dt
做积分变换t = \beta x,可得\Gamma(\alpha,\beta) = \beta^\alpha\int_0^\infty x^{\alpha-1}e^{-x\beta}dx,从而
\frac{1}{\Gamma(\alpha,\beta) } \beta^\alpha\int_0^\infty x^{\alpha-1}e^{-x\beta}dx = 1
那么Gamma distribution 就很好记了。

并且伽马分布与一大坨分布有着暧昧的关系,比如:
Erlang distributionChi-squared distributionExponential distributionBeta distributionNormal distribution

最后来个分布族谱图:


Gamma分布即为多个独立且相同分布(iid)的指数分布变量的和的分布。
(最新修改,希望能够行文布局更有逻辑)

——————泊松过程——————
指数分布泊松分布的关系十分密切,是统计学中应用极大的两种分布。
其中泊松过程是一个显著应用。

泊松过程是一个计数过程,通常用于模拟一个(非连续)事件在连续时间中发生的次数。
\{N(t):t\geq 0\}为一个泊松过程,则其满足三个性质:
N(0)=0(t=0时什么都没发生)

N(t+s)-N(t)(增量)之间互相独立:
扩展补充:N(t+1)-N(t)N(t)-N(t-1)互相独立,且在计数过程中
Pr(N(t+1)=n_{t+1}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})
=Pr(N(t+1)=n_{t+1}|N(t)=n_{t})
这是因为
Pr(N(t+1)=n_{t+1}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})
=Pr(N(t+1)=N(t)+n_{t+1}-n_{t}|N(t)=n_{t},N(t-1)=n_{t-1},...,N(1)=n_{i})
=Pr(N(t+1)=n_{t+1}|N(t)=n_{t})

Pr(N(t+s)-N(s)=n)=Pr(N(t)=n)=e^{-\lambda t} \frac{(\lambda t )^{n}}{n!}
N(t) \sim Poi(\lambda t)
根据增量独立性,易知其成立。

——————泊松→指数——————
假设T_{i}为第i-1次事件与第i次事件的间隔时间。
Pr(T_{1}>t)=Pr(N(t)=0)=e^{-\lambda t}
所以T_{1} \sim Exp(\lambda)

Pr(T_{i}>t|T_{i-1}=s)=Pr(N(t+s)-N(s)=0)=e^{-\lambda t}
所以T_{i} \sim Exp(\lambda)

即泊松过程的事件间隔时间为指数分布。

——————指数→Gamma—————
再令S_{n}=\sum_{i=1}^{n}{T_{i}} ,即从头开始到第n次事件的发生的时间,该随机变量分布即为Gamma分布。
S_{n} \sim Gamma(n,\lambda )
Gamma分布即为多个独立且相同分布(iid)的指数分布变量的和的分布。

——————证明——————
假设X_{1},X_{2},X_{3},...X_{n}\sim Exp(\lambda )且互相独立

①Moment Generating Function(MGF):
MGF的定义为M_{X}(t)=E[e^{tX} ]=1+tX+\frac{t^{2}X^{2}}{2!} +\frac{t^{3}X^{3}}{3!}+...\frac{t^{n}X^{n}}{n!}+...
E[X^{n}]=M_{X}^{(n)} (0)=\frac{d^{n}M_{X}(t)}{dt} |_{t=0}
其性质为M_{X+Y}(t)=M_{X}(t)\times M_{Y}(t)

下证:
X_{i} \sim Exp(\lambda)\Leftrightarrow M_{X_{i}}(t)=(1-\frac{t}{\lambda} )^{-1}
S=\sum_{i=1}^{n}{X_{i}}
M_{S}(t)=\prod_{i=1}^{n} M_{X_{i}}(t)=\prod_{i=1}^{n} (1-\frac{t}{\lambda} )^{-1}=(1-\frac{t}{\lambda} )^{-n}
为Gamma分布的MGF。
MGF:Moment-generating function

②数学归纳法:
已知Gamma(1,\lambda)=Exp(\lambda)
所以当n=1时成立。
假设n\leq kS_{n}=\sum_{i=1}^{n}{X_{i}} \sim Gamma(n,\lambda )成立
n=k+1时,
S_{k+1}=S_{k}+X_{k+1}
其中S_{k} \sim Gamma(k,\lambda), X_{k+1} \sim Exp(\lambda)
Pr(S_{k+1}=x)
=\int_{0}^{x} Pr(S_{k}=y)Pr(X_{k+1}=x-y)dy
=\int_{0}^{x} \frac{\lambda^{k}}{\Gamma (k)} y^{k-1}e^{-\lambda y}\times \lambda e^{-\lambda (x-y)}dy
=\frac{\lambda^{k+1}}{\Gamma (k)}e^{-\lambda x}\int_{0}^{n}  y^{k-1}dy
=\frac{\lambda^{k+1}}{\Gamma (k)}e^{-\lambda x} \frac{y^{k}}{k}|_{y=0}^{n}
=\frac{\lambda^{k+1}}{\Gamma (k+1)}x^{k}e^{-\lambda x}
Gamma(k+1, \lambda)的pdf。证毕。

当然,Gamma分布与Beta,Chi-square分布也有着十分紧密的联系,不过在统计学应用中都不如与指数分布的联系来得重要。
posted @ 2017-03-21 10:25  Thinkando  阅读(71392)  评论(0编辑  收藏  举报