PRML3-Gamma分布与共轭先验分布
Gamma分布与共轭先验
Gamma函数
对于整数\(n\)的阶乘,我们有\(n!=n\times (n-1)...\times1\)。
对于实数\(x\)的阶乘,计算公式为:
性质如下:
- \(\Gamma(x+1)=x\Gamma(x)\)
- 当x为正整数时有:\(\Gamma(x)=(x-1)!\)
- \(\Gamma(1)=1,\ \ \Gamma(0.5)=\sqrt\pi\)
Gamma分布
将Gamma函数标准化可以得到:
这就是简单的Gamma分布:
此时做\(t=\beta x\):
就可以得到Gamma分布的一般形式:
其中\(\alpha\)为形状参数(shape parameter),决定了分布曲线的形状;\(\beta\)为逆尺度参数(inverse scale parameter),决定曲线有多陡。
当\(\alpha = k+1,\ \ \beta = 1\)时:
这正是泊松分布的分布函数。由此看来Gamma分布是泊松分布在实数域上的扩展。
共轭分布(Conjugate distribution)
在贝叶斯理论中,后验分布如下计算:
\(f(x)\)表示观察样本的边缘密度(marginal density),是只关于变量\(x\)的概率分布,不考虑其他变量。\(f(x;\theta)=L(\theta,x)\)是似然函数(样本的分布)(likelihood or sampling distribution),\(g(\theta)\)是其先验分布。
其中:
此公式解释了边缘密度,可以理解为\(\theta\)取某一值时,我们得到观察值样本的概率的积分。
当\(g(\theta)\)与\(g(\theta|x)\)的形式相同时,我们说这是共轭分布,\(g(\theta)\)为共轭先验。(没有共轭后验的说法)
为何使用共轭先验?
可以使得先验分布和后验分布的形式相同,这样一方面合符人的直观(它们应该是相同形式的)另外一方面是可以形成一个先验链,即现在的后验分布可以作为下一次计算的先验分布,如果形式相同,就可以形成一个链条。
为什么没有共扼后验?
如果先验分布和似然函数可以使得先验分布和后验分布(posterior distributions)有相同的形式,那么就称先验分布与似然函数是共轭的。所以,共轭是指的先验分布(prior probability distribution)和似然函数(likelihood function)。如果某个随机变量Θ的后验概率 p(θ|x)和气先验概率p(θ)属于同一个分布簇的,那么称p(θ|x)和p(θ)为共轭分布,同时,也称p(θ)为似然函数p(x|θ)的共轭先验。
可以看到二项分布的共轭先验分布为Beta分布。