数理统计中 极大似然 的含义简介(举例说明)
概率中存在许多分布,其中著名的有 正态分布、指数分布、均匀分布和二项分布等。
这些分布的概率密度曲线都由 分布的参数 决定,比如决定正态分布钟形曲线具体形状的参数有均值 μ 和方差σ^2。决定指数分布的参数则是 λ ,决定二项分布的则是 p 值。
当我们已经知道一个总体的概率分布是哪一种的时候,对其取样。根据得到的样本,通过不断调整 该分布的参数,使抽到的样本成为概率上最可能抽到的样本,这时候得到的参数及对应的分布称为样本的极大似然。
举例来说:
抛硬币时,我们先验地认为 得到正面的概率是50%,所以可以认为在潜意识中我们采用了一个概率分布模型:
p(0.5)=1
而贝叶斯学派认为 一切都应当从观测到数据出发,慢慢地调整我们选用的概率分布模型。
所以 假设我们在一开始 选取的概率分布模型不是p(0.5)=1(大家可以这样想这批硬币的质地不均匀,抛的结果是正面的概率服从另一个分布。。。。)而是P(m)=6m(1-m)
(注意:这里是为了解释方便才用一个多项式来表示概率分布的,通常我们会用著名的正态分布)
那么对于一次抛硬币来说,得到正面的概率就是 m* p(m)=6m^2(1-m)
如果抛了10次硬币,其中8次为正面,2次为反面,那么在该概率分布模型下这种情况出现的概率为(这就是似然方程):
m^8*(1-m)^2*6m(1-m)=6*m^9*(1-m)^3
对这个模型求极大似然,求极大似然的时候我们一般把方程式取自然对数(对数似然),然后再求导数为0处(如果先验概率模型是高斯分布那么要对μ和δ分别求偏导,当偏导为0时μ和δ的值),以方便求解:
ln(6*m^9*(1-m)^3)=ln6+9ln(m)+3ln(1-m)
求导:9/m+3/(1-m)=0
得到m=0.75
更多的例子在这里:http://wenku.baidu.com/view/bf4836f7ba0d4a7302763aa2.html