最大似然估计是一种用来在给定观察数据下估计所需参数的技术。比如,如果已知人口分布遵从正太分布,但是均值和方差未知, MLE(maximum likelihood estimation)可以利用有限的样本来估计这些参数。
1.正规定义
从分布f0中引出n个独立同分布的观察x1,x2,...xn,其中f0是从一族依赖于几个θ参数的分布f而得来的。
MLE的目标就是最大化似然函数:
L=f(x1,x2,...xn∣θ)=f(x1∣θ)×f(x2∣θ)×...×f(xn∣θ)
通常,log似然函数更容易处理:
l^=n1logL=n1i=1∑nlogf(xi∣θ)
2.举例
举例一
一个硬币被抛了100次,有61次正面朝上,假设硬币向上的概率猜测有三个31,21,32,以上三个哪个是最大似然估计?
求解:这个是伯努利分布,假设唯一参数为p,因此:
P(H=61∣p=31)=(10061)(31)61(1−31)39≈9.6×10−9P(H=61∣p=21)=(10061)(31)61(1−21)390.007P(H=61∣p=32)=(10061)(32)61(1−32)39≈0.40
比较以上三个值可以得出p=32是极大似然估计。
举例二
该例子利用导数为0得到极大似然估计,主动计算。
Higher you climb, more view you will see.