机器学习:极大似然估计

极大似然估计(Maximum Likelihood Estimate,MLE)
  
由于样本数据,是实实在在发生的数据,有理由相信该样本出现的概率本来就比较大,极大似然估计假设该样本出现的概率是最大的,然后通过该样本寻找一组参数,该参数使得该样本出现的概率最大
  
比如:班里有 50 个男生,50 个女生,我们拥有所有男生的身高数据,也拥有所有女生的身高数据,假定男生的身高服从正态分布,女生的身高服从另一个正态分布,这时可以用极大似然法,通过 50 个男生和 50 个女生的样本来估计这两个正态分布的参数,该参数使得样本数据出现的概率最大
  
设有样本 X=(x1,x2,...,xn)
预测算法的参数为 θ,不同参数下 X 出现的概率不同,表示为
  
  P(X|θ)=P(x1,x2,...,xn|θ)=i=1nP(xi|θ)
  
极大似然估计就是求解使得 P(X|θ) 为最大值的 θ
  
实际中为了方便计算,经常改成对数形式
  
  ln(i=1nP(xi|θ))=i=1n(ln(P(xi|θ)))
  
以上面例子中的正态分布为例,一维正态分布函数为
  
  f(x)=12πσexp((xμ)22σ2)
  
则有
  
  P(X|θ)=i=1n12πσexp((xiμ)22σ2)
  
        =(2πσ2)n2exp(12σ2i=1n(xiμ)2)
  
取对数
  
  H(μ,σ2)=ln(P(X|θ))
  
         =ln((2πσ2)n2exp(12σ2i=1n(xiμ)2))
  
         =n2ln(2π)n2ln(σ2)12σ2i=1n(xiμ)2
  
求导得到
  
  H(μ,σ2)μ=1σ2i=1n(xiμ)
  
  H(μ,σ2)σ2=n2σ2+12σ4i=1n(xiμ)2
  
另导数为 0 求解得到
  
  μ=1ni=1nxi
  
  σ2=1ni=1n(xiμ)2
  
这两个参数使得样本出现的概率最大
于是就用这两个参数代入正态分布函数,用以预测新的数据



posted @   moon~light  阅读(326)  评论(0编辑  收藏  举报
编辑推荐:
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
阅读排行:
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 提示词工程——AI应用必不可少的技术
· 地球OL攻略 —— 某应届生求职总结
· 字符编码:从基础到乱码解决
· SpringCloud带你走进微服务的世界
点击右上角即可分享
微信分享提示