先验概率、似然函数、后验概率、贝叶斯公式
这个文章的目的是为了加强对这几个概念的理解与记忆。
怕自己不知道什么时候又忘了。
看自己写的东西总应该好理解记忆一些吧。
联合概率的乘法公式:
(当随机变量x,y独立,则)
这太简单了是吧。。。。
联合概率公式变个形,得到条件概率公式为:
,
全概率公式:
,其中
可以这样理解把一个圆看成x,其中被划分为好多种情况,对每一种情况的概率求和就是全概率(整个概率)。
(,则
可轻易推导出上式)
贝叶斯公式:
又名后验概率公式、逆概率公式。
后验概率=似然函数
*先验概率
/证据因子
。(是对上式最后一个等号的内容解释的)
举个例子。
假设我们根据“是否阴天”这个随机变量x(取值为“阴天”或“不阴天”)的观测样本数据,来判断是否会下雨(假设总共只有这两种类别下雨,不下雨)。我们根据经验来判断,比如根据历史数据估,阴天有70%会下雨,也就是说无须观测样本数据就知道下雨的先验概率(Prior Probability)较大。
接着,我们得到了的观测样本数据:“下雨”表现为阴天的 条件概率(或者说这种“可能性”即似然(Likelihood))相比于”不下雨“表现为“阴天”的似然
较大。
所以经这次观测之后加强了我们的判断:下雨的后验概率(Posterior Probability)变得比先验概率
更大,超过了之前的70%!
反之,则会减弱我们的判断,下雨的后验概率将小于70%。
因此,后验概率包含了先验信息以及观测样本数据提供的后验信息,对先验概率进行了修正,更接近真实情况。
此外,证据因子(Evidence,也被称为归一化常数)可仅看成一个权值因子,以保证各类别的后验概率总和为1从而满足概率条件。
如果我们的目标仅仅是要对所属类别做出一个判别:是“下雨”还是“不下雨”,则无须去计算后验概率的具体数值,只需计算哪个类别的后验概率更大即可。假设下雨和不下雨出现的先验概率相等,则此时类别的判定完全取决于似然和的大小。因此,似然函数(Likelihood,“可能性”)的重要性不是它的具体取值,而是当参数(如类别参数)变化时,函数到底变小还是变大,以便反过来对参数进行估计求解(估计出是还是)。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!