贝叶斯公式的推导及理解

https://www.bilibili.com/video/BV1Ei4y1F72M,https://www.bilibili.com/video/BV1R7411a76r和https://www.bilibili.com/video/BV1o7411a76m 三个3Blue1Brown的视频给予了很大的参考,这篇博客可以看做这几个视频的观后笔记总结

贝叶斯公式推导

假定已知“图书管理员和农民的比例是1:20”,Steve的职业是其中之一,他最有可能是什么?

此时我们的回答肯定是“农民“,因为众所周知 农民的概率更高。

现在给出额外的信息“Steve是一个温顺且办事井井有条的人”, 问题依旧,Steve的职业是图书管理员和农民,他最有可能是什么?

我们此时会抉择,因为我们知道图书管理员往往是一个温顺且办事井井有条的人,这似乎 提高 了Steve是图书管理员的概率,也就意味着在我们心中,在“Steve是一个温顺且办事井井有条的 条件 下,Steve是图书管理员的可能性“不再是120+1,而是比他大的某一个值,因为条件 佐证 更偏向于图书管理员这个职业。

这里对我们之前已知的所有信息进行一些形式化定义。

众所周知的“图书管理员和农民的比例是1:20”,这是一个先验概率,对应于Steve为图书管理员的可能性,记为P(H)=120+1,其中Steve为图书管理员是我们的假设H

额外的信息“Steve是一个温顺且办事井井有条的人”,是我们得到的证据E,证据也对应了一些先验概率P(E),指的是这条证据成立的概率。但我们此时需要思考的是这个证据与假设的关系,也就是假设如果成立的话,这个证据也同时成立的概率,我们把他叫做似然。换句话说,在这里指“图书管理员是一个温顺且办事井井有条的人”的可能性,记为P(E|H),假设这个值是0.4

我们现在需要知道“Steve是一个温顺且办事井井有条的人的条件下,Steve是图书管理员的概率”,也就对应着P(H|E),它也叫后验概率,是我们依据证据信息E对先验概率P(H)的修正结果,下面是一些等式的推导:

P(H|E)=H,E同时成立的人数E=P(H,E)P(E)=H成立的人数×H成立时,E也成立的概率E=P(H)×P(E|H)P(E)

贝叶斯概率图

这里出现了P(H,E)代表证据和假设同时成立的概率,它与P(H|E)不同。前者是在整个概率空间(即全概率1)中求取H,E同时成立的概率。后者是在假设H成立这个概率空间中求取HE同时成立的概率(因为是在假设H成立的概率空间,H肯定成立了,因此也可以看做是求此时E成立的概率)。

值得注意的是为什么我们直觉性认为这个证据有助于让我们判定Steve是一个图书管理员,那是因为“农民(即不是图书管理员)是一个温顺且办事井井有条的人”记为P(E|¬H)的可能性更小,假设这个值是0.1,它小于0.4

P(E)=P(E|H)×P(H)+P(E|¬H)×P(¬H)

P(H)P(¬H)是固定的,因此更大的P(E|H)>P(E|¬H)意味着在P(E)中图书管理员的占比更大,这个占比对应的值也就是我们刚才计算得出的后验概率P(H|E),因此这里直觉是正确的。

快速计算技巧

假定给出一个疾病的发病率为1%,病人被某种诊断手段判为阳性的概率为90%,非病人被判为阴性的概率为91%,假设现在你被测为阳性,你有多大概率患有该疾病。

这里同样可以进行一系列形式化定义,假设用T表示患病,F表示不患病,N表示阴性,P表示阳性。那么P(T)=0.01,P(P|T)=0.9,P(N|F)=0.91,P(T|P)=?

直接看到这一串数字,我们往往可能会直觉性的认为这个答案是90%。这种直觉来自于“病人被判为阳性的概率为90%”,语句顺序变化,即“阳性为病人的概率为90%”,答案也正确。通过之前的介绍,可以知道这里因果发生了导致,答案是可能发生变化的,从似然变成了后验概率。

与上述一样这里需要求给出证据P的后验概率P(T|P)。当然可以直接套公式计算,这里有小技巧,原本我们计算的是概率,可以通过计算比率,如下公式所示。

P(T|P)P(F|P)=P(T,P)P(P)P(F,P)P(P)=P(T,P)P(F,P)=P(T)P(F)×P(P|T)P(P|F)

这里P(T)P(F)很容易通过先验概率获得,而P(P|T)P(P|F)=P(P|T)1P(N|F)也在已知条件中给出,它也叫做贝叶斯因子。贝叶斯因子反映了证据P是否有助于假设T的成立,如果值大于1就有助于,相反小于1则无异于。可以看出来如果证据与假设独立,即P(P|T)=P(P|F)=P(P),则贝叶斯因子为1,并不能修改对假设的概率判定。

posted @   DreamW1ngs  阅读(189)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 从HTTP原因短语缺失研究HTTP/2和HTTP/3的设计差异
· 三行代码完成国际化适配,妙~啊~
点击右上角即可分享
微信分享提示