贝叶斯公式
前置
\(P(A∩B)\) 表示事件 \(𝐴\) 和事件 \(𝐵\) 同时发生的概率
条件概率:
条件概率是指事件 \(A\) 在另外一个事件 \(B\) 已经发生条件下的发生概率。条件概率表示为:\(P(A|B)\),读作“在B的条件下A的概率”。——《百度百科》
条件概率:
\[P(A|B) = \frac{P(A∩B)}{P(B)})
\]
特别的,如果\(A\) 和 \(B\) 相互独立,\(P(A|B)=P(A)\)
贝叶斯公式
对条件概率公式移项可以得到式子:
\[P(A∩B)=P(A|B)\times P(B)
\]
\[P(A∩B)=P(B|A)\times P(A)
\]
因为上面两个式子都包含 \(P(A∩B)\),所以进行联立起来。
\[P(A|B)\times P(B) = P(B|A)\times P(A)
\]
\[P(A|B)=\frac{P(B|A)\times P(A)}{P(B)}
\]
然后上面这个这就是贝叶斯公式,这公式就是用来描述两个条件概率之间的关系。
注:\(P(A)>0,P(B)>0)\),\(P(B)\) 的决定因素可能不止与一个事件有关。
全概率公式
如果样本空间分为了两两互斥(互不相同)的 $A_1 …… A_k $,那么此时:
\[P(B)=\sum_{i=1}^{k} P(B|A_i)\times P(A_{i})
\]
例如样本空间划分为了两个 \(A,A^{'}\),用全概率公式求出 \(P(B)\)。
\[P(B)=P(B|A)\times P(A)+P(B|A^{'})\times P(A^{'})
\]
这个公式可以用来处理 \(P(B)\) 不好直接计算的情况.
然后将全概率公式代入贝叶斯公式可以得到:
\[P(A_i|B)=\frac{P(B|A_i)\times P(A_i)}{\sum_{j} P(B|A_j)\times P(A_{j}} (1\le i\le k)
\]
例题
有两种邮件:\(A_1\) 代表垃圾邮件,\(A_2\) 代表用户邮件。
根据经验,\(P(A_1)=0.7,P(A_2)=0.3\)。
令 \(B\) 表示该邮件包含免费这一关键词,由历史邮件得知,\(P(B|A_1)=0.9,P(B|A_2)=0.01\)(概率之和不一定为1)。
问若收到一封新邮件,包含了“免费”这一关键字,那么它是垃圾邮件的概率是多少。
解析:
题目要求的是 \(P(A_1|b)\)
根据条件概率公式:
\[P(A_1|b)=\frac{P(A_1∩B)}{P(B)}
\]
根据贝叶斯公式:
\[P(A_1|b)=\frac{P(B|A_1) P(A_1)}{P(B)}
\]
带入全概率公式:
\[P(A_1|b)=\frac{P(B|A_1) P(A_1)}{P(B|A_1)P(A_1)+P(B|A_2)P(A_2)}
\]
然后带入已知条件:
\[P(A_1|b)=\frac{0.9\times 0.7}{0.9\times 0.7+0.01\times 0.3}
\]
\[\approx 0.995260663507109004739336492891\%
\]