【概率论与数理统计】全概率公式和贝叶斯公式

:很久以前就知道这两个公式,但一直仅限于了解。直到最近学习edx上的课程,才对这两个公式有了新的理解,记录于此。

 

最近(2022年7月@HK)学习图宾根大学 Prof. Dr. Philipp Hennig 的概率机器学习课程(https://uni-tuebingen.de/en/180804),在第一节课的课件中看到一张图,补充与此。

 

 

 

1. 条件概率公式


 设A, B是两个事件,且P(B)>0, 则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为:

P(A|B)=P(AB)/P(B)

条件概率是理解全概率公式和贝叶斯公式的基础,可以这样来考虑,如果P(A|B)大于P(A)则表示B的发生使A发生的可能性增大了。

在条件概率中,最本质的变化是样本空间缩小了——由原来的整个样本空间缩小到了给定条件的样本空间。

 

2. 乘法公式


 2.1 乘法公式

由条件概率公式得:

 P(AB) = P(B)·P(A|B) = P(A)·P(B|A)

上面的式子就是乘法公式。

 

2.2 乘法公式的推广

对于任何正整数n≥2,当P(A1A2...An-1) > 0 时,有:

P(A1A2...An-1An) = P(A1)P(A2|A1)P(A3|A1A2)...P(An|A1A2...An-1)

 

3. 全概率公式


 3.1 前提假设

设B1,B2,....为有限或无限个事件,它们两两互斥且在每次试验中至少发生一个,即:

  • 不重,Bi ∩ Bj = ∅(不可能事件)i≠j ,
  • 不漏,B1∪B2∪.... = Ω(必然事件).

  图1:B- Bn是对S的一个划分

这时,称事件组 B1, B2,...是样本空间S的一个划分,把具有这些性质的一组事件称为一个“完备事件组”。

设 B1, B2,...是样本空间S的一个划分,A为任一事件(图1中红圈内部区域),则:

$$P(A) = \displaystyle \sum_{ i = 1 }^{ n } P(B_i)P(A|B_i) \hspace{ 10pt } (1)$$

 上式即为全概率公式(formula of total probability)

 也可以分为两步来看全概率公式:

 

图2:分两步看全概率公式,S先被划分为n个子集B- Bn,然后每个子集的发生会对A的发生产生不同程度的影响

 

设P(Bj) = pj, P(A|Bj) = qj, j = 1, 2, ..., n

则$$P(A) = \displaystyle \sum_{ j = 1 }^{ n } p_{j}q_{j} \hspace{ 10pt } (2)$$

 

在运用全概率公式时的已知未知条件为:

  • 划分后的每个小事件的概率,即P(Bi), i = 1, 2, ..., n;
  • 每个小事件发生的条件下,A发生的概率,即P(A|Bi), i = 1, 2, ..., n;
  • 求解目标是计算A发生的概率,即P(A)。

 

3.2 意义

全概率公式的意义在于,当直接计算P(A)较为困难,而P(Bi),P(A|Bi)  (i=1,2,...)的计算较为简单时,可以利用全概率公式计算P(A)。思想就是,将事件A分解成若干个小事件,通过求每个小事件的概率,然后相加从而求得事件A的概率。

而将事件A进行分割的时候,不是直接对A进行分割,而是先找到样本空间S的一个划分B1,B2,...Bn,这样事件A就被事件AB1,AB2,...ABn分解成了n部分,即A = AB1 + AB2 + ... + ABn, 每一Bi发生都可能导致A发生相应的概率是P(A|Bi),由加法公式得

    P(A) = P(AB1) + P(AB2) + .... + P(ABn)

= P(B1)P(A|B1) + P(B2)P(A|B2) + ... +P(Bn) P(A|Bn)

 

4. 贝叶斯公式


与全概率公式解决的问题相反,贝叶斯公式是建立在条件概率的基础上寻找事件发生的原因(即大事件A已经发生的条件下,分割中的小事件Bi在A发生的条件下的概率),设B1,B2,...是样本空间S的一个划分,则对任一事件A(P(A)>0),有

$$P(B_i|A) = \frac{P(B_i)P(A|B_i)}{\displaystyle \sum_{ j = 1 }^{ n }P(B_j)P(A|B_j)} \hspace{ 10pt } (3)$$

上式即为贝叶斯公式(Bayes formula),B常被视为导致试验结果A发生的“原因”,P(Bi)(i=1,2,...)表示各种原因发生的可能性大小,故称先验概率(权重);P(Bi|A)(i=1,2...)则反映当试验产生了结果A之后,再对各种原因概率的新认识,故称后验概率。

如果参考图2,分成两步来看,B发生在A之前,且B有多种情况(B1 - Bn)。在运用贝叶斯公式时,一般已知和未知条件为:

  • B的多种情况中到底哪种情况发生了是未知的,但是每种情况发生的概率已知,即P(Bj);
  • 事件A是已经发生的确定事实,且每种B发生条件下A发生的概率已知,即P(A|Bj);
  • P(A)未知,需要使用全概率公式计算得到;
  • 求解的目标是用B的某种情况Bi的无条件概率求其在A发生的条件下的有条件概率P(Bi|A)

 

5. 小结


如果我们把事件A看成“结果”,把诸事件B1,B2,…看成是导致这个结果的可能的“原因”,则可以形象地把全概率公式看做“由原因推结果”;而贝叶斯公式则恰好相反,其作用在于“由结果推原因”:现在有一个“结果”A已经发生了,在众多可能的“原因”中,到底是哪一个导致了这个结果?这是一个在日常生活和科学技术中常要问到的问题。贝叶斯公式说,各原因可能性的大小与P(Bi|A)成比例。

贝叶斯公式最神奇之处在于将条件概率中的因和果调换了位置,可以用下面的式子表示:

P(B|A) = P(因|果) = P(因)P(果|因)/P(果)

 

6. 例题


问题1

设某公路经过的货车与客车的数量之比为1:2,货车中途停车修车的概率为0.02,客车为0.01,今有一辆汽车中途停车修理,则该车是货车的概率是多少?

解答

 原本汽车中途停车维修的概率应该与车的数量成正比,即在只考虑车的数量时,停下来的车为货车的概率为P(A1),即1/3;

但是当我们进一步观察,加入更多的信息(每种类型的车的停车维修的概率)后,判断停下来的车为货车的概率增加到了1/2,也就是说B的发生使得A1(观察到货车停下来维修)发生的概率变大了。(货车的数量虽然少,但是经过长期观察,货车出故障的概率是客车的2倍<获得了新的信息>,因此货车停在路边维修的概率就增加了)

 

问题2:

 装有10件某产品(乒乓球)(其中一等品5件,二等品3件,三等品2件)的箱子中丢失一件产品,但不知是几等品,今从箱中任取2件产品,结果都是一等品,则丢失的也是一等品的概率为?

 

解答

由于我们不知道丢失了哪种球,最直接的猜测就是丢每种球的概率与球的数量成正比。即,丢的球是一等品的概率为1/2 = P(A1)。

但是为了更加准确的推测到底丢了什么球,只能通过一些可行的方法,获得更多的信息。这里采用了"任取两个球出来"这种试验方法,然后根据试验结果得到了更加准确的结果3/8,也就是说,这一结果降低了我们前面直接根据球的数量预测出的概率。(因为任取两个都是一等品,说明剩下的球中,取到一等品的概率很大,因此丢的可能性就变小了)

 

问题3

爱丽丝的口袋里有5枚硬币:两枚是正常的硬币(都有正反两面,normal),两枚硬币的两面都是正面(double-head),最后一枚硬币的两面都是背面(double-tail)。她随机取出一枚硬币,也没看是哪种硬币,然后投掷:

a). 硬币落地后,朝下的一面为正面的概率?

b). 硬币落地后,正面朝上,那么朝下的一面也是正面的概率?

c). 如果爱丽丝将b)中取到的硬币丢掉,重新从口袋中取出一枚硬币,还是没看是哪种硬币,然后投掷,则当硬币落地后正面朝上的概率?

 

解答

首先,整个事情分成了两个大的步骤:

  1. 第一步取出一个硬币(相当于图2中的B,有多种类型的硬币可以取);
  2. 抛出硬币,得到硬币落地后的结果(相当于图2中的A)。

设,取出的硬币为normal硬币为事件Bn;

取出的硬币为double-head硬币为事件Bh

取出的硬币为double-tail硬币为事件Bt

硬币落地后正面朝上为事件Ahu

硬币落地后正面朝下为事件Ahd

硬币落地后背面朝上为事件Atu

硬币落地后背面朝下为事件Atd

 

a). 需要求P(Ahd)(正面朝下的概率)。取到不同的硬币Bn/Bh/Bt,得到的P(Ahd)也不同,Ahd被分成了三种情况。

由特意可得:

  • P(Bn) = 2/5,即从5枚硬币中取到正常硬币的概率;
  • P(Bh) = 2/5,即从5枚硬币中取到double-head的概率;
  • P(Bt) = 1/5,即从5枚硬币中取到double-tail的概率;
  • P(Ahd|Bn) = 1/2,即取到正常硬币时,可以得到正面朝下的概率;
  • P(Ahd|Bh) = 1,即取到double-head时,可以得到正面朝下的概率(硬币本身两面都是正面,所以概率为1);
  • P(Ahd|Bt) = 0,即取到double-tail时,可以得到正面朝下的概率(硬币本身两面都是反面,不可能得到正面朝下的情况,所以概率为0);

全概率公式,得:

P(Ahd) = P(Bn)*P(Ahd|Bn) + P(Bh)*P(Ahd|Bh) + P(Bt)*P(Ahd|Bt)

           = 2/5*1/2 + 2/5*1 + 1/5*0

           = 3/5

 

b). 根据问题和假设,这里要求解的是条件概率P(Ahd|Ahu),说明两面都是正面,因此等价于求P(Bh|Ahu)。

参考图2,事件B发生在事件A之前,B有两种情况可能导致Ahu,具体发生了哪种是未知的。(有点像由结果推原因

由题意可得:

  • 可能导致Ahu发生的两种B为:Bn或Bh
  • P(Bn) = P(Bh) = 2/5;
  • 参考问题a,可以根据全概率公式计算出Ahu = Ahd = 3/5;
  • P(Ahu|Bh) = 1,取到double-head时,可以得到正面朝上的概率(硬币本身两面都是正面,所以概率为1);

由贝叶斯公式,得:

P(Bh|Ahu) = P(Bh*Ahu)/P(Ahu)

          = P(Bh)*P(Ahu|Bh)/P(Ahu)

          = 2/5 * 1 / (3/5)= 2/3

 

c). 这个问题稍微有点复杂,但也可以分情况讨论:

设该问题——第二次取出的硬币落地后正面朝上,为事件C.

# 第一次分情况

由b)可以知道,b)中取到的硬币只有两种情况(Bn或Bh),Bn与Bh是一组对立事件。

根据已知的条件,可得:

  • 第一次取出的硬币为double-head硬币的概率为P(Bh) = P(Bh|Ahu) = 2/3;
  • 第一次取出的硬币为正常硬币的概率为P(Bn) = 1 - P(Bh|Ahu) = 1 - 2/3 = 1/3;
  • P(Bn2) =  P(Bh)*P(Bn) + P(Bn)*P(Bn) = 2/3 * 2/4 + 1/3 * 1/4 = 5/12,即第二次取到Bn的概率;
  • P(Bh2) =  P(Bh)*P(Bh) + P(Bn)*P(Bh) = 2/3 * 1/4 + 1/3 * 2/4 = 4/12,即第二次取到Bh的概率;
  • P(Ahu|Bn2) = 1/2,即第二次取到正常硬币时,可以得到正面朝上的概率;
  • P(Ahu|Bh2) = 1,即第二次取到double-head硬币时,可以得到正面朝上的概率;
  • 此时的Bh和Bn本质上是在Ahu发生的条件下的条件概率(根据已知的事实计算出来的后验概率),而不再是之前的2/5(先验概率);

# 第二次分情况

此时的C仍然可以分为两种情况,第二次取到正常硬币或取到double-head硬币。

全概率公式,得:

P(C) = P(Bn2)*P(Ahu|Bn2) + P(Bh2)*P(Ahu|Bh2

        = 5/12 * 1/2 + 4/12 * 1

        = 13/24

 

 

欢迎阅读“概率论与数理统计及Python实现”系列文章

 

 

参考:


http://www.cnblogs.com/ohshit/p/5629581.html

edx上的公开课:MITx: 6.008.1x Computational Probability and Inference

《概率论与数理统计》,陈希孺,中国科学技术大学出版社

 

 重大修订版:

  • 2017-7-15,添加示意图,补充定义,重新解释了例题的解答过程,补充了例题;

 

posted @ 2016-09-30 15:01  昕-2008  阅读(47586)  评论(4编辑  收藏  举报