由赌徒谬误想到的
赌徒谬误是这么说的:有一个赌徒,连续抛10次硬币,前9次都是正面朝上,于是赌徒认定第10次反面朝上的概率大于1/2。之所以说这是一个谬误,想必大家都知道,正确答案是1/2。
当时在学概率论的时候,这个问题就深深困扰着我,因为这不符合大数定律:随着实验次数的增多,实验结果的频率应当向它们的理论概率靠近。也就是说:如果第10次仍然是正面朝上,那么正面朝上的频率就变成1,而反面朝上的概率就变成了0;而如果第10次是反面朝上,那么正面朝上的频率就变成9/10,而反面朝上的概率就变成了1/10;显然,如果是反面朝上,它向着理论概率1/2靠近了,符合大数定律的,而第10次是正面朝上是不符合大数定律的。于是,正确答案和大数定律之间似乎出现了矛盾。
有人给出了解释:两次抛硬币的结果是相互独立的,前一次抛的结果和后一次之间没有任何联系,所以第10次正面向上和反面向上的概率仍然都是1/2。这个回答看似合情合理,我却不能昧着良心欺骗自己,因为这个解释并没有正面回答到底大数定律的那个解释错在哪了,只是相当于用排除法证明了大数定律的那个解释是错的。
经过一番仔细思考,我似乎反现了一点东西:两次抛硬币的结果是相互独立的,这个独立到底是什么意思?先看看教科书上的定义:如果P(A B) =P(A) P(B),称A,B 相互独立。这里,如果记前一次抛硬币的结果是A,后一次抛硬币的结果是B,那么确实是P(A B) =P(A) P(B),因为连抛两次硬币的结果:正正、正反、反正、反反的概率都是1/4。显然,A,B是相互独立的。那么问题来了:既然是相互独立的事件,结果完全不相关的两件事,其统计意义上的结果为什么要符合正态分布(如果抛的次数足够多的话)?冥冥之中似乎有什么东西在联系着这两件事,它们之间真的是我们所说的独立吗?
其实,正是相互独立造就了统计意义上的分布,这是一个因果关系,而不是因为统计结果符合某种分布使得两件事不是相互独立的(这纯粹是想多了)。真正的问题出在:用大数定律去预测一件事,得出的结果是我们所说的先验概率,也就是我们在不知道任何前提条件下做出的预测。而我们知道了前9次的统计结果,去预测第10次抛硬币的概率,是后验概率(也叫条件概率)。比方说,袋子里面有一个红球一个白球。现在随机取出一个,显然摸到红球的概率是1/2。如果现在第一次已经摸到一个白球了,问第二次摸到红球的概率是多少?显然结果是1。这就是我们所说的先验概率和后验概率的差别,知道的条件不同,预测的结果必然也是有区别的。如果在不知道前9次抛硬币结果的前提下,我们是可以用大数定律预测整个10次抛硬币的结果的统计值的,但一旦知道了前9次抛的结果,大数定律就不适用了,它只能用来预测从第10次开始,第11次,第12次...以后所抛的结果的统计值。相应地,这里如果我们以后验概率来计算第10次抛硬币的结果:记前9次抛的结果全部是正面事件为A,第10次抛的结果是正面朝上事件为B,则P(B/A)=P(AB)/P(A)=(1/2)^10/(1/2)^9=1/2。所以,从后验概率的角度来解释这个问题才是正确的。