[转] 伯努利分布 v.s 二项分布
转战知乎了 csdn越来愈不行了
from:https://www.zhihu.com/question/50561130/answer/1500766290
链接:https://www.zhihu.com/question/50561130/answer/541175752
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
分布的通俗解释:
一件事情,它有若干种结果,每种结果都有其发生的可能性,可能性就称作“概率”。分布就描述了这些概率有多大。
注:某结果一定会发生,则其概率为100%;某结果不可能发生,则其概率为0。一件事情所有结果发生的概率之和等于100%(这是数学上的硬性规定,不过也容易理解)。
伯努利分布的通俗解释:
一件事情,只有两种可能的结果。伯努利分布描述了其中一种结果的概率为a,另一种结果的概率为100%-a。
二项分布的通俗解释:
二项分布以伯努利分布为解释的基础,为了解释二项分布,再回顾一下伯努利分布。“一件事情,只有两种可能的结果”,将其中一结果记作【花生】,另一结果记作【剥花生】,则伯努利分布描述的是——结果是【花生】的概率为a,结果是【剥花生】的概率为100%-a。
将伯努利的事情重复做多次,次数记作N(取自number首字母)。
那么在二项分布中,
事情为:将伯努利分布的事情做N次。
一共有N+1种结果,列举如下:
- 结果【花生】出现0次,结果【剥花生】出现N次;
- 结果【花生】出现1次,结果【剥花生】出现N-1次;
- 结果【花生】出现2次,结果【剥花生】出现N-2次;
- 结果【花生】出现3次,结果【剥花生】出现N-3次;
……
N+1. 结果【花生】出现N次,结果【剥花生】出现0次。
二项分布就描述了这N+1种结果每种结果出现的概率。
完。
----------------------------------------------------------------------------------------------------
啥,还想知道二项分布中每种结果的概率,得(dé),接着写。
为聚焦推导,用A表示【花生】,B表示【剥花生】。
对于结果1(结果A出现0次,结果B出现N次),其概率为:
为什么概率是这个值,因为B出现的概率是1-a,它连续出现N次就是N个1-a相乘咯(为什么是连乘,好好想想)。
对于结果2,其概率为:
(思考中:A出现一次,概率是a,B出现N-1次,结果就是a乘以1-a的N-1次方!)
可惜,结果2的概率并不是它。为了得到正确的概率值, 我们进一步分析二项分布中做的N次事情。
如果这N件事的结果为BBB……BB,A出现0次,B出现N次,也就是结果1,概率为(1-a)^N是没有问题的。
对于结果2,这N件事可以为ABB……BB,那ABB……BB发生的概率为a×(1-a)^(N-1)。可是结果2还可以为:
BAB……BB,BBA……BB,……, BBB……AB,BBB……BA。
上一行中每一个发生的概率都为 。
所以,结果2发生的概率应该是 ,有多少个 呢,这个问题很简单,可以这样想,N件事情,只发生了一次A,问A可能在哪发生的位置数。这不就是N嘛,因为A可以发生在N个位置的任何一处。
所以,结果2发生的概率为:
对于结果3呢,A发生了两次,B发生了N-2次,根据上述经验,概率应该包括 ,而且这只是AAB……BB发生的概率,还有好多其他的结果,比如BAA……BB。那么,这个好多是多少呢?问题同样可以转换为在N次事情中,发生了两次A,这两次A可能在哪发生的位置数。这个数没有结果1那么浅显易得,而且这将涉及到另外一个数学分支——组合数学的内容,咱们先不探讨它。但咱们可以借助组合数学的表达式来表示这个数,这个表达式为 ,即N个相同的位置,要取两个位置的话,可以取的种数。
所以结果3的概率为 。
回过头来看结果2的概率,结果2的概率可以表示为 ,
回过头来看结果1的概率,结果1的概率可以表示为 ,这是因为:
- ,因为N个相同的位置,取0个位置的取法只有一种,那就是不取;
- ,任何数的0次幂都是1。
到现在,你发现规律了吗?规律如下。
第i个结果的概率为:
或者,用另一种表示:对于某个结果,其中A发生i次,B发生N-i次,该结果的概率为:
i可以取0,1,2,……,N。
这些概率加起来等于多少?等于1。为什么呢?因为概率之和为1嘛。还有一个原因,那就是
的二项式展开就是上式,即
而 。
由于和二项式展开具有密切的关联,所以二项分布被称作二项分布。
意外的收获。