条件概率
定义1.假设\(S\)是一个有\(n\)个元素的集合,均匀分布分配给\(S\)的每个元素\(\frac1n\)的概率。
定义2.事件\(E\)的概率是\(E\)中所有结果出现的概率之和。如下:$$p(E)=\sum_{s \in E}p(s)$$.
(注意:当\(E\)是一个有限集合时,\(\sum_{s \in E}p(s)\)是一个收敛有限级数。)
这里事件的各个结果的概率计算依照拉普拉斯概率的计算即可。
从一个带有均匀分配(也可叫做一致分布)的样本空间中选择一个元素的实验叫做随机选取元素\(S\)。
在这个部分,带有数个结果的事件的补全概率的计算依旧遵循拉普拉斯的传统的计算。
随机变量
定义6.一个随机变量是一个从实验的样本空间映射到实数集合的函数。因此,一个随机变量分配一个实数到每个可能结果。
注意:随机变量并不是变量,也不随机。
定义7.在样本空间\(S\)中的随机变量\(X\)的分配是对所有\(r \in X(S),p(X=r)\)是\(X\)取值\(r\)的概率的对\((r,p(X=r))\)的集合。(在这个分配中的对的集合是由对\(r \in X(S)\)的概率\(p(X=r)\)决定的。)
生日问题
生日问题是寻找房间里最少的人数使得至少有2个人同一天生日的概率大于\(\frac12\).
答:首先,我们列出几条假设。我们假设在一个房间里的人们的生日均是独立的。更进一步,我们假设每个生日是等可能的并且一年里有366天。(实际上,在一年里更多的人出生在一年里的相同的一些日子里,比如包括新年在内的一些节日后的9个月里)
为了找到这个可能性,我们首先计算这些人有全部都有不同生日的概率\(p_n\)。然后,至少2个人有相同生日的概率为\(1-p_n\)。为了计算\(p_n\),我们姑且认定\(n\)个人的生日是遵循一定顺序的。想象一下,他们在一个时刻一个个进入房间;我们将会计算每个人进入房间时与已经在房间里的人的生日不同的概率。
第一个进入房间的人的生日当然不会匹配到任何在房间里的人的生日。第二个人的生日不同于第一个人的概率是$\cfrac{365}{366}因为当第二个人出生在除了第一个人的生日之外的\(365\)天里时,他们的生日是不同的。(这个对每个人出生在\(366\)天里任何一天等可能的假设保证了这个和后续步骤)
第三个人有不同生日的概率是\(\cfrac{364}{366}。延伸开来,对于第\)j\(个人(2 \leq j \leq 366),有一个不同于其他\)n-1\(个人的生日的概率是\)\(\cfrac{366-(j-1)}{366}=\cfrac{367-j}{366}.\)\(
因为已经假设在房间里的人的生日均是独立的,我们就可以得出结论这房间里的\)n\(个人有不同生日概率是\)\(p_n=\cfrac{365}{366}\cfrac{364}{366}\cfrac{363}{366}\dots \cfrac{367-n}{366}.\)\(
随之,我们得到\)\(1-p_n=1-\cfrac{365}{366}\cfrac{364}{366}\cfrac{363}{366}\dots \cfrac{367-n}{366}.\)\(
接下来为了找到最少的人数使得其概率大于\)\cfrac12\(,我们逐渐带入增大的\)n\(来计算(虽然可以用微积分,但是这里不使用。话说怎么用?我忘了)。我们会发现\)n=22,1-p_n \approx 0.475;n=23,1-p_n \approx 0.506\(。因此我们得知最少只要23个人即可使得房间内的人至少有2个人的生日相同的概率为\)\cfrac12$。
哈希的重合概率计算和生日问题类似。