条件概率

定义1.假设\(S\)是一个有\(n\)个元素的集合,均匀分布分配给\(S\)的每个元素\(\frac1n\)的概率。

定义2.事件\(E\)的概率是\(E\)中所有结果出现的概率之和。如下:$$p(E)=\sum_{s \in E}p(s)$$.
(注意:当\(E\)是一个有限集合时,\(\sum_{s \in E}p(s)\)是一个收敛有限级数。)

这里事件的各个结果的概率计算依照拉普拉斯概率的计算即可。
从一个带有均匀分配(也可叫做一致分布)的样本空间中选择一个元素的实验叫做随机选取元素\(S\)

在这个部分,带有数个结果的事件的补全概率的计算依旧遵循拉普拉斯的传统的计算。

\[p(E_1 \cup E_2)=p(E_1)+p(E_2)-p(E_1 \cap E_2)$$. >定理1.如果$E_1,E_2,\dots$ 是一序列成对出现的样本空间$S$中的不相交的事件,那么$$p \left(\bigcup_i E_i \right)=\sum_i{p(E_i)}$$. (注意这个定义在一序列事件$E_1,E_2,\dots$是由有限或可数数量的成对不想交的事件组成的时候应用) ###条件概率 >定义3.令$E$和$F$作为$p(F)>0$的事件。给出条件$F$的$E$的条件概率写作$p(E|F),定义为$$p(E|F)=\cfrac{p(E \cap F)}{p(F)}$$. 依照这个公式,目前来看,还是比较容易计算的。 ###独立性 一个硬币被掷3次,告诉我们第一次是背面,3次中出现奇数次背面的概率是多少?从上面的条件概率的公式中,我们可以得到$\cfrac{\cfrac14}{\cfrac48}=\cfrac12$.即便没有告诉我们第一次是背面,得到的概率同样也是$\cfrac12$。这样概率并没有受到影响的两个事件,就叫做独立事件。 >定义4.事件$E$和$F$是独立的,当且仅当$p(E \cap F)=p(E)p(F)$. >定义5.当且仅当对于所有对整数$i$和$j$ $(1\leq i \leq j \leq n)$有$p(E_i \cap E_j)=p(E_i)p(E_j)$,事件$E_1,E_2,\dots,E_n$是成对独立的。如果对于$i_j,j=1,2,\dots,m $,是$1 \leq i_1 \leq i_2 \leq \dots \leq i_m \leq n$ 和$m \geq 2$的整数,那么$p(E_{i_1}\cap E_{i_2}\cap \dots \cap E_{i_m})=p(E_{i_1})p(E_{i_2})\dots p(E_{i_m})$这些事件是相互独立的。 从定义5,我们可以看到每个$n$个相互独立事件的集合也是成对独立的。然而$n$个成对独立的时间并不一定是相互独立的。 (成对独立只对于两个事件之前,而相互独立是$n$个之间之间均独立,差别就在这里了) ###伯努利实验和二项分布(Bernoulli Trials and the Binomial Distribution) >每个具有两个可能结果的实验表现称之为*伯努利实验*。 >一般来说,伯努利实验的可能结果被称为*成功*或者*失败*. >定理2.实际上在$n$格独立伯努利实践中$k$个成功的概率,在成功的概率为$p$、失败的概率为$q=1-p$的条件下是$$C(n,k)p^kq^{n-k}$$. 我们也常写作$b(k;n,p)$.我们把这个函数(为什么叫function,不太明白)叫做二项分布。 $$\sum^n_{k=0}C(n,k)p^kq^{n-k}=(p+q)^n=1.\]

随机变量

定义6.一个随机变量是一个从实验的样本空间映射到实数集合的函数。因此,一个随机变量分配一个实数到每个可能结果。

注意:随机变量并不是变量,也不随机。

定义7.在样本空间\(S\)中的随机变量\(X\)的分配是对所有\(r \in X(S),p(X=r)\)\(X\)取值\(r\)的概率的对\((r,p(X=r))\)的集合。(在这个分配中的对的集合是由对\(r \in X(S)\)的概率\(p(X=r)\)决定的。)

生日问题

生日问题是寻找房间里最少的人数使得至少有2个人同一天生日的概率大于\(\frac12\).
答:首先,我们列出几条假设。我们假设在一个房间里的人们的生日均是独立的。更进一步,我们假设每个生日是等可能的并且一年里有366天。(实际上,在一年里更多的人出生在一年里的相同的一些日子里,比如包括新年在内的一些节日后的9个月里)
为了找到这个可能性,我们首先计算这些人有全部都有不同生日的概率\(p_n\)。然后,至少2个人有相同生日的概率为\(1-p_n\)。为了计算\(p_n\),我们姑且认定\(n\)个人的生日是遵循一定顺序的。想象一下,他们在一个时刻一个个进入房间;我们将会计算每个人进入房间时与已经在房间里的人的生日不同的概率。
第一个进入房间的人的生日当然不会匹配到任何在房间里的人的生日。第二个人的生日不同于第一个人的概率是$\cfrac{365}{366}因为当第二个人出生在除了第一个人的生日之外的\(365\)天里时,他们的生日是不同的。(这个对每个人出生在\(366\)天里任何一天等可能的假设保证了这个和后续步骤)
第三个人有不同生日的概率是\(\cfrac{364}{366}。延伸开来,对于第\)j\(个人(2 \leq j \leq 366),有一个不同于其他\)n-1\(个人的生日的概率是\)\(\cfrac{366-(j-1)}{366}=\cfrac{367-j}{366}.\)\( 因为已经假设在房间里的人的生日均是独立的,我们就可以得出结论这房间里的\)n\(个人有不同生日概率是\)\(p_n=\cfrac{365}{366}\cfrac{364}{366}\cfrac{363}{366}\dots \cfrac{367-n}{366}.\)\( 随之,我们得到\)\(1-p_n=1-\cfrac{365}{366}\cfrac{364}{366}\cfrac{363}{366}\dots \cfrac{367-n}{366}.\)\( 接下来为了找到最少的人数使得其概率大于\)\cfrac12\(,我们逐渐带入增大的\)n\(来计算(虽然可以用微积分,但是这里不使用。话说怎么用?我忘了)。我们会发现\)n=22,1-p_n \approx 0.475;n=23,1-p_n \approx 0.506\(。因此我们得知最少只要23个人即可使得房间内的人至少有2个人的生日相同的概率为\)\cfrac12$。

哈希的重合概率计算和生日问题类似。

posted @ 2015-12-02 21:19  sean10  阅读(797)  评论(2编辑  收藏  举报