前置知识
期望 \(E[X]\) 即概率的加权平均。
期望具有线性,\(E[ax+b]=aE[x]+b\)。
方差 \(Var(x)=E[X^2]-E^2[x]\)。
类似的,\(Var(ax+b)=a^2Var(x)\)。
二项随机变量
定义
进行 \(n\) 次独立事件,每次成功的概率为 \(p\),失败的概率为 \(1-p\),那么成功 \(i\) 次的变量叫做二项随机变量,其参数为 \((n,p)\),其分布列为:
\[p(i)=\binom nip^i(1-p)^{n-i},i\ge0
\]
「运气轮」游戏:闲家从 \([1,6]\) 选 \(1\) 个数字。庄家扔 \(3\) 枚骰子,如果选取的数字出现了 \(i(1\le i\le3)\) 次,则闲家从庄家赢取 \(i\) 摩拉,否则庄家从闲家赢取 \(1\) 摩拉。
设 \(X\) 为闲家赢取的摩拉:
\[P\{X=-1\}=\binom30(\frac16)^0(\frac56)^3=\frac{125}{256}\\
P\{X=1\}=\binom31(\frac16)^1(\frac56)^2=\frac{75}{256}\\
P\{X=2\}=\binom32(\frac16)^2(\frac56)^1=\frac{15}{256}\\
P\{X=3\}=\binom33(\frac16)^3(\frac56)^0=\frac1{256}\\
E[X]=\frac{-125+75+2\times15+3\times1}{216}=-\frac{17}{216}
\]
期望、方差
\[\begin{aligned}
E[X^k]&=\sum_{i=0}^ni^k\binom nip^i(1-p)^{n-i}\\
&=\sum_{i=1}^ni^k\binom nip^i(1-p)^{n-i}\\
&=np\sum_{i=1}^ni^{k-1}\binom{n-1}{i-1}p^{i-1}(1-p)^{n-i}\\
&=np\sum_{i=1}^ni^{k-1}\binom{n-1}{i-1}p^{i-1}(1-p)^{n-(i-1)-1}\\
&=np\sum_{i=0}^{n-1}(i+1)^{k-1}\binom{n-1}ip^i(1-p)^{n-i-1}\\
\end{aligned}
\]
令 \(Y\) 为参数 \((n-1,p)\) 的二项随机变量,得到:
\[E[X^k]=npE[(Y+1)^{k-1}]
\]
带入 \(k=1\)
\[E[X]=npE[(Y+1)^0]=np
\]
带入 \(k=2\)
\[E[X^2]=npE[(Y+1)^1]=np((n-1)p+1)
\]
\[Var(x)=np((n-1)p+1)-(np)^2=np(1-p)
\]
泊松随机变量
定义
泊松随机变量,其参数为 \((\lambda)\),其分布列为:
\[p(i)=e^{-\lambda}\frac{\lambda^i}{i!},i\ge0
\]
参数为 \((n,p)\) 的二项随机变量在 \(n\) 充分大,\(p\) 足够小使得 \(np\) 适当时,可以近似看作参数为 \(\lambda=np\) 的泊松随机变量。
\[\begin{aligned}
\binom nip^i(1-p)^{n-i}&=\binom ni(\frac\lambda n)^i(1-\frac\lambda n)^{n-i}\\
&=\frac{n^{\underline i}\lambda^i(1-\frac\lambda n)^n}{i!n^i(1-\frac\lambda n)^i}\\
&=(1-\frac\lambda n)^n\frac{\lambda^i}{i!}\frac{n^{\underline i}}{n!}(1-\frac\lambda n)^i\\
&\approx e^{-\lambda}\frac{\lambda^i}{i!}
\end{aligned}
\]
制作甜甜花酿鸡的失败率为 \(0.1\),计算生产 \(10\) 个甜甜花酿鸡失败次数不超过 \(1\) 次的概率。
可以运用二项随机变量,\(\binom{10}0\times0.1^0+0.9^{10}+\binom{10}1\times0.1^1+0.9^9=0.7361\)。
可以用泊松随机变量求得一个近似解,\(\lambda=np=0.1\times10=1\),那么 \(e^{-1}(\frac{1^0}{0!}+\frac{1^1}{1!})=2e^{-1}\approx0.735759\),算出来还是很接近的。
稻妻的核废水有放射性,每秒平均放出 \(3.2\) 个雷元素,计算放出的雷元素不超过 \(2\) 概率的 近似值。
设有 \(n\) 个分子有放射性(\(n\) 足够大),那么每个分子每秒放出雷元素的概率为 \(\frac{3.2}n\),那么 \(\lambda=3.2\)。
用泊松随机变量,\(e^{-3.2}(\frac{3.2^0}{0!}+\frac{3.2^1}{1!}+\frac{3.2^2}{2!})\approx0.379904\)。
有 \(n\) 个人,那么有 \(\binom n2\) 个无序二元组关系,其中两个人生日相等的概率为 \(\frac1{365}\),所以 \(\lambda=\binom n2\frac1{365}=\frac{n(n-1)}{730}\)。
不存在生日重合的概率就是 \(\exp(-\frac{n(n-1)}{730})\)。
同理,如果求不存在三个人生日相同的概率,那么 \(\lambda=\binom n3(\frac1{365})^2\),不存在三个人生日重合的概率就是 \(\exp(-\binom n3(\frac1{365})^2)\)。
不过以上都是用泊松随机分布算出的近似解。实际上,只要满足各个事件发生的概率较小,并且独立(或者弱相关),就可以看作泊松随机分布。
期望、方差
根据二项随机变量的猜测,\(E[X]=np=\lambda\),\(Var(X)=np(1-p)\approx np=\lambda\),也就是说 \(E[X]=Var[X]=\lambda\)?确实如此,接下来证明。
\[\begin{aligned}
E[X]&=\sum_{i=0}^\infty\frac{ie^{-\lambda}\lambda^i}{i!}\\
&=\sum_{i=1}^\infty\frac{ie^{-\lambda}\lambda^i}{i!}\\
&=\lambda\sum_{i=1}^\infty\frac{e^{-\lambda}\lambda^{i-1}}{(i-1)!}\\
&=\lambda\sum_{i=0}^\infty\frac{e^{-\lambda}\lambda^i}{i!}\\
&=\lambda e^{-\lambda}\sum_{i=0}^\infty\frac{\lambda^i}{i!}\\
&=\lambda e^{-\lambda}e^\lambda\\
&=\lambda
\end{aligned}
\]
\[\begin{aligned}
E[X^2]&=\sum_{i=0}^\infty\frac{i^2e^{-\lambda}\lambda^i}{i!}\\
&=\sum_{i=1}^\infty\frac{i^2e^{-\lambda}\lambda^i}{i!}\\
&=\lambda\sum_{i=1}^\infty\frac{i^2e^{-\lambda}\lambda^{i-1}}{i!}\\
&=\lambda\sum_{i=1}^\infty\frac{ie^{-\lambda}\lambda^{i-1}}{(i-1)!}\\
&=\lambda\sum_{i=0}^\infty\frac{(i+1)e^{-\lambda}\lambda^i}{i!}\\
&=\lambda(\sum_{i=0}^\infty\frac{ie^{-\lambda}\lambda^i}{i!}+\sum_{i=0}^\infty\frac{e^{-\lambda}\lambda^i}{i!})\\
&=\lambda(\lambda+1)
\end{aligned}
\]
\[Var(X)=E[X^2]-E^2[X]=\lambda(\lambda+1)-\lambda^2=\lambda
\]
几何随机变量
定义
重复进行独立事件,每次成功的概率为 \(p\),失败的概率为 \(1-p\),那么第 \(i\) 次时第一次成功的变量叫做几何随机变量,其参数为 \((p)\),其分布列为:
\[p(i)=(1-p)^{i-1}p,i\ge r
\]
不难证明到最后成功的概率为 \(1\)。
\[\sum_{i=1}^\infty(1-p)^ip=p\sum_{i=1}^\infty(1-p)^i=\frac{p}{1-(1-p)}=1
\]
期望、方差
记 \(q=1-p\)
\[\begin{aligned}
E[X]&=\sum_{i=1}^\infty iq^{i-1}p\\
&=\sum_{i=1}^\infty(i-1+1)q^{i-1}p\\
&=\sum_{i=1}^\infty(i-1)q^{i-1}p+\sum_{i=1}^\infty q^{i-1}p\\
&=\sum_{i=0}^\infty iq^ip+1\\
&=q\sum_{i=0}^\infty iq^{i-1}p+1\\
&=qE[X]+1
\end{aligned}
\]
\[E[X]=\frac1{1-q}=\frac1p
\]
\[\begin{aligned}
E[X^2]&=\sum_{i=1}^\infty i^2q^{i-1}p\\
&=\sum_{i=1}^\infty(i-1+1)^2q^{i-1}p\\
&=\sum_{i=1}^\infty(i-1)^2q^{i-1}p+\sum_{i=1}^\infty2(i-1)q^{i-1}p+\sum_{i=1}^\infty q^{i-1}p\\
&=\sum_{i=0}^\infty i^2q^ip+2\sum_{i=0}^\infty iq^ip+1\\
&=qE[X^2]+2qE[X]+1
\end{aligned}
\]
\[E[X^2]=\frac{2q+p}{p^2}=\frac{q+1}{p^2}
\]
\[Var(X)=\frac{q+1}{p^2}-\frac1{p^2}=\frac{1-p}{p^2}
\]
负二项随机变量
定义
重复进行独立事件,每次成功的概率为 \(p\),失败的概率为 \(1-p\),那么第 \(i\) 次后满足累计 \(r\) 次成功的变量叫做负二项随机变量,其参数为 \((r,p)\),其分布列为:
\[\binom{i-1}{r-1}p^r(1-p)^{n-r},i\ge1
\]
因为负二项随机变量相当于 \(r\) 个几何随机变量叠加,所以其结束的概率必然为 \(1\)。
参数为 \((p)\) 的几何随机变量就是参数为 \((1,p)\) 的负二项随机变量。
温迪摘花瓣,有两朵花各有 \(n\) 片花瓣。每次温迪随机从一朵花上摘除一片花瓣,问他第一次试图从摘空的花上摘花瓣,另一朵花有 \(k\) 片花瓣的概率。
这个事件只会发生在第 \(2n-k+1\) 次摘花瓣时,这朵花现在摘了 \(n+1\) 次,满足参数为 \((n+1,\frac12)\) 的负二项随机变量,所以概率就是 \(\binom{2n-k}n(\frac12)^{2n-k+1}\)。
\[\begin{aligned}
E[X^k]&=\sum_{i=r}^\infty i^k\binom{i-1}{r-1}p^r(1-p)^{i-r}\\
&=\frac rp\sum_{i=r}^\infty i^{k-1}\binom irp^{r+1}(1-p)^{i-r}\\
&=\frac rp\sum_{i=r+1}^\infty(i-1)^{k-1}\binom{i-1}rp^{r+1}(1-p)^{i-(r+1)}
\end{aligned}
\]
令 \(Y\) 为参数 \((r+1,p)\) 的负二项随机变量,得到:
\[E[X^k]=\frac rpE[(Y-1)^{k-1}]
\]
带入 \(k=1\)
\[E[X]=\frac rp
\]
带入 \(k=2\)
\[E[X^2]=\frac rpE[Y-1]=\frac rp(\frac{r+1}p-1)
\]
\[Var(X)=\frac rp(\frac{r+1}p-1)-(\frac rp)^2=\frac{r(1-p)}{p^2}
\]
超几何随机变量
定义
一个罐子有 \(N\) 个球,其中 \(m\) 个关键球,\(N-m\) 个无关球,随机不放回取出 \(n\) 个球,取出的白球数叫做超几何随机变量,其参数为 \((n,N,m)\),其分布列为:
\[\frac{\binom mi\binom{N-m}{n-i}}{\binom Nn},0\le i\le n
\]
当 \(N,m\gg n,i\) 时,放回和不放回类似,那么这个超几何随机变量就近似于参数为 \((n,\frac mN)\) 的二项随机变量。
\[\begin{aligned}
E[X^k]&=\sum_{i=0}^ni^k\frac{\binom mi\binom{N-m}{n-i}}{\binom Nn}\\
&=\sum_{i=1}^ni^k\frac{\binom mi\binom{N-m}{n-i}}{\binom Nn}\\
&=\frac{nm}N\sum_{i=1}^ni^{k-1}\frac{\binom{m-1}{i-1}\binom{N-m}{n-i}}{\binom{N-1}{n-1}}\\
&=\frac{nm}N\sum_{i=0}^{n-1}(i+1)^{k-1}\frac{\binom{m-1}i\binom{N-m}{n-i-1}}{\binom{N-1}{n-1}}\\
\end{aligned}
\]
令 \(Y\) 为参数 \((n-1,N-1,m-1)\) 的负二项随机变量,得到:
\[E[X^k]=\frac{nm}NE[(Y+1)^{k-1}]
\]
令 \(k=1\)
\[E[X]=\frac{nm}N
\]
令 \(k=2\)
\[E[X^2]=\frac{nm}NE[Y+1]=\frac{nm}N(\frac{(n-1)(m-1)}{N-1}+1)
\]
令 \(p=\frac mN\)
\[Var(X)=np(1-p)(1-\frac{n-1}{N-1})
\]