声明
本文基于人教版高中数学选修 2-3,本中随机变量均为离散型随机变量。
本文中 \(\displaystyle\sum_x\) 为 \(\displaystyle\sum_{x \in Range(X)}\)(\(Range(X)\) 表示随机变量 \(X\) 可能的取值的集合)的简写。
期望
期望的线性性质
\[\boxed{E(aX+b) = aE(X)+b}
\]
课本上就有,证明略。
公式 1
\[\boxed{E(X+Y)=E(X)+E(Y)}
\]
证明
\[\begin{aligned}
E(X+Y) &=\sum_{x} \sum_{y}(x+y) P(X=x, Y=y) \\
&=\sum_{x} \sum_{y} x P(X=x, Y=y)+\sum_{x} \sum_{y} y P(X=x, Y=y) \\
&=\sum_{x} x \sum_{y} P(X=x, Y=y)+\sum_{y} y \sum_{x} P(X=x, Y=y) \\
&=\sum_{x} x P(X=x)+\sum_{y} y P(Y=y) \\
&=E(X)+E(Y)
\end{aligned}
\]
公式 2
在 \(X,Y\) 相互独立的情况下,有
\[\boxed{E(XY)=E(X)E(Y)}
\]
证明
由 \(X,Y\) 相互独立知 \(P(X=x,Y=y)=P(X=x)P(Y=y)\)
所以
\[\begin{aligned}
E(XY) &=\sum_{x} \sum_{y} xy P(X=x, Y=y) \\
&=\sum_{x} \sum_{y} xy P(X=x)P(Y=y) \\
&=\sum_{x} x P(X=x)\sum_{y} yP(Y=y) \\
&=\sum_{x} x P(X=x)E(Y) \\
&=E(Y)\sum_{x} x P(X=x) \\
&=E(X)E(Y)
\end{aligned}
\]
方差
定义
\[\boxed{D(X)=\sum_x (x-E(X))^2 P(X=x)}
\]
换种写法
\[\boxed{D(X)=E(x-E(X))^2}
\]
再换种写法
\[\begin{aligned}
D(X) &= E[X-E(X)]^2 \\
&=E[X^2-2X\cdot E(X)+(E(X))^2] \\
&=E(X^2)-2E(X)E(X)+(E(X))^2 \\
&=E(X^2)-(E(X))^2
\end{aligned}
\]
即
\[\boxed{D(X)=E(X^2)-(E(X))^2 }
\]
公式 1
\[\boxed{D(aX+b) = a^2D(X)}
\]
课本上就有,证明略。
公式 2
在 \(X,Y\) 相互独立的情况下,有
\[\boxed{D(X+Y)=D(X)+D(Y)}
\]
证明
\[\begin{aligned}
D(X+Y) &= E{(X+Y)^2 - (E(X+Y))^2} \\
&= E{(X^2+Y^2+2XY) - (E(X)+E(Y))^2} \\
&= E(X^2 - E^2(X)) + E(Y^2 - E^2(Y))+ E(2XY) - 2E(X) E(Y) \\
&= D(X) + D(Y) + 0
\end{aligned}
\]
即:\(D(X+Y) = D(X) + D(Y)\)
超几何分布
定义
\(N\) 个物品中有 \(M\) 个次品,超几何分布描述了在这 \(N\) 个样本中选 \(n\) 个,其中有 \(k\) 个次品的概率。
\[P(X = k) = \frac{C_M^k C_{N - M}^{n - k}}{C_N^n}
\]
若随机变量 \(X\) 服从参数为 \(n, M, N\) 的超几何分布,则记为
\[x \sim H(n, M, N)
\]
期望
若 \(x \sim H(n, M, N)\),则
\[\boxed{E(X) = \frac{nM}{N}}
\]
证明
引理 1
由组合数公式可以得到 \(k \cdot C_M^k = M \cdot C_{M - 1}^{k - 1}\)
引理 2
由组合数公式可以得到 \(C_{N}^n = \dfrac Nn \cdot C_{N - 1}^{n - 1}\)
引理 3
由超几何分布概率和为 \(1\),即 \(\displaystyle \sum_{k=0}^m P(X=k) = \sum_{k = 0}^m \frac{C_M^k C_{N - M}^{n - k}}{C_N^n} = 1\)
可得 \(\displaystyle\sum_{k = 0}^m C_M^k C_{N - M}^{n - k} = C_N^n\)
推导过程
\[\begin{aligned} E(x) &= \sum_{k = 0}^m k * \frac{C_M^k * C_{N - M}^{n - k}}{C_N^n} \\ &=\frac{1}{C_N^n} \sum_{k = 0}^m k C_M^K * C_{N - M}^{n - k}\\ &=\frac{1}{C_N^n} \sum_{k = 1}^m M C_{M - 1}^{k - 1} C_{N - M}^{n - k}\\ &=\frac{M}{C_N^n} \sum_{k = 1}^m C_{M - 1}^{k - 1}C_{N - M}^{n - k}\\ &=\frac{M}{C_N^n} C_{N - 1}^{n - 1} \\ &=\frac{nM}{N} \end{aligned}
\]
方差
\[D(x) = {n(\frac{M}{N})(1-\frac{M}{N})(N-n) \over (N-1)}
\]
二项分布
定义
二项分布(Binomial distribution)是 \(n\) 个 独立重复试验中成功的次数的离散概率分布,其中每次试验的成功概率为 \(p\)。这样的单次成功/失败试验又称为 伯努利试验。
实际上,当 \(n = 1\) 时,二项分布就是两点分布。
一般地,如果随机变量 \(X\) 服从参数 \(n\) 和 \(p\) 的二项分布,我们记 \(x \sim b(n, p)\) 或 \(X \sim B(n, p)\). \(n\) 次试验中正好得到 \(k\) 次成功的概率为
\[P(x = k) = C_n^k \ p^k \ (1-p)^{n- k}
\]
期望
若 \(X\sim B(n,p)\),则
\[\boxed{E(x) = np}
\]
证明
简单的证明
记
\[x_i = \begin{cases}
1 & \text{第 $i$ 次试验成功}\\
0 & \text{第 $i$ 次试验不成功}
\end{cases}
\]
显然 \(E(x_i)=p\)
由于 \(X=x_1+x_2+\cdots+x_n\),根据期望的线性性质,
\(E(X) = E(x_1) + E(x_2) + \cdots + E(x_n) = np\)
复杂的证明
记 \(q = 1-p\),那么
\[\begin{aligned}
E(X) &= \sum_{k=0}^n k P(X=k)\\
&= \sum_{k=0}^n k C_{n}^{k}p^kq^{n-k} \\
&= \sum_{k=1}^n k C_{n}^{k}p^kq^{n-k} \\
&= p\sum_{k=1}^n nC_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)}\\
&= np\sum_{k=1}^n C_{n-1}^{k-1}p^{k-1}q^{(n-1)-(k-1)} \\
&= np\cdot (p+q)^{n-1} \qquad \text{(二项式定理)}\\
&= np
\end{aligned}
\]
方差
\[\boxed{D(x) = np(1 - p)}
\]
证明
简单的方法
类似于期望的那种证明方法。
复杂的方法
\[\begin{aligned}
D(X) &=\sum_{k=0}^{n}\left[k-E(X)\right]^{2} \cdot p_{k}=\sum_{k=0}^{n}(k-n p)^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&=\sum_{k=0}^{n} k^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n}-2 n p k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n} n^{2} p^{2} \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&=\sum_{k=0}^{n}(k-1) \cdot k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+\sum_{k=0}^{n} k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}-2 n p \sum_{k=0}^{n} k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&+n^{2} p^{2} \sum_{k=0}^{n} \mathrm{C}_{n}^{k} p^{k} q^{n-k} \\
&=\sum_{k=1}^{n}(k-1) \cdot k \cdot \mathrm{C}_{n}^{k} p^{k} q^{n-k}+n p-2 n p \cdot n p+n^{2} p^{2} \\
&=n \sum_{k=2}^{n}(k-1) \cdot \mathrm{C}_{n-1}^{k-1} p^{k} q^{n-k}+n p-n^{2} p^{2} \\
&=n(n-1) p^{2} \sum_{k=2}^{n} \mathrm{C}_{n-2}^{k-2} p^{k-2} q^{(n-2)-(k-2)}+n p-n^{2} p^{2} \quad(\text{令} k-2=i) \\
&=n(n-1) p^{2} \sum_{i=0}^{n-2} \mathrm{C}_{n-2}^{i} p^{i} q^{(n-2)-i}+n p-n^{2} p^{2} \\
&=n(n-1) p^{2}+n p-n^{2} p^{2} \\
&=n p q
\end{aligned}
\]