概率笔记 P02:随机变量及其分布
1 随机变量及其分布函数
定义
- 随机变量:在样本空间上的实值函数\(X = X(\omega)\)。
- 分布函数:记函数\(F(x) = P\{X \le x\}\)为随机变量\(X\)的分布函数。
分布函数的性质
- \(0 \le F(x) \le 1\)
- \(F(-\infty) = 0, F(+\infty) = 1\)
- \(x_1 \lt x_2 \implies F(x_1) \le F(x_2)\)
- \(F(x)\)是右连续的,即\(F(x+0) = F(x)\)
- 对任意\(x_1 \lt x_2\),有\(P\{x_1 \lt X \le x_2 \} = F(x_2) - F(x_1)\)
- 对任意\(x\),有\(P\{X = x \} = F(x) - F(x-0)\)
- 只有满足以上条件的才能成为一个分布函数。
- \(P\{X \le x\} = F(x), P\{X \lt x\} = F(x-0)\)
2 离散型随机变量、连续型随机变量
离散型
设离散型随机变量\(X\)的可能取值为\(x_1, x_2, \cdots, x_n, \cdots\),\(X\)取各可能值的概率为\(P\{X = x_k \} = p_k, k = 1, 2, \cdots\),被称为离散型随机变量的概率分布或分布律。
分布律也可以表格的形式给出
\(\begin{array}{c|cccccc} X & x_1 & x_2 & \cdots & x_n & \cdots \\ \hline P & p_1 & p_2 & \cdots & p_n & \cdots \\ \end{array}\)
- \(p_k \ge 0, k = 1, 2, \cdots\)
- \(\displaystyle \sum_{i = 1}^{+\infty} p_k = 1\)
常用离散分布
- \((0-1)\)分布:
\(\begin{array}{c|cc} X & 0 & 1 \\ \hline P & 1-p & p \\ \end{array}\) - 伯努利分布/二项分布\(X \sim B(n, p)\):\(P\{X = k \} = \mathrm C_n^k p^k (1-p)^{n-k}, k = 0, 1, 2, \cdots, n\)
- 泊松分布\(X \sim P(\lambda)\):\(P\{X = k \} = \cfrac {\lambda^k}{k!} e^{-\lambda}, k = 0, 1, 2, \cdots\)
- 泊松定理:在伯努利实验中,\(p_n\)表示事件\(A\)在试验中出现的概率,它与试验总数\(n\)有关,如果\(\displaystyle \lim_{n \to \infty} np_n = \lambda\),则\(\displaystyle \lim_{n \to \infty} \mathrm{C}_n^k p_n^k (1 - p_n)^{n-k} = \cfrac {\lambda^k}{k!} e^{-\lambda}\)
- 几何分布\(X \sim Ge(p)\):\(P\{X = k\} = p(1-p)^{k-1}, k = 1, 2, \cdots\)
- 超几何分布\(X \sim H(N,M,n)\):\(P\{X = k\} = \cfrac {\mathrm{C}_M^k \mathrm{C}_{N-M}^{n-k}}{\mathrm{C}_N^n}, k = l_1, \cdots, l_2\),其中\(l_1 = \max(0, n-N+M), l_2 = \min(M,n)\)。如果\(N\)件产品中包含\(M\)件次品,从中任取一次取出\(n\)件,令\(X\)等于抽取的\(n\)件产品中的次品数,则\(X\)服从超几何分布。
连续型
若对于分布函数\(F(x)\),存在一个非负可积函数\(f(x)\),使得对任意实数\(x\)都有\(F(x) = \displaystyle \int_{-\infty}^x f(t)dt, -\infty \lt x \lt +\infty\),称函数\(f(x)\)为连续型随机变量\(X\)的概率密度。
- \(f(x) \gt 0\)
- \(\displaystyle \int_{-\infty}^{+\infty} f(x)dx = 1\)
- 对任意实数\(x_1 \lt x_2\),有\(P\{x_1 \lt X \lt x_2 \} = P\{x_1 \lt X \le x_2 \} = P\{x_1 \le X \lt x_2 \} = P\{x_1 \le X \le x_2 \} \\= \displaystyle \int_{x_1}^{x_2} f(t)dt = F(x_2) - F(x_1)\)
- 在\(f(x)\)的连续点处有\(F'(x) = f(x)\)
常用连续分布
- 均匀分布\(X \sim U(a, b)\):概率密度为
\(f(x) = \begin{cases} \cfrac 1{b-a}, & a \lt x \lt b \\ 0, & others \\ \end{cases}\)- 对于\(a \le c \lt d \le b\),有\(P\{ c \lt X \le d \} = \cfrac {d-c}{b-a}\)
- 指数分布\(X \sim E(\lambda)\):概率密度为\(f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \gt 0 \\ 0, & x \le 0\\ \end{cases}\),分布函数为\(F(x) = \begin{cases} 1 - e^{-\lambda x}, & x\gt 0 \\ 0, & x \le 0 \\ \end{cases}\)
- 正态分布\(X \sim N(\mu, \sigma^2)\):概率密度为\(f(x) = \cfrac 1{\sqrt{2\pi} \cdot \sigma} e^{-\frac {(x - \mu)^2}{2 \sigma^2}}, -\infty \lt x \lt +\infty\)。
- 当\(X \sim N(0, 1)\)时,分布函数为\(\varPhi = \cfrac 1{\sqrt{2\pi}} \displaystyle \int_{-\infty}^x e^{-\frac {t^2}2}dt\)。
- 当\(X \sim N(\mu, \sigma^2)\)时,分布函数为\(F(x) = \varPhi(\cfrac {x - \mu}\sigma)\)。
- \(P\{a \lt X \lt b\} = \varPhi(\cfrac {b-\mu}\sigma) - \varPhi(\cfrac {a-\mu}\sigma), a \lt b\)。
- 概率密度\(f(x)\)关于\(x = \mu\)对称。
- \(\varPhi(-x) = 1 - \varPhi(x)\)
- \(\varPhi(0) = \cfrac 12\)。
- \(P\{|X| \le a\} = 2\varPhi(a) - 1\)
- 补充:根据正态分布的概率密度,可以计算形如\(\displaystyle \int_{-\infty}^{+\infty} e^{-t^2}dx\)的积分
3 随机变量的函数的分布
离散型
设\(X\)的分布律为\(P\{X = x_k\} = p_k, k = 1, 2, \cdots\),则\(X\)的函数\(Y = g(X)\)的分布律为\(P\{Y = g(x_k)\} = p_k, k = 1, 2, \cdots\)。如果在\(g(x_k)\)中有相同的数值,则将它们相应的概率和作为\(Y\)取该值的概率。
连续型
- 公式法:设\(X\)的概率密度为\(f_X(x)\),又\(y = g(x)\)是单调、导数不为零的可导函数,\(h(y)\)是它的反函数,则\(X\)的函数\(Y = g(X)\)的概率密度为
\(f_Y(y) = \begin{cases} |h'(x)|f_X(h(y)), & \alpha \lt y \lt \beta \\ 0, & others \\ \end{cases}\)。 - 定义法:\(F_Y(y) = P\{Y \le y\} = P\{g(X) \le y\} = \displaystyle \int_{g(x) \le y} f_X(x)dx \\ f_Y(y) = F_Y'(y)\)。