概率笔记 P02：随机变量及其分布

1 随机变量及其分布函数

定义

随机变量：在样本空间上的实值函数\(X = X(\omega)\)。
分布函数：记函数\(F(x) = P\{X \le x\}\)为随机变量\(X\)的分布函数。

分布函数的性质

\(0 \le F(x) \le 1\)
\(F(-\infty) = 0, F(+\infty) = 1\)
\(x_1 \lt x_2 \implies F(x_1) \le F(x_2)\)
\(F(x)\)是右连续的，即\(F(x+0) = F(x)\)
对任意\(x_1 \lt x_2\)，有\(P\{x_1 \lt X \le x_2 \} = F(x_2) - F(x_1)\)
对任意\(x\)，有\(P\{X = x \} = F(x) - F(x-0)\)
只有满足以上条件的才能成为一个分布函数。
\(P\{X \le x\} = F(x), P\{X \lt x\} = F(x-0)\)

2 离散型随机变量、连续型随机变量

离散型

设离散型随机变量\(X\)的可能取值为\(x_1, x_2, \cdots, x_n, \cdots\)，\(X\)取各可能值的概率为\(P\{X = x_k \} = p_k, k = 1, 2, \cdots\),被称为离散型随机变量的概率分布或分布律。

分布律也可以表格的形式给出
\(\begin{array}{c|cccccc} X & x_1 & x_2 & \cdots & x_n & \cdots \\ \hline P & p_1 & p_2 & \cdots & p_n & \cdots \\ \end{array}\)

\(p_k \ge 0, k = 1, 2, \cdots\)
\(\displaystyle \sum_{i = 1}^{+\infty} p_k = 1\)

常用离散分布

\((0-1)\)分布：
\(\begin{array}{c|cc} X & 0 & 1 \\ \hline P & 1-p & p \\ \end{array}\)
伯努利分布/二项分布\(X \sim B(n, p)\)：\(P\{X = k \} = \mathrm C_n^k p^k (1-p)^{n-k}, k = 0, 1, 2, \cdots, n\)
泊松分布\(X \sim P(\lambda)\)：\(P\{X = k \} = \cfrac {\lambda^k}{k!} e^{-\lambda}, k = 0, 1, 2, \cdots\)
- 泊松定理：在伯努利实验中，\(p_n\)表示事件\(A\)在试验中出现的概率，它与试验总数\(n\)有关，如果\(\displaystyle \lim_{n \to \infty} np_n = \lambda\)，则\(\displaystyle \lim_{n \to \infty} \mathrm{C}_n^k p_n^k (1 - p_n)^{n-k} = \cfrac {\lambda^k}{k!} e^{-\lambda}\)
几何分布\(X \sim Ge(p)\)：\(P\{X = k\} = p(1-p)^{k-1}, k = 1, 2, \cdots\)
超几何分布\(X \sim H(N,M,n)\)：\(P\{X = k\} = \cfrac {\mathrm{C}_M^k \mathrm{C}_{N-M}^{n-k}}{\mathrm{C}_N^n}, k = l_1, \cdots, l_2\)，其中\(l_1 = \max(0, n-N+M), l_2 = \min(M,n)\)。如果\(N\)件产品中包含\(M\)件次品，从中任取一次取出\(n\)件，令\(X\)等于抽取的\(n\)件产品中的次品数，则\(X\)服从超几何分布。

连续型

若对于分布函数\(F(x)\)，存在一个非负可积函数\(f(x)\)，使得对任意实数\(x\)都有\(F(x) = \displaystyle \int_{-\infty}^x f(t)dt, -\infty \lt x \lt +\infty\)，称函数\(f(x)\)为连续型随机变量\(X\)的概率密度。

\(f(x) \gt 0\)
\(\displaystyle \int_{-\infty}^{+\infty} f(x)dx = 1\)
对任意实数\(x_1 \lt x_2\)，有\(P\{x_1 \lt X \lt x_2 \} = P\{x_1 \lt X \le x_2 \} = P\{x_1 \le X \lt x_2 \} = P\{x_1 \le X \le x_2 \} \\= \displaystyle \int_{x_1}^{x_2} f(t)dt = F(x_2) - F(x_1)\)
在\(f(x)\)的连续点处有\(F'(x) = f(x)\)

常用连续分布

均匀分布\(X \sim U(a, b)\)：概率密度为
\(f(x) = \begin{cases} \cfrac 1{b-a}, & a \lt x \lt b \\ 0, & others \\ \end{cases}\)
- 对于\(a \le c \lt d \le b\)，有\(P\{ c \lt X \le d \} = \cfrac {d-c}{b-a}\)
指数分布\(X \sim E(\lambda)\)：概率密度为\(f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \gt 0 \\ 0, & x \le 0\\ \end{cases}\)，分布函数为\(F(x) = \begin{cases} 1 - e^{-\lambda x}, & x\gt 0 \\ 0, & x \le 0 \\ \end{cases}\)
正态分布\(X \sim N(\mu, \sigma^2)\)：概率密度为\(f(x) = \cfrac 1{\sqrt{2\pi} \cdot \sigma} e^{-\frac {(x - \mu)^2}{2 \sigma^2}}, -\infty \lt x \lt +\infty\)。
- 当\(X \sim N(0, 1)\)时，分布函数为\(\varPhi = \cfrac 1{\sqrt{2\pi}} \displaystyle \int_{-\infty}^x e^{-\frac {t^2}2}dt\)。
- 当\(X \sim N(\mu, \sigma^2)\)时，分布函数为\(F(x) = \varPhi(\cfrac {x - \mu}\sigma)\)。
- \(P\{a \lt X \lt b\} = \varPhi(\cfrac {b-\mu}\sigma) - \varPhi(\cfrac {a-\mu}\sigma), a \lt b\)。
- 概率密度\(f(x)\)关于\(x = \mu\)对称。
- \(\varPhi(-x) = 1 - \varPhi(x)\)
- \(\varPhi(0) = \cfrac 12\)。
- \(P\{|X| \le a\} = 2\varPhi(a) - 1\)
补充：根据正态分布的概率密度，可以计算形如\(\displaystyle \int_{-\infty}^{+\infty} e^{-t^2}dx\)的积分

3 随机变量的函数的分布

离散型

设\(X\)的分布律为\(P\{X = x_k\} = p_k, k = 1, 2, \cdots\)，则\(X\)的函数\(Y = g(X)\)的分布律为\(P\{Y = g(x_k)\} = p_k, k = 1, 2, \cdots\)。如果在\(g(x_k)\)中有相同的数值，则将它们相应的概率和作为\(Y\)取该值的概率。

连续型

公式法：设\(X\)的概率密度为\(f_X(x)\)，又\(y = g(x)\)是单调、导数不为零的可导函数，\(h(y)\)是它的反函数，则\(X\)的函数\(Y = g(X)\)的概率密度为
\(f_Y(y) = \begin{cases} |h'(x)|f_X(h(y)), & \alpha \lt y \lt \beta \\ 0, & others \\ \end{cases}\)。
定义法：\(F_Y(y) = P\{Y \le y\} = P\{g(X) \le y\} = \displaystyle \int_{g(x) \le y} f_X(x)dx \\ f_Y(y) = F_Y'(y)\)。

posted @ 2020-07-28 20:50 ixtwuko 阅读(1906) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

Indie Moments

概率笔记 P02：随机变量及其分布

1 随机变量及其分布函数

定义

分布函数的性质

2 离散型随机变量、连续型随机变量

离散型

连续型

3 随机变量的函数的分布

离散型

连续型

公告