概率笔记 P02:随机变量及其分布

1 随机变量及其分布函数

定义

  • 随机变量:在样本空间上的实值函数\(X = X(\omega)\)
  • 分布函数:记函数\(F(x) = P\{X \le x\}\)为随机变量\(X\)的分布函数。

分布函数的性质

  • \(0 \le F(x) \le 1\)
  • \(F(-\infty) = 0, F(+\infty) = 1\)
  • \(x_1 \lt x_2 \implies F(x_1) \le F(x_2)\)
  • \(F(x)\)是右连续的,即\(F(x+0) = F(x)\)
  • 对任意\(x_1 \lt x_2\),有\(P\{x_1 \lt X \le x_2 \} = F(x_2) - F(x_1)\)
  • 对任意\(x\),有\(P\{X = x \} = F(x) - F(x-0)\)
  • 只有满足以上条件的才能成为一个分布函数。
  • \(P\{X \le x\} = F(x), P\{X \lt x\} = F(x-0)\)

2 离散型随机变量、连续型随机变量

离散型

设离散型随机变量\(X\)的可能取值为\(x_1, x_2, \cdots, x_n, \cdots\)\(X\)取各可能值的概率为\(P\{X = x_k \} = p_k, k = 1, 2, \cdots\),被称为离散型随机变量的概率分布或分布律。

分布律也可以表格的形式给出
\(\begin{array}{c|cccccc} X & x_1 & x_2 & \cdots & x_n & \cdots \\ \hline P & p_1 & p_2 & \cdots & p_n & \cdots \\ \end{array}\)

  • \(p_k \ge 0, k = 1, 2, \cdots\)
  • \(\displaystyle \sum_{i = 1}^{+\infty} p_k = 1\)

常用离散分布

  • \((0-1)\)分布:
    \(\begin{array}{c|cc} X & 0 & 1 \\ \hline P & 1-p & p \\ \end{array}\)
  • 伯努利分布/二项分布\(X \sim B(n, p)\)\(P\{X = k \} = \mathrm C_n^k p^k (1-p)^{n-k}, k = 0, 1, 2, \cdots, n\)
  • 泊松分布\(X \sim P(\lambda)\)\(P\{X = k \} = \cfrac {\lambda^k}{k!} e^{-\lambda}, k = 0, 1, 2, \cdots\)
    • 泊松定理:在伯努利实验中,\(p_n\)表示事件\(A\)在试验中出现的概率,它与试验总数\(n\)有关,如果\(\displaystyle \lim_{n \to \infty} np_n = \lambda\),则\(\displaystyle \lim_{n \to \infty} \mathrm{C}_n^k p_n^k (1 - p_n)^{n-k} = \cfrac {\lambda^k}{k!} e^{-\lambda}\)
  • 几何分布\(X \sim Ge(p)\)\(P\{X = k\} = p(1-p)^{k-1}, k = 1, 2, \cdots\)
  • 超几何分布\(X \sim H(N,M,n)\)\(P\{X = k\} = \cfrac {\mathrm{C}_M^k \mathrm{C}_{N-M}^{n-k}}{\mathrm{C}_N^n}, k = l_1, \cdots, l_2\),其中\(l_1 = \max(0, n-N+M), l_2 = \min(M,n)\)。如果\(N\)件产品中包含\(M\)件次品,从中任取一次取出\(n\)件,令\(X\)等于抽取的\(n\)件产品中的次品数,则\(X\)服从超几何分布。

连续型

若对于分布函数\(F(x)\),存在一个非负可积函数\(f(x)\),使得对任意实数\(x\)都有\(F(x) = \displaystyle \int_{-\infty}^x f(t)dt, -\infty \lt x \lt +\infty\),称函数\(f(x)\)为连续型随机变量\(X\)的概率密度。

  • \(f(x) \gt 0\)
  • \(\displaystyle \int_{-\infty}^{+\infty} f(x)dx = 1\)
  • 对任意实数\(x_1 \lt x_2\),有\(P\{x_1 \lt X \lt x_2 \} = P\{x_1 \lt X \le x_2 \} = P\{x_1 \le X \lt x_2 \} = P\{x_1 \le X \le x_2 \} \\= \displaystyle \int_{x_1}^{x_2} f(t)dt = F(x_2) - F(x_1)\)
  • \(f(x)\)的连续点处有\(F'(x) = f(x)\)

常用连续分布

  • 均匀分布\(X \sim U(a, b)\):概率密度为
    \(f(x) = \begin{cases} \cfrac 1{b-a}, & a \lt x \lt b \\ 0, & others \\ \end{cases}\)
    • 对于\(a \le c \lt d \le b\),有\(P\{ c \lt X \le d \} = \cfrac {d-c}{b-a}\)
  • 指数分布\(X \sim E(\lambda)\):概率密度为\(f(x) = \begin{cases} \lambda e^{-\lambda x}, & x \gt 0 \\ 0, & x \le 0\\ \end{cases}\),分布函数为\(F(x) = \begin{cases} 1 - e^{-\lambda x}, & x\gt 0 \\ 0, & x \le 0 \\ \end{cases}\)
  • 正态分布\(X \sim N(\mu, \sigma^2)\):概率密度为\(f(x) = \cfrac 1{\sqrt{2\pi} \cdot \sigma} e^{-\frac {(x - \mu)^2}{2 \sigma^2}}, -\infty \lt x \lt +\infty\)
    • \(X \sim N(0, 1)\)时,分布函数为\(\varPhi = \cfrac 1{\sqrt{2\pi}} \displaystyle \int_{-\infty}^x e^{-\frac {t^2}2}dt\)
    • \(X \sim N(\mu, \sigma^2)\)时,分布函数为\(F(x) = \varPhi(\cfrac {x - \mu}\sigma)\)
    • \(P\{a \lt X \lt b\} = \varPhi(\cfrac {b-\mu}\sigma) - \varPhi(\cfrac {a-\mu}\sigma), a \lt b\)
    • 概率密度\(f(x)\)关于\(x = \mu\)对称。
    • \(\varPhi(-x) = 1 - \varPhi(x)\)
    • \(\varPhi(0) = \cfrac 12\)
    • \(P\{|X| \le a\} = 2\varPhi(a) - 1\)
  • 补充:根据正态分布的概率密度,可以计算形如\(\displaystyle \int_{-\infty}^{+\infty} e^{-t^2}dx\)的积分

3 随机变量的函数的分布

离散型

\(X\)的分布律为\(P\{X = x_k\} = p_k, k = 1, 2, \cdots\),则\(X\)的函数\(Y = g(X)\)的分布律为\(P\{Y = g(x_k)\} = p_k, k = 1, 2, \cdots\)。如果在\(g(x_k)\)中有相同的数值,则将它们相应的概率和作为\(Y\)取该值的概率。

连续型

  • 公式法:设\(X\)的概率密度为\(f_X(x)\),又\(y = g(x)\)是单调、导数不为零的可导函数,\(h(y)\)是它的反函数,则\(X\)的函数\(Y = g(X)\)的概率密度为
    \(f_Y(y) = \begin{cases} |h'(x)|f_X(h(y)), & \alpha \lt y \lt \beta \\ 0, & others \\ \end{cases}\)
  • 定义法:\(F_Y(y) = P\{Y \le y\} = P\{g(X) \le y\} = \displaystyle \int_{g(x) \le y} f_X(x)dx \\ f_Y(y) = F_Y'(y)\)
posted @ 2020-07-28 20:50  ixtwuko  阅读(1906)  评论(0编辑  收藏  举报