03 多维随机变量及其分布 | 概率论与数理统计

1. 二维随机变量

二维随机变量：设 $E$ 是一个随机试验, 样本空间 $S = e$ . 设 $X = X (e)$ 和 $Y = Y (e)$ 是定义在 $S$ 上的两个随机变量, 向量 $(X, Y)$ 叫做二维随机向量或二维随机变量
$n$ 维随机变量：设随机试验 $E$ 的样本空间 $S = e . X_{1}, X_{2}, \dots, X_{n}$ 是定义在 $S$ 上的 $n$ 个随机变量, 则称向量 $(X_{1}, X_{2}, \dots, X_{n})$ 为 $n$ 维随机变量（向量）
分布函数：设 $(X, Y)$ 是二维随机变量, 对于任意实数 $x, y$ ,有 $F (x) = P {(X \leq x) \cap (Y \leq y)} = P {X \leq x, Y \leq y}$ 称 $F (x, y)$ 为二维随机变量 $(X, Y)$ 的 分布函数,或称为随机变量 $X$ 和 $Y$ 的 联合分布函数
1. $F (x, y)$ 是变量 $x$ 和 $y$ 不减函数
2. $0 \leq F (x, y) \leq 1$ $F (- \infty, y) = F (x, - \infty) = F (- \infty, - \infty) = 0, F (+ \infty, + \infty) = 1$
3. $F (x, y)$ 关于 $x$ 右连续, 关于 $y$ 右连续
4. 对于任意 $x_{1} < x_{2}, y_{1} < y_{2}$ ，有
  $P {x_{1} < X \leq x_{2}, y_{1} < Y \leq y_{2}} = F (x_{2}, y_{2}) - F (x_{2}, y_{1}) + F (x_{1}, y_{1}) - F (x_{1}, y_{2}) \geq 0$

2. 二维离散型随机变量

定义： $(X, Y)$ 的所有可能取值是有限对或可列无限多对
二维离散 $(X, Y)$ 的分布律(联合分布律): $(X, Y)$ 的所有可能取值 $(x_{i}, y_{j}), P (X = x_{i}, Y = y_{i}) = p_{i j}$
分布律性质
1. $0 \leq p_{i j} \leq 1$
2. $\sum_{j = 1}^{+ \infty} \sum_{i = 1}^{\infty} p_{i j} = 1$
3. $F (x, y) = \sum_{x_{i} \leq x, y_{i} \leq y} p_{i j}$
二维连续型随机变量
1. 定义：设二维随机变量 $(X, Y)$ 的分布函数为 $F (x, y)$ , 若存在一个非负函数 $f (x, y)$ ，使得对任意 $x, y$ ，有如下式子，则称 $(X, Y)$ 为 二维连续型随机变量， $f (x, y)$ 称为 $(X, Y)$ 的概率密度，或称为 $X$ 和 $Y$ 的 联合概率密度
  $F (x, y) = \int_{- \infty}^{y} \int_{- \infty}^{x} f (u, v) d u d v$
2. 概率密度性质
  1. $f (x, y) \geq 0$
  2. $\int_{- \infty}^{\infty} \int_{- \infty}^{\infty} f (x, y) d x d y = 1$
  3. 在 $f (x, y)$ 的连续点处， $f (x, y) = \frac{\partial^{2} F (x, y)}{\partial x \partial y}$
  4. $P ((X, Y) \in G) = \iint_{G} f (x, y) d x d y$ ， $G$ 是一个平面区域
    （拉动(x,y)矩形覆盖定义域（图中的蓝色三角形）的面积积分即为 $F (x)$ ）

2. 边缘分布

1. 边缘分布函数

边缘分布函数：设 $(X, Y)$ 为二位随机变量，其分布函数为 $F (x, y)$ ，则 $F_{X} (x) = P (X \leq x)$ 是 $(X, Y)$ 关于 $X$ 的边缘分布函数， $F_{Y} (y) = P (Y \leq y)$ 是 $(X, Y)$ 关于 $Y$ 的边缘分布函数
$F_{X} (x) = F (x, \infty), F_{Y} (y) = F (\infty, y)$

2. 离散型随机变量的边缘分布律

若 $(X, Y)$ 分布律为 $P (X = x_{i}, Y = y_{i}) = p_{i j}$ ，则 $(X, Y)$ 关于 $X$ 的边缘分布律 $p_{i \cdot} = \sum_{j = 1}^{\infty} p_{i j}$ ； $(X, Y)$ 关于 $Y$ 的边缘分布律 $p_{\cdot j} = \sum_{i = 1}^{\infty} p_{i j}$
$\sum_{i = 1}^{\infty} p_{i \cdot} = 1, \sum_{j = 1}^{\infty} p_{\cdot j} = 1$
离散型随机变量的边缘分布律列表

3. 连续性随机变量的边缘分布律

设 $(X, Y)$ 概率密度为 $f (x, y)$ ，则 $F_{X} (x) = F (x, \infty) = \int_{- \infty}^{x} [\int_{- \infty}^{+ \infty} f (x, y) d y] d x$ ，同理， $F_{Y} (y) = F (\infty, y) = \int_{- \infty}^{y} [\int_{- \infty}^{+ \infty} f (x, y) d x] d y$
边缘概率密度： $f_{X} (x) = \int_{- \infty}^{+ \infty} f (x, y) d y, f_{Y} (y) = \int_{- \infty}^{+ \infty} f (x, y) d x$

4. 常见的二维分布

均匀分布
1. 设 $G$ 为一面积为 $A$ 平面有界区域，若 $(X, Y)$ 具有如下概率密度，则称 $(X, Y)$ 在域 $G$ 服从 均匀分布
  $f (x) = {\begin{matrix} \frac{1}{A}, & (x, y) \in G \\ 0, & o t h e r w i s e \end{matrix}$
2. 均匀分布的边缘分布 不一定 是均匀分布
二维正态分布
1. 设二维随机变量 $(X, Y)$ 具有如下概率密度，其中 $μ_{1}, μ_{2}, σ_{1}, σ_{2}, ρ$ 是常数，且 $σ_{1}, σ_{2} > 0, | ρ | < 1$ 则称 $(X, Y)$ 为服从参数为 $μ_{1}, μ_{2}, σ_{1}, σ_{2}, ρ$ 的 二维正态分布，记为 $(X, Y) \sim N (μ_{1}, μ_{2}, σ_{1}^{2}, σ_{2}^{2}, ρ)$
$f (x, y) = \frac{1}{2 π σ_{1} σ_{2} \sqrt{1 - ρ^{2}}} e^{\frac{1}{2 (1 - ρ^{2})} [\frac{(x - μ_{1})^{2}}{σ_{1}^{2}} - 2 ρ \frac{(x - μ_{1}) (y - μ_{2})}{σ_{1} σ_{2}} + \frac{(y - μ_{2})^{2}}{σ_{2}^{2}}]}$
1. 二维正态分布的边缘分布 一定是 正态分布，且 $X \sim N (μ_{1}, σ_{1}^{2}), Y \sim N (μ_{2}, σ_{2}^{2})$
2. 二维正态分布的两个边缘分布都是一维正态分布，并且都不依赖于参数 $ρ$
3. 边缘分布均为正态分布的随机变量，联合分布 不一定 是二维正态分布

3. 条件分布

1. 离散型随机变量的条件分布

设 $(X, Y)$ 是二维随机变量，其分布律为 $P (X = x_{i}, Y = y_{i}) = p_{i j}$ ，对固定 $i$ , 若 $p_{i \cdot} > 0$ ，则 $P (Y = y_{i} | X = x_{i}) = \frac{p_{i j}}{p_{i \cdot}}$ 称为在条件 $X = x_{i}$ 下,随机变量 $Y$ 的条件分布律；对固定 $j$ , 若 $p_{\cdot j} > 0$ ，则 $P (X = x_{i} | Y = y_{i}) = \frac{p_{i j}}{p_{\cdot j}}$ 称为在条件 $Y = y_{i}$ 下,随机变量 $X$ 的条件分布律

2. 连续型随机变量的条件分布

给定 $y$ ，设对于任意的 $ε > 0$ ， $P (y < Y \leq y + ε)$ 若对于任意实数 $x$ ，极限 $F_{X | Y} (x | y) = lim_{ε \to 0^{+}} P (X \leq x | y < Y \leq y + ε)$ 存在，则称此极限值为在条件 $Y = y$ 下随机变量 $X$ 的 条件分布函数，记为 $F_{X | Y} (x | y)$ 或者 $P (X \leq x | Y = y)$ ；同理可以定义 $F_{Y | X} (y | x) = lim_{ε \to 0^{+}} P (Y \leq y | x < X \leq x + ε)$
注意：注意区分条件分布和条件概率，由于 $P (Y = y)$ 可以为零，条件概率可能没有定义（连续型随机变量一定为零）
条件概率密度：设 $(X, Y)$ 的概率密度 $f (x, y), (X, Y)$ 关于 $Y$ 的边缘概率密度为 $f_{Y} (y)$ ，若对固定的 $y, f_{y} (y) > 0$ ，则称 $f_{X | Y} (x | y) = \frac{f (x, y)}{f_{Y} (y)}$ 为在 $Y = y$ 的条件下 $X$ 的 条件概率密度，条件分布函数可以写作 $F_{X | Y} (x | y) = \int_{- \infty}^{x} \frac{f (u, y)}{f_{Y} (y)} d u$ ；同理，若对固定的 $x, f_{x} (x) > 0$ ，则称 $f_{Y | X} (y | x) = \frac{f (x, y)}{f_{X} (x)}$ 为在 $X = x$ 的条件下 $Y$ 的 条件概率密度，条件分布函数可以写作 $F_{Y | X} (y | x) = \int_{- \infty}^{y} \frac{f (x, v)}{f_{X} (x)} d v$
联合分布、边缘分布、条件分布的关系

4. 相互独立的随机变量

1. 相互独立

设 $F (x, y), F_{X} (x), F_{Y} (y)$ 分别是二维随机变量 $(X, Y)$ 的分布函数以及边缘分布函数，如果对所有 $x, y$ ，有 $P (X \leq x, Y \leq y) = P (X \leq x) \cdot P (Y \leq y)$ 或者 $F (x, y) = F_{X} (x) \cdot F_{Y} (y)$ ，则称随机变量 $X, Y$ 相互独立
相互独立等价条件
1. 连续型： $f (x, y) = f_{X} (x) \cdot f_{Y} (y)$
2. 离散型： $p_{i j} = p_{i \cdot} p_{\cdot j}$
设随机变量 $X$ 与 $Y$ 相互独立,令 $U = h (x), V = g (Y)$ ，其中 $h (x), g (y)$ 为连续函数，则 $U$ 与 $V$ 也 相互独立
1. 推广1：设 $(X_{1}, X_{2}, \dots, X_{n})$ 的分布函数为 $F (X_{1}, X_{2}, \dots, X_{n})$ ，若对任意的实数 $x_{1}, x_{2}, \dots, x_{n}$ 均有 $F (x_{1}, x_{2}, \dots, x_{n}) = F (x_{1}) F (x_{2}) \dots F (x_{n})$ ，则称 $X_{1}, X_{2}, \dots, X_{n}$ 相互独立（注意区分独立事件和独立变量）
2. 推广2：若对任意的实数 $x_{1}, x_{2}, \dots, x_{m}; y_{1}, y_{2}, \dots, y_{n}$ 均有 $F (x_{1}, x_{2}, \dots, x_{m}, y_{1}, y_{2}, \dots, y_{n})$ ，则称 $X_{1}, X_{2}, \dots, X_{m}$ 与 $Y_{1}, Y_{2}, \dots, Y_{n}$ 相互独立
3. 推广3：设 $X_{1}, X_{2}, \dots, X_{m}$ 与 $Y_{1}, Y_{2}, \dots, Y_{n}$ 相互独立，则 $X_{i}$ 与 $Y_{j}$ 相互独立，其中 $h, g$ 为连续函数，则 $h (X_{1}, X_{2}, \dots, X_{m})$ 与 $Y_{1}, Y_{2}, \dots, Y_{n}$ 也 相互独立

5. 二维随机变量的函数的分布

1. 函数的分布

离散型随机变量的函数分布
1. 对于二维离散型随机变量 $(X, Y)$ ，如果有 $Z = f (X, Y)$ ，那么 $Z$ 的分布律就是 $(X, Y)$ 在函数 $f$ 的作用产生的值再对应相等求和即可
连续型随机变量的函数分布
1. 对于二维连续型随机变量 $(X, Y)$ ，设其概率密度为 $f (x, y)$ ，则利用 分布函数法
  $\begin{aligned} F_{Z} (z) & = P (Z \leq z) \\ = P (g (X, Y) \leq z) \\ = P ((X, Y) \in D_{Z}) \\ = \iint_{D_{Z}} f (x, y) d x d y \\ f_{Z} (z) & = F_{Z}^{^{'}} (z) \end{aligned}$

2. 常见的函数分布

$Z = X + Y$
1. 对于二维连续型随机变量 $(X, Y)$ ，设其概率密度为 $f (x, y)$ ，那么 $Z = X + Y$ 的概率密度为 $f_{Z} (z) = \int_{- \infty}^{+ \infty} f (x, z - x) d x = \int_{- \infty}^{+ \infty} f (z - y, y) d y$
2. 卷积公式：当 $X, Y$ 相互独立的时候，有卷积公式 $f_{Z} (z) = f_{X} (x) * f_{Y} (y) = \int_{- \infty}^{+ \infty} f_{X} (z - y) f_{Y} (y) d y = \int_{- \infty}^{+ \infty} f_{X} (x) f_{Y} (z - x) d x$
3. 推论
  1. 如果 $X \sim N (μ_{1}, σ_{1}^{2}), Y \sim N (μ_{2}, σ_{2}^{2})$ 而且相互独立，那么 $Z = X + Y$ 也服从 正态分布，且 $Z \sim N (μ_{1} + μ_{2}, σ_{1}^{2} + σ_{2}^{2})$
  2. 有限个相互独立的正态随机变量的线性组合仍然服从正态分布
    $\sum_{i = 1}^{n} c_{i} X_{i} \sim N (\sum_{i = 1}^{n} c_{i} μ_{i}, \sum_{i = 1}^{n} c_{i}^{2} σ_{i}^{2})$
4. 推导
  $\begin{aligned} F_{Z} (z) & = \iint_{x + y \leq z} f (x, y) d x d y \\ = \int_{- \infty}^{+ \infty} d x \int_{- \infty}^{z - x} f (x, y) d y \\ = \int_{- \infty}^{+ \infty} d x \int_{- \infty}^{z} f (x, u - x) d u (y = u - x) \\ = \int_{- \infty}^{z} [\int_{- \infty}^{+ \infty} f (x, u - x) d x] d u \\ f_{Z} (z) & = \int_{- \infty}^{+ \infty} f (x, z - x) d x \end{aligned}$
$Z = X - Y$
1. 对于二维连续型随机变量 $(X, Y)$ ，设其概率密度为 $f (x, y)$ ，那么 $Z = X - Y$ 的概率密度为 $f_{Z} (z) = \int_{- \infty}^{+ \infty} f (x, x - z) d x = \int_{- \infty}^{+ \infty} f (z + y, y) d y$
2. 互相关：当 $X, Y$ 相互独立的时候， $f_{Z} (z) = \int_{- \infty}^{+ \infty} f_{X} (z + y) f_{Y} (y) d y = \int_{- \infty}^{+ \infty} f_{X} (x) f_{Y} (x - z) d x$
$Z = Y / X, Z = X Y$
1. 对于二维连续型随机变量 $(X, Y)$ ，设其概率密度为 $f (x, y)$ ，那么 $Z = Y / X, Z = X Y$ 的概率密度分别为
  $f_{Y / X} (z) = \int_{- \infty}^{+ \infty} | x | f (x, z x) d x f_{X Y} (z) = \int_{- \infty}^{+ \infty} \frac{1}{| x |} f (x, \frac{z}{x}) d x$
2. 当 $X, Y$ 相互独立时， $Z = Y / X, Z = X Y$ 的概率密度分别为
  $f_{Y / X} (z) = \int_{- \infty}^{+ \infty} | x | f_{X} (x) f_{Y} (z x) d x f_{X Y} (z) = \int_{- \infty}^{+ \infty} \frac{1}{| x |} f_{X} (x) f_{Y} (\frac{z}{x}) d x$
3. 证明
最大值最小值分布
1. 设 $X, Y$ 是两个相互独立的随机变量，它们的分布函数分别是 $F_{X} (x), F_{Y} (y)$ ，那么对于任意的实数 $z$
  1. $F_{m a x} (z) = P (m a x (X, Y) \leq z) = P (X \leq z, Y \leq z) = P (X \leq z) P (Y \leq z) = F_{X} (z) F_{Y} (z)$
  2. $F_{m i n} (z) = P (m i n (X, Y) \leq z) = 1 - P (m i n (X, Y) > z) = 1 - [1 - F_{X} (z)] [1 - F_{Y} (z)]$
2. 推广：设 $X_{1}, \dots, X_{n}$ 相互独立,其分布函数分别为 $F_{X_{i}} (x_{i})$
  1. $F_{m a x} (z) = \prod_{i = 1}^{n} F_{X_{i}} (z)$
  2. $F_{m i n} (z) = 1 - \prod_{i = 1}^{n} [1 - F_{X_{i}} (z)]$
  3. 如果 $X_{1}, \dots, X_{n}$ 相互独立而且具有相同分布函数 $F (x)$ ，有 $F_{m a x} (z) = [F (z)]^{n}, F_{m i n} (z) = 1 - [1 - F (z)]^{n}$

$Γ$ 分布
如果随机变量 $X$ 的概率密度为 $f (x) = \frac{β}{Γ (α)} (β x)^{α - 1} e^{- β x} (x > 0, α > 0, β > 0)$ 其他区间为0
则称 $X$ 服从参数为 $α, β$ 的分布，记为 $X \sim Γ (α, β)$
一般结论：如果 $X_{1}, \dots, X_{n}$ 相互独立，而且 $X_{i}$ 服从参数为 $α_{i}, β$ 的 $Γ$ 分布，那么 $X_{1} + \dots + X_{n}$ 服从参数为 $α_{1} + α_{2} + \dots + α_{n}, β$ 的 $Γ$ 分布

$Γ$ 函数
$Γ (x) = \int_{0}^{+ \infty} t^{x - 1} e^{- t} d t (x > 0)$
性质

$Γ (\frac{1}{2}) = \sqrt{π}$

$Γ (1) = 1$

对于任何 $α > 0, Γ (α + 1) = α Γ (α)$

对于任意正整数 $n$ ，有 $Γ (n) = (n - 1)!$

图像

__EOF__

本文作者：RadiumGalaxy
本文链接：https://www.cnblogs.com/RadiumGalaxy/p/16860680.html
关于博主：评论和私信会在第一时间回复。或者直接私信我。
版权声明：本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！
声援博主：如果您觉得文章对您有帮助，可以点击文章右下角【推荐】一下。您的鼓励是博主的最大动力！