第四章 随机向量 精简版

§4.2 边缘分布、随机变量的独立性和条件分布

一、边缘分布函数

定义 4.7

设二维随机变量 \((X,Y)\) 的联合分布函数为 \(F(x,y)\),称

\[F_X(x) = P(X \leq x) = \lim_{y \to +\infty} F(x,y) = F(x,+\infty), \quad x \in (-\infty,+\infty) \]

为随机变量 \(X\) 的边缘分布函数。同理,称

\[F_Y(y) = P(Y \leq y) = \lim_{x \to +\infty} F(x,y) = F(+\infty,y), \quad y \in (-\infty,+\infty) \]

\(Y\) 的边缘分布函数。

二、边缘分布律和边缘密度函数

离散型随机变量的边缘分布律

设二维离散型随机变量 \((X,Y)\) 的联合分布律为 \(P\{X=x_i, Y=y_j\} = p_{ij}, \quad i,j = 1,2,\cdots\)

\(P\{X = x_i\} = p_{i\cdot} = \sum_{j=1}^{\infty} p_{ij}, \quad i = 1,2,\cdots\)\(X\) 的边缘分布律;

\(P\{Y = y_j\} = p_{\cdot j} = \sum_{i=1}^{\infty} p_{ij}, \quad j = 1,2,\cdots\)\(Y\) 的边缘分布律。

连续型随机变量的边缘密度函数

设二维连续型随机变量 \((X,Y)\) 的联合密度函数为 \(f(x,y)\),则

\[f_X(x) = \int_{-\infty}^{+\infty} f(x,y) dy, \quad x \in \mathbb{R} \]

\(X\) 的边缘密度函数;

\[f_Y(y) = \int_{-\infty}^{+\infty} f(x,y) dx, \quad y \in \mathbb{R} \]

\(Y\) 的边缘密度函数。

三、随机变量的相互独立性

定义 4.8 (离散型随机变量的独立性)

设二维离散型随机变量 \((X,Y)\) 的联合分布律为 \(P\{X=x_i, Y=y_j\} = p_{ij}\)。若

\[p_{ij} = p_{i\cdot} p_{\cdot j}, \quad \forall i,j = 1,2,\cdots \]

成立,那么就称 \(X\)\(Y\) 相互独立。

定义 4.9 (连续型随机变量的独立性)

设随机变量 \(X\)\(Y\) 的联合密度函数为 \(f(x,y)\),边缘密度函数分别为 \(f_X(x)\)\(f_Y(y)\),如果在函数 \(f(x,y)\) 的连续点上都成立

\[f(x,y) = f_X(x)f_Y(y) \]

那么称 \(X\)\(Y\) 相互独立。

定理 4.2

随机变量 \(X\)\(Y\) 相互独立的充分必要条件是:对实数轴上任意两个数集 \(B_1\)\(B_2\),总有

\[P(X \in B_1, Y \in B_2) = P(X \in B_1)P(Y \in B_2) \]

四、条件分布和条件数学期望

定义 4.10 (离散型随机变量的条件分布律)

设二维离散型随机变量 \((X,Y)\) 的联合分布律为 \(P\{X=x_i, Y=y_j\} = p_{ij}\)。若 \(P\{Y=y_j\} > 0\),称

\[P\{X=x_i|Y=y_j\} = \frac{P\{X=x_i, Y=y_j\}}{P\{Y=y_j\}} = \frac{p_{ij}}{p_{\cdot j}}, \quad i = 1,2,\cdots \]

为已知 \(Y=y_j\) 发生的条件下 \(X\) 的条件分布律。

定义 4.11 (连续型随机变量的条件密度函数)

设二维随机变量 \((X,Y)\) 的联合密度函数为 \(f(x,y)\),边缘密度函数分别为 \(f_X(x)\)\(f_Y(y)\)

对任意的实数 \(y\),当 \(f_Y(y) > 0\) 时,称

\[f_{X|Y}(x|y) = \frac{f(x,y)}{f_Y(y)}, \quad (-\infty < x < +\infty) \]

\(Y=y\) 发生时 \(X\) 的条件密度函数。

对任意的实数 \(x\),当 \(f_X(x) > 0\) 时,称

\[f_{Y|X}(y|x) = \frac{f(x,y)}{f_X(x)}, \quad (-\infty < y < +\infty) \]

\(X=x\) 发生时 \(Y\) 的条件密度函数。

条件数学期望

对于离散型随机变量,在事件 \(Y=y_j\) 发生的条件下随机变量 \(X\) 的条件数学期望定义为:

\[E(X|Y=y_j) = \sum_{i} x_i P\{X=x_i|Y=y_j\} = \sum_{i} x_i \frac{p_{ij}}{p_{\cdot j}}, \quad P\{Y=y_j\} > 0 \]

\(f_Y(y)>0\)时,在事件\(\{Y=y\}\)发生的条件下随机变量\(g(X)\)的条件数学期望定义为

\[E[g(X)|Y=y]=\int_{-\infty}^{+\infty} g(x)f_{X|Y}(x|y)dx=\int_{-\infty}^{+\infty} g(x)\frac{f(x,y)}{f_Y(y)}dx \]

§4.3 二维随机变量函数的分布

一、二维离散型随机变量函数的分布

定理 4.4(分布的可加性)

设随机变量 \(X\)\(Y\) 相互独立,

(1) 若 \(X \sim B(n_1, p), Y \sim B(n_2, p)\), 则 \(X + Y \sim B(n_1 + n_2, p)\);

(2) 若 \(X \sim P(\lambda_1), Y \sim P(\lambda_2)\), 则 \(X + Y \sim P(\lambda_1 + \lambda_2)\).

二、二维连续型随机变量函数的分布

$1. 已知(X, Y)的联合密度函数f(x, y), 求Z=g(X, Y)的密度函数 $

主要步骤如下:

(1)确定随机变量\(Z\)的取值范围;

\((2)计算Z=g(X, Y)的分布函数如下:\)

\(F_Z(z)=P(Z\leq z)=P(g(X, Y)\leq z)=\iint_{g(x,y)\leq z} f(x,y)dxdy\)

(3)求导得到Z的密度函数:\(f_Z(z)=\frac{dF_Z(z)}{dz}\)

(4)完整写出Z的密度函数的表达式.

定理 4.5

设二维连续型随机变量 \((X,Y)\) 的密度函数为 \(f(x,y)\), 则随机变量 \(Z = X + Y\) 的密度函数为

\[f_Z(z) = \int_{-\infty}^{+\infty} f(x, z-x) dx = \int_{-\infty}^{+\infty} f(z-y, y) dy \]

定理 4.6 (正态分布的可加性)

设随机变量 \(X_1 \sim N(\mu_1, \sigma_1^2), X_2 \sim N(\mu_2, \sigma_2^2)\)\(X_1\)\(X_2\) 相互独立,则

\[X_1 + X_2 \sim N(\mu_1 + \mu_2, \sigma_1^2 + \sigma_2^2) \]

更一般地,有下面结论:

设随机变量 \(X_1, X_2, \cdots, X_n\) 相互独立,且 \(X_i \sim N(\mu, \sigma^2), i = 1, 2, \cdots, n\), \(a_1, a_2, \cdots, a_n\) 是一些不全为零的常数, \(b\) 是常数,则

\[a_1X_1 + a_2X_2 + \cdots + a_nX_n + b \sim N(\mu\sum_{i=1}^n a_i + b, \sigma^2\sum_{i=1}^n a_i^2) \]

三、最大值和最小值的分布

定理 4.7

设连续型随机变量 \(X_1, X_2, \cdots, X_n\) 相互独立且服从相同分布, 具有分布函数 \(F(x)\) 及密度函数 \(f(x)\), 求:

  1. \(Y = \max\{X_1, X_2, \cdots, X_n\}\) 的分布函数为 \(F_Y(y) = [F(y)]^n\), 密度函数为 \(f_Y(y) = n[F(y)]^{n-1}f(y)\);

  2. \(Z = \min\{X_1, X_2, \cdots, X_n\}\) 的分布函数为 \(F_Z(z) = 1 - [1 - F(z)]^n\), 密度函数为 \(f_Z(z) = n[1 - F(z)]^{n-1}f(z)\).

§4.4 随机向量的数字特征

一、二维随机变量函数的数学期望

定理:
\((X,Y)\)是二维离散型随机变量,其分布律为\(P\{X=x_i,Y=y_j\}=p_{ij}\)\(i,j=1,2,\cdots\)\(Z=g(X,Y)\)\((X,Y)\)的函数,则:

\[E[g(X,Y)]=\sum_{i=1}^{\infty}\sum_{j=1}^{\infty}g(x_i,y_j)p_{ij} \]

\(二维连续型随机变量(X, Y)的联合密度函数为f(x, y), 则Z=g(X, Y)的数学期望\)

\[E(Z)=\iint_{-\infty}^{+\infty} g(x,y)f(x,y)dxdy \]

$定理4.9(数学期望性质的推广)设随机变量X_1, X_2, ⋯, X_n, $

1)若\(Y=\sum_{i=1}^n k_iX_i+c\), 其中\(k_i(i=1, 2, \cdots, n)\), c是常数, 则

\[E(Y)=\sum_{i=1}^n k_iE(X_i)+c \]

特别地, \(E(\sum_{i=1}^n X_i)=\sum_{i=1}^n E(X_i)\)

(2)当随机变量\(X_1, X_2, \cdots, X_n\)相互独立时,

\[E(X_1X_2\cdots X_n)=E(X_1)E(X_2)\cdots E(X_n) \]

二、协方差及相关系数

定义(协方差):
\((X,Y)\)是二维随机变量,称

\[Cov(X,Y)=E[(X-E(X))(Y-E(Y))] \]

为随机变量\(X\)\(Y\)的协方差。

定理:

\[Var(X\pm Y)=Var(X)+Var(Y)\pm 2Cov(X,Y) \]

\[Cov(X,Y)=E(XY)-E(X)E(Y) \]

性质:
1.各种交换和叠加和分常数如

\[Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y) \quad \text{比较重要} \]

  1. \(X\)\(Y\)独立,则\(Cov(X,Y)=0\)

定义(相关系数):
\((X,Y)\)是二维随机变量,且\(Var(X)>0\)\(Var(Y)>0\),则称

\[Corr_{XY}=\frac{Cov(X,Y)}{\sqrt{Var(X)}\sqrt{Var(Y)}} \]

为随机变量\(X\)\(Y\)的相关系数。

定理:
\(若随机变量X与Y相互独立, 且Cov(X, Y)存在时, 则X与Y不相关, 反之则不然.\)
\(该定理的逆否命题成立, 即若X与Y相关, 则X与Y一定不独立.\)

定义(协方差矩阵):
\(n\)维随机向量\(\mathbf{X}=(X_1,X_2,\cdots,X_n)^T\)\(Cov(X_i,X_j)\)\(i,j=1,2,\cdots,n\))存在,则称矩阵

\[\begin{pmatrix} Var(X_1) & Cov(X_1,X_2) & \cdots & Cov(X_1,X_n) \\ Cov(X_2,X_1) & Var(X_2) & \cdots & Cov(X_2,X_n) \\ \vdots & \vdots & \ddots & \vdots \\ Cov(X_n,X_1) & Cov(X_n,X_2) & \cdots & Var(X_n) \end{pmatrix}\]

为随机向量\(\mathbf{X}\)的协方差矩阵。

posted @ 2024-11-16 18:29  RES_HON  阅读(2)  评论(0编辑  收藏  举报