03 多维随机变量及其分布 | 概率论与数理统计
1. 二维随机变量
1. 二维随机变量
- 二维随机变量:设\(E\)是一个随机试验, 样本空间\(S={e}\). 设\(X=X(e)\)和\(Y=Y(e)\)是定义在\(S\)上的两个随机变量, 向量\((X,Y)\)叫做二维随机向量或二维随机变量
- \(n\)维随机变量:设随机试验\(E\)的样本空间\(S={e}. X_1, X_2, \dots,X_n\)是定义在\(S\)上的\(n\)个随机变量, 则称向量 \((X_1, X_2, \dots,X_n)\)为 \(n\)维随机变量(向量)
- 分布函数:设\((X,Y)\)是二维随机变量, 对于任意实数\(x,y\),有\(F(x) = P\{(X\le x)\cap (Y\le y)\} = P\{X\le x,Y\le y\}\)称\(F(x,y)\)为二维随机变量\((X,Y)\)的 分布函数,或称为随机变量\(X\) 和\(Y\) 的 联合分布函数
- \(F(x,y)\)是变量\(x\)和\(y\) 不减函数
- \(0\le F(x,y)\le 1\)\(F(-\infty,y)=F(x,-\infty) = F(-\infty,-\infty) = 0,F(+\infty, +\infty)=1\)
- \(F(x,y)\)关于 \(x\)右连续, 关于 \(y\)右连续
- 对于任意\(x_1 <x_2 , y_1 < y_2\),有\[P\{x_1< X\le x_2, y_1<Y\le y_2\} = F(x_2, y_2)-F(x_2, y_1)+ F(x_1,y_1)-F(x_1,y_2)\ge 0 \]
2. 二维离散型随机变量
-
定义:\((X,Y)\)的所有可能取值是有限对或可列无限多对
-
二维离散\((X,Y)\)的分布律(联合分布律):\((X,Y)\)的所有可能取值\((x_i , y_j ),P(X=x_i,Y=y_i) = p_{ij}\)
-
分布律性质
- \(0\le p_{ij}\le 1\)
- \(\sum_{j=1}^{+\infty}\sum_{i = 1}^{\infty}p_{ij}=1\)
- \(F(x,y) = \sum_{x_i\le x,y_i\le y}p_{ij}\)
-
二维连续型随机变量
- 定义:设二维随机变量\((X,Y)\)的分布函数为\(F(x, y)\), 若存在一个非负函数\(f (x, y)\),使得对任意\(x, y\) ,有如下式子,则称\((X,Y)\)为 二维连续型随机变量, \(f (x,y)\)称为\((X,Y)\)的概率密度,或称为\(X\)和\(Y\)的 联合概率密度\[F(x,y)=\int_{-\infty}^{y}\int_{-\infty}^{x}f(u,v)dudv \]
- 概率密度性质
- \(f(x,y)\ge 0\)
- \(\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(x,y)dxdy=1\)
- 在\(f(x,y)\)的连续点处,\(f(x,y) = \frac{\partial^2F(x,y)}{\partial x\partial y}\)
- \(P((X,Y)\in G)=\iint\limits_{G}f(x,y)dxdy\),\(G\)是一个平面区域
(拉动(x,y)矩形覆盖定义域(图中的蓝色三角形)的面积积分即为\(F(x)\))
- 定义:设二维随机变量\((X,Y)\)的分布函数为\(F(x, y)\), 若存在一个非负函数\(f (x, y)\),使得对任意\(x, y\) ,有如下式子,则称\((X,Y)\)为 二维连续型随机变量, \(f (x,y)\)称为\((X,Y)\)的概率密度,或称为\(X\)和\(Y\)的 联合概率密度
2. 边缘分布
1. 边缘分布函数
- 边缘分布函数:设\((X,Y)\)为二位随机变量,其分布函数为\(F(x, y)\),则\(F_X(x)=P(X\le x)\)是\((X,Y)\)关于\(X\)的边缘分布函数,\(F_Y(y)=P(Y\le y)\)是\((X,Y)\)关于\(Y\)的边缘分布函数
- \(F_X(x) = F(x,\infty),F_Y(y)=F(\infty, y)\)
2. 离散型随机变量的边缘分布律
- 若\((X,Y)\)分布律为\(P(X=x_i,Y=y_i)=p_{ij}\),则\((X,Y)\)关于\(X\)的边缘分布律\(p_{i\cdot}=\sum_{j=1}^{\infty}p_{ij}\);\((X,Y)\)关于\(Y\)的边缘分布律\(p_{\cdot j}=\sum_{i=1}^{\infty}p_{ij}\)
- \(\sum_{i = 1}^{\infty}p_{i\cdot}=1,\sum_{j=1}^{\infty}p_{\cdot j}=1\)
- 离散型随机变量的边缘分布律列表
3. 连续性随机变量的边缘分布律
- 设\((X,Y)\)概率密度为\(f(x,y)\),则\(F_X(x) = F(x,\infty)=\int_{-\infty}^{x}[\int_{-\infty}^{+\infty}f(x, y)dy]dx\),同理,\(F_Y(y) = F(\infty,y)=\int_{-\infty}^{y}[\int_{-\infty}^{+\infty}f(x, y)dx]dy\)
- 边缘概率密度:\(f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy,f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx\)
4. 常见的二维分布
-
均匀分布
- 设\(G\)为一面积为\(A\)平面有界区域,若\((X,Y)\)具有如下概率密度,则称\((X,Y)\)在域\(G\)服从 均匀分布\[f(x)=\left\{\begin{matrix} \frac{1}{A},&(x,y)\in G \\ 0,&otherwise \end{matrix}\right. \]
- 均匀分布的边缘分布 不一定 是均匀分布
- 设\(G\)为一面积为\(A\)平面有界区域,若\((X,Y)\)具有如下概率密度,则称\((X,Y)\)在域\(G\)服从 均匀分布
-
二维正态分布
- 设二维随机变量\((X,Y)\)具有如下概率密度,其中\(\mu_1,\mu_2,\sigma_1,\sigma_2,\rho\)是常数,且\(\sigma_1,\sigma_2>0,|\rho|<1\)则称\((X,Y)\)为服从参数为\(\mu_1,\mu_2,\sigma_1,\sigma_2,\rho\)的 二维正态分布,记为\((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)
\[f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]} \]-
二维正态分布的边缘分布 一定是 正态分布,且\(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\)
-
二维正态分布的两个边缘分布都是一维正态分布,并且都不依赖于参数\(\rho\)
-
边缘分布均为正态分布的随机变量,联合分布 不一定 是二维正态分布
3. 条件分布
1. 离散型随机变量的条件分布
- 设\((X,Y)\)是二维随机变量,其分布律为\(P(X=x_i,Y=y_i)=p_{ij}\),对固定 \(i\), 若\(p_{i\cdot}>0\),则\(P(Y=y_i|X=x_i)=\frac{p_{ij}}{p_{i\cdot}}\)称为在条件\(X=x_i\) 下,随机变量\(Y\)的条件分布律;对固定 \(j\), 若\(p_{\cdot j}>0\),则\(P(X=x_i|Y=y_i)=\frac{p_{ij}}{p_{\cdot j}}\)称为在条件\(Y=y_i\) 下,随机变量\(X\)的条件分布律
2. 连续型随机变量的条件分布
- 给定\(y\),设对于任意的\(\varepsilon > 0\),\(P(y<Y\le y + \varepsilon)\)若对于任意实数\(x\),极限\(F_{X|Y}(x|y)=\lim_{\varepsilon\to 0^+}P(X\le x|y<Y\le y + \varepsilon)\)存在,则称此极限值为在条件\(Y=y\)下随机变量\(X\)的 条件分布函数,记为\(F_{X|Y}(x|y)\)或者\(P(X\le x|Y=y)\);同理可以定义 \(F_{Y|X}(y|x)=\lim_{\varepsilon\to 0^+}P(Y\le y|x<X\le x + \varepsilon)\)
- 注意:注意区分条件分布和条件概率,由于\(P(Y=y)\)可以为零,条件概率可能没有定义(连续型随机变量一定为零)
- 条件概率密度:设\((X,Y)\)的概率密度\(f(x,y),(X,Y)\)关于\(Y\)的边缘概率密度为\(f_Y(y)\),若对固定的\(y,f_y(y)>0\),则称\(f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}\)为在\(Y=y\)的条件下\(X\)的 条件概率密度,条件分布函数可以写作\(F_{X|Y}(x|y)=\int_{-\infty}^{x}\frac{f(u,y)}{f_Y(y)}du\);同理,若对固定的\(x,f_x(x)>0\),则称\(f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}\)为在\(X=x\)的条件下\(Y\)的 条件概率密度,条件分布函数可以写作\(F_{Y|X}(y|x)=\int_{-\infty}^{y}\frac{f(x,v)}{f_X(x)}dv\)
- 联合分布、边缘分布、条件分布的关系
4. 相互独立的随机变量
1. 相互独立
- 设\(F(x,y),F_X(x),F_Y(y)\)分别是二维随机变量\((X,Y)\)的分布函数以及边缘分布函数,如果对所有\(x,y\),有\(P(X\le x,Y\le y) = P(X\le x)\cdot P(Y\le y)\)或者\(F(x,y)=F_X(x)\cdot F_Y(y)\),则称随机变量\(X,Y\)相互独立
- 相互独立等价条件
- 连续型:\(f(x,y) = f_X(x)\cdot f_Y(y)\)
- 离散型:\(p_{ij} = p_{i\cdot}p_{\cdot j}\)
- 设随机变量\(X\)与\(Y\)相互独立,令\(U=h(x),V=g(Y)\),其中\(h(x),g(y)\)为连续函数,则\(U\)与\(V\)也 相互独立
- 推广1:设\((X_1,X_2,\dots, X_n)\)的分布函数为\(F(X_1,X_2,\dots, X_n)\),若对任意的实数\(x_1,x_2,\dots,x_n\)均有\(F(x_1,x_2,\dots,x_n)=F(x_1)F(x_2)\cdots F(x_n)\),则称\(X_1,X_2,\dots, X_n\)相互独立(注意区分独立事件和独立变量)
- 推广2:若对任意的实数\(x_1,x_2,\dots,x_m; y_1,y_2,\dots, y_n\)均有\(F(x_1,x_2,\dots,x_m,y_1,y_2,\dots, y_n)\),则称\(X_1,X_2,\dots,X_m\)与\(Y_1,Y_2,\dots,Y_n\)相互独立
- 推广3:设\(X_1,X_2,\dots,X_m\)与\(Y_1,Y_2,\dots,Y_n\)相互独立,则\(X_i\)与\(Y_j\)相互独立,其中\(h,g\)为连续函数,则\(h(X_1,X_2,\dots,X_m)\)与\(Y_1,Y_2,\dots,Y_n\)也 相互独立
5. 二维随机变量的函数的分布
1. 函数的分布
- 离散型随机变量的函数分布
- 对于二维离散型随机变量\((X,Y)\),如果有\(Z=f(X,Y)\),那么 \(Z\)的分布律就是\((X,Y)\)在函数\(f\)的作用产生的值再对应相等求和即可
- 连续型随机变量的函数分布
- 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),则利用 分布函数法\[\begin{aligned} F_Z(z) &= P(Z\le z)\\ &=P(g(X,Y)\le z)\\ &=P((X,Y)\in D_Z)\\ &=\iint\limits_{D_Z}f(x,y)dxdy\\ f_Z(z) &= F_Z^{'}(z) \end{aligned} \]
- 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),则利用 分布函数法
2. 常见的函数分布
-
\(Z=X+Y\)
- 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),那么\(Z=X+Y\)的概率密度为\(f_Z(z) = \int_{-\infty}^{+\infty}f(x,z-x)dx=\int_{-\infty}^{+\infty}f(z-y,y)dy\)
- 卷积公式:当\(X,Y\)相互 独立的时候,有卷积公式$f_Z(z) = f_X(x)\ast f_Y(y) = \int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy = \int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx $
- 推论
- 如果 \(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\)而且相互独立,那么\(Z=X+Y\)也服从 正态分布,且\(Z\sim N(\mu_1+\mu_2,\sigma_1^2 + \sigma_2^2)\)
- 有限个相互独立的正态随机变量的线性组合仍然服从正态分布\[\sum_{i=1}^{n}c_iX_i\sim N(\sum_{i=1}^{n}c_i\mu_i,\sum_{i=1}^{n}c_i^2\sigma_i^2) \]
- 推导\[\begin{aligned} F_Z(z) &= \iint\limits_{x+y\le z}f(x,y)dxdy\\ &= \int_{-\infty}^{+\infty}dx\int_{-\infty}^{z-x}f(x,y)dy\\ &= \int_{-\infty}^{+\infty}dx\int_{-\infty}^{z}f(x,u-x)du\qquad(y = u-x)\\ &= \int_{-\infty}^{z}[\int_{-\infty}^{+\infty}f(x,u-x)dx]du\\ f_Z(z) &= \int_{-\infty}^{+\infty}f(x,z-x)dx \end{aligned} \]
-
\(Z=X-Y\)
- 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),那么\(Z=X-Y\)的概率密度为\(f_Z(z) = \int_{-\infty}^{+\infty}f(x,x-z)dx=\int_{-\infty}^{+\infty}f(z+y,y)dy\)
- 互相关:当\(X,Y\)相互 独立的时候,$f_Z(z) = \int_{-\infty}^{+\infty}f_X(z+y)f_Y(y)dy = \int_{-\infty}^{+\infty}f_X(x)f_Y(x-z)dx $
-
\(Z=Y/X,Z=XY\)
- 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),那么\(Z=Y/X,Z=XY\)的概率密度分别为\[f_{Y/X}(z) = \int_{-\infty}^{+\infty}|x|f(x,zx)dx\\ f_{XY}(z)=\int_{-\infty}^{+\infty}\frac{1}{|x|}f(x,\frac{z}{x})dx \]
- 当\(X,Y\)相互独立时,\(Z=Y/X,Z=XY\)的概率密度分别为\[f_{Y/X}(z)=\int_{-\infty}^{+\infty}|x|f_X(x)f_Y(zx)dx\\ f_{XY}(z) = \int_{-\infty}^{+\infty}\frac{1}{|x|}f_X(x)f_Y(\frac{z}{x})dx \]
- 证明
- 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),那么\(Z=Y/X,Z=XY\)的概率密度分别为
-
最大值最小值分布
- 设\(X,Y\)是两个相互独立的随机变量,它们的分布函数分别是\(F_X(x),F_Y(y)\),那么对于任意的实数\(z\)
- \(F_{max}(z) = P(max(X,Y)\le z)=P(X\le z , Y\le z)=P(X\le z)P(Y\le z)=F_X(z)F_Y(z)\)
- \(F_{min}(z) = P(min(X,Y)\le z)=1-P(min(X,Y)>z)=1-[1-F_X(z)][1-F_Y(z)]\)
- 推广:设\(X_1,\dots,X_n\)相互独立,其分布函数分别为 \(F_{X_i}(x_i)\)
- \(F_{max}(z)=\prod_{i=1}^nF_{X_i}(z)\)
- \(F_{min}(z)=1-\prod_{i=1}^n[1-F_{X_i}(z)]\)
- 如果\(X_1,\dots,X_n\)相互独立而且具有相同分布函数\(F(x)\),有\(F_{max}(z)=[F(z)]^n,F_{min}(z)=1-[1-F(z)]^n\)
- 设\(X,Y\)是两个相互独立的随机变量,它们的分布函数分别是\(F_X(x),F_Y(y)\),那么对于任意的实数\(z\)
\(\Gamma\)分布
如果随机变量\(X\)的概率密度为 \(f(x)=\frac{\beta}{\Gamma(\alpha)}(\beta x)^{\alpha - 1}e^{-\beta x}\quad(x>0,\alpha>0,\beta >0)\)其他区间为0
则称\(X\)服从参数为\(\alpha,\beta\)的分布,记为\(X\sim \Gamma(\alpha,\beta)\)
一般结论:如果\(X_1,\dots,X_n\)相互独立,而且\(X_i\)服从参数为\(\alpha_i,\beta\)的\(\Gamma\)分布,那么\(X_1+\dots+X_n\)服从参数为\(\alpha_1+\alpha_2+\dots+\alpha_n,\beta\)的\(\Gamma\)分布
\(\Gamma\)函数
\(\Gamma(x) = \int_{0}^{+\infty}t^{x-1}e^{-t}dt(x>0)\)
性质
- \(\Gamma(\frac{1}{2})=\sqrt{\pi}\)
- \(\Gamma(1)=1\)
- 对于任何\(\alpha>0,\Gamma(\alpha+1)=\alpha\Gamma(\alpha)\)
- 对于任意正整数\(n\),有\(\Gamma(n)=(n-1)!\)
图像