03 多维随机变量及其分布 | 概率论与数理统计

1. 二维随机变量

1. 二维随机变量

  1. 二维随机变量:设\(E\)是一个随机试验, 样本空间\(S={e}\). 设\(X=X(e)\)\(Y=Y(e)\)是定义在\(S\)上的两个随机变量, 向量\((X,Y)\)叫做二维随机向量二维随机变量
  2. \(n\)维随机变量:设随机试验\(E\)的样本空间\(S={e}. X_1, X_2, \dots,X_n\)是定义在\(S\)上的\(n\)个随机变量, 则称向量 \((X_1, X_2, \dots,X_n)\)\(n\)维随机变量(向量)
  3. 分布函数:设\((X,Y)\)是二维随机变量, 对于任意实数\(x,y\),有\(F(x) = P\{(X\le x)\cap (Y\le y)\} = P\{X\le x,Y\le y\}\)\(F(x,y)\)为二维随机变量\((X,Y)\)分布函数,或称为随机变量\(X\)\(Y\)联合分布函数
    1. \(F(x,y)\)是变量\(x\)\(y\) 不减函数
    2. \(0\le F(x,y)\le 1\)\(F(-\infty,y)=F(x,-\infty) = F(-\infty,-\infty) = 0,F(+\infty, +\infty)=1\)
    3. \(F(x,y)\)关于 \(x\)右连续, 关于 \(y\)右连续
    4. 对于任意\(x_1 <x_2 , y_1 < y_2\),有

      \[P\{x_1< X\le x_2, y_1<Y\le y_2\} = F(x_2, y_2)-F(x_2, y_1)+ F(x_1,y_1)-F(x_1,y_2)\ge 0 \]

2. 二维离散型随机变量

  1. 定义:\((X,Y)\)的所有可能取值是有限对或可列无限多对

  2. 二维离散\((X,Y)\)的分布律(联合分布律):\((X,Y)\)的所有可能取值\((x_i , y_j ),P(X=x_i,Y=y_i) = p_{ij}\)image

  3. 分布律性质

    1. \(0\le p_{ij}\le 1\)
    2. \(\sum_{j=1}^{+\infty}\sum_{i = 1}^{\infty}p_{ij}=1\)
    3. \(F(x,y) = \sum_{x_i\le x,y_i\le y}p_{ij}\)
  4. 二维连续型随机变量

    1. 定义:设二维随机变量\((X,Y)\)的分布函数为\(F(x, y)\), 若存在一个非负函数\(f (x, y)\),使得对任意\(x, y\) ,有如下式子,则称\((X,Y)\)二维连续型随机变量\(f (x,y)\)称为\((X,Y)\)的概率密度,或称为\(X\)\(Y\)联合概率密度

      \[F(x,y)=\int_{-\infty}^{y}\int_{-\infty}^{x}f(u,v)dudv \]

    2. 概率密度性质
      1. \(f(x,y)\ge 0\)
      2. \(\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(x,y)dxdy=1\)
      3. \(f(x,y)\)的连续点处,\(f(x,y) = \frac{\partial^2F(x,y)}{\partial x\partial y}\)
      4. \(P((X,Y)\in G)=\iint\limits_{G}f(x,y)dxdy\)\(G\)是一个平面区域image
        (拉动(x,y)矩形覆盖定义域(图中的蓝色三角形)的面积积分即为\(F(x)\)

2. 边缘分布

1. 边缘分布函数

  1. 边缘分布函数:设\((X,Y)\)为二位随机变量,其分布函数为\(F(x, y)\),则\(F_X(x)=P(X\le x)\)\((X,Y)\)关于\(X\)的边缘分布函数,\(F_Y(y)=P(Y\le y)\)\((X,Y)\)关于\(Y\)的边缘分布函数
  2. \(F_X(x) = F(x,\infty),F_Y(y)=F(\infty, y)\)

2. 离散型随机变量的边缘分布律

  1. \((X,Y)\)分布律为\(P(X=x_i,Y=y_i)=p_{ij}\),则\((X,Y)\)关于\(X\)的边缘分布律\(p_{i\cdot}=\sum_{j=1}^{\infty}p_{ij}\)\((X,Y)\)关于\(Y\)的边缘分布律\(p_{\cdot j}=\sum_{i=1}^{\infty}p_{ij}\)
  2. \(\sum_{i = 1}^{\infty}p_{i\cdot}=1,\sum_{j=1}^{\infty}p_{\cdot j}=1\)
  3. 离散型随机变量的边缘分布律列表
    image

3. 连续性随机变量的边缘分布律

  1. \((X,Y)\)概率密度为\(f(x,y)\),则\(F_X(x) = F(x,\infty)=\int_{-\infty}^{x}[\int_{-\infty}^{+\infty}f(x, y)dy]dx\),同理,\(F_Y(y) = F(\infty,y)=\int_{-\infty}^{y}[\int_{-\infty}^{+\infty}f(x, y)dx]dy\)
  2. 边缘概率密度:\(f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy,f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)dx\)

4. 常见的二维分布

  1. 均匀分布

    1. \(G\)为一面积为\(A\)平面有界区域,若\((X,Y)\)具有如下概率密度,则称\((X,Y)\)在域\(G\)服从 均匀分布

      \[f(x)=\left\{\begin{matrix} \frac{1}{A},&(x,y)\in G \\ 0,&otherwise \end{matrix}\right. \]

    2. 均匀分布的边缘分布 不一定 是均匀分布
  2. 二维正态分布

    1. 设二维随机变量\((X,Y)\)具有如下概率密度,其中\(\mu_1,\mu_2,\sigma_1,\sigma_2,\rho\)是常数,且\(\sigma_1,\sigma_2>0,|\rho|<1\)则称\((X,Y)\)为服从参数为\(\mu_1,\mu_2,\sigma_1,\sigma_2,\rho\)二维正态分布,记为\((X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)\)

    \[f(x,y)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{\frac{1}{2(1-\rho^2)}[\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(y-\mu_2)}{\sigma_1\sigma_2}+\frac{(y-\mu_2)^2}{\sigma_2^2}]} \]

    1. 二维正态分布的边缘分布 一定是 正态分布,且\(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\)imageimage

    2. 二维正态分布的两个边缘分布都是一维正态分布,并且都不依赖于参数\(\rho\)

    3. 边缘分布均为正态分布的随机变量,联合分布 不一定 是二维正态分布

3. 条件分布

1. 离散型随机变量的条件分布

  1. \((X,Y)\)是二维随机变量,其分布律为\(P(X=x_i,Y=y_i)=p_{ij}\),对固定 \(i\), 若\(p_{i\cdot}>0\),则\(P(Y=y_i|X=x_i)=\frac{p_{ij}}{p_{i\cdot}}\)称为在条件\(X=x_i\) 下,随机变量\(Y\)的条件分布律;对固定 \(j\), 若\(p_{\cdot j}>0\),则\(P(X=x_i|Y=y_i)=\frac{p_{ij}}{p_{\cdot j}}\)称为在条件\(Y=y_i\) 下,随机变量\(X\)的条件分布律

2. 连续型随机变量的条件分布

  1. 给定\(y\),设对于任意的\(\varepsilon > 0\)\(P(y<Y\le y + \varepsilon)\)若对于任意实数\(x\),极限\(F_{X|Y}(x|y)=\lim_{\varepsilon\to 0^+}P(X\le x|y<Y\le y + \varepsilon)\)存在,则称此极限值为在条件\(Y=y\)下随机变量\(X\)条件分布函数,记为\(F_{X|Y}(x|y)\)或者\(P(X\le x|Y=y)\);同理可以定义 \(F_{Y|X}(y|x)=\lim_{\varepsilon\to 0^+}P(Y\le y|x<X\le x + \varepsilon)\)
  2. 注意:注意区分条件分布和条件概率,由于\(P(Y=y)\)可以为零,条件概率可能没有定义(连续型随机变量一定为零)
  3. 条件概率密度:设\((X,Y)\)的概率密度\(f(x,y),(X,Y)\)关于\(Y\)的边缘概率密度为\(f_Y(y)\),若对固定的\(y,f_y(y)>0\),则称\(f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)}\)为在\(Y=y\)的条件下\(X\)条件概率密度,条件分布函数可以写作\(F_{X|Y}(x|y)=\int_{-\infty}^{x}\frac{f(u,y)}{f_Y(y)}du\);同理,若对固定的\(x,f_x(x)>0\),则称\(f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)}\)为在\(X=x\)的条件下\(Y\)条件概率密度,条件分布函数可以写作\(F_{Y|X}(y|x)=\int_{-\infty}^{y}\frac{f(x,v)}{f_X(x)}dv\)
  4. 联合分布、边缘分布、条件分布的关系
    image

4. 相互独立的随机变量

1. 相互独立

  1. \(F(x,y),F_X(x),F_Y(y)\)分别是二维随机变量\((X,Y)\)的分布函数以及边缘分布函数,如果对所有\(x,y\),有\(P(X\le x,Y\le y) = P(X\le x)\cdot P(Y\le y)\)或者\(F(x,y)=F_X(x)\cdot F_Y(y)\),则称随机变量\(X,Y\)相互独立
  2. 相互独立等价条件
    1. 连续型:\(f(x,y) = f_X(x)\cdot f_Y(y)\)
    2. 离散型:\(p_{ij} = p_{i\cdot}p_{\cdot j}\)
  3. 设随机变量\(X\)\(Y\)相互独立,令\(U=h(x),V=g(Y)\),其中\(h(x),g(y)\)为连续函数,则\(U\)\(V\)相互独立
    1. 推广1:设\((X_1,X_2,\dots, X_n)\)的分布函数为\(F(X_1,X_2,\dots, X_n)\),若对任意的实数\(x_1,x_2,\dots,x_n\)均有\(F(x_1,x_2,\dots,x_n)=F(x_1)F(x_2)\cdots F(x_n)\),则称\(X_1,X_2,\dots, X_n\)相互独立(注意区分独立事件和独立变量)
    2. 推广2:若对任意的实数\(x_1,x_2,\dots,x_m; y_1,y_2,\dots, y_n\)均有\(F(x_1,x_2,\dots,x_m,y_1,y_2,\dots, y_n)\),则称\(X_1,X_2,\dots,X_m\)\(Y_1,Y_2,\dots,Y_n\)相互独立
    3. 推广3:设\(X_1,X_2,\dots,X_m\)\(Y_1,Y_2,\dots,Y_n\)相互独立,则\(X_i\)\(Y_j\)相互独立,其中\(h,g\)为连续函数,则\(h(X_1,X_2,\dots,X_m)\)\(Y_1,Y_2,\dots,Y_n\)相互独立

5. 二维随机变量的函数的分布

1. 函数的分布

  1. 离散型随机变量的函数分布
    1. 对于二维离散型随机变量\((X,Y)\),如果有\(Z=f(X,Y)\),那么 \(Z\)的分布律就是\((X,Y)\)在函数\(f\)的作用产生的值再对应相等求和即可
  2. 连续型随机变量的函数分布
    1. 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),则利用 分布函数法

      \[\begin{aligned} F_Z(z) &= P(Z\le z)\\ &=P(g(X,Y)\le z)\\ &=P((X,Y)\in D_Z)\\ &=\iint\limits_{D_Z}f(x,y)dxdy\\ f_Z(z) &= F_Z^{'}(z) \end{aligned} \]

2. 常见的函数分布

  1. \(Z=X+Y\)

    1. 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),那么\(Z=X+Y\)的概率密度为\(f_Z(z) = \int_{-\infty}^{+\infty}f(x,z-x)dx=\int_{-\infty}^{+\infty}f(z-y,y)dy\)
    2. 卷积公式:当\(X,Y\)相互 独立的时候,有卷积公式$f_Z(z) = f_X(x)\ast f_Y(y) = \int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy = \int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx $
    3. 推论
      1. 如果 \(X\sim N(\mu_1,\sigma_1^2),Y\sim N(\mu_2,\sigma_2^2)\)而且相互独立,那么\(Z=X+Y\)也服从 正态分布,且\(Z\sim N(\mu_1+\mu_2,\sigma_1^2 + \sigma_2^2)\)
      2. 有限个相互独立的正态随机变量的线性组合仍然服从正态分布

        \[\sum_{i=1}^{n}c_iX_i\sim N(\sum_{i=1}^{n}c_i\mu_i,\sum_{i=1}^{n}c_i^2\sigma_i^2) \]

    4. 推导

      \[\begin{aligned} F_Z(z) &= \iint\limits_{x+y\le z}f(x,y)dxdy\\ &= \int_{-\infty}^{+\infty}dx\int_{-\infty}^{z-x}f(x,y)dy\\ &= \int_{-\infty}^{+\infty}dx\int_{-\infty}^{z}f(x,u-x)du\qquad(y = u-x)\\ &= \int_{-\infty}^{z}[\int_{-\infty}^{+\infty}f(x,u-x)dx]du\\ f_Z(z) &= \int_{-\infty}^{+\infty}f(x,z-x)dx \end{aligned} \]

  2. \(Z=X-Y\)

    1. 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),那么\(Z=X-Y\)的概率密度为\(f_Z(z) = \int_{-\infty}^{+\infty}f(x,x-z)dx=\int_{-\infty}^{+\infty}f(z+y,y)dy\)
    2. 互相关:当\(X,Y\)相互 独立的时候,$f_Z(z) = \int_{-\infty}^{+\infty}f_X(z+y)f_Y(y)dy = \int_{-\infty}^{+\infty}f_X(x)f_Y(x-z)dx $
  3. \(Z=Y/X,Z=XY\)

    1. 对于二维连续型随机变量\((X,Y)\),设其概率密度为\(f(x,y)\),那么\(Z=Y/X,Z=XY\)的概率密度分别为

      \[f_{Y/X}(z) = \int_{-\infty}^{+\infty}|x|f(x,zx)dx\\ f_{XY}(z)=\int_{-\infty}^{+\infty}\frac{1}{|x|}f(x,\frac{z}{x})dx \]

    2. \(X,Y\)相互独立时,\(Z=Y/X,Z=XY\)的概率密度分别为

      \[f_{Y/X}(z)=\int_{-\infty}^{+\infty}|x|f_X(x)f_Y(zx)dx\\ f_{XY}(z) = \int_{-\infty}^{+\infty}\frac{1}{|x|}f_X(x)f_Y(\frac{z}{x})dx \]

    3. 证明image
  4. 最大值最小值分布

    1. \(X,Y\)是两个相互独立的随机变量,它们的分布函数分别是\(F_X(x),F_Y(y)\),那么对于任意的实数\(z\)
      1. \(F_{max}(z) = P(max(X,Y)\le z)=P(X\le z , Y\le z)=P(X\le z)P(Y\le z)=F_X(z)F_Y(z)\)
      2. \(F_{min}(z) = P(min(X,Y)\le z)=1-P(min(X,Y)>z)=1-[1-F_X(z)][1-F_Y(z)]\)
    2. 推广:设\(X_1,\dots,X_n\)相互独立,其分布函数分别为 \(F_{X_i}(x_i)\)
      1. \(F_{max}(z)=\prod_{i=1}^nF_{X_i}(z)\)
      2. \(F_{min}(z)=1-\prod_{i=1}^n[1-F_{X_i}(z)]\)
      3. 如果\(X_1,\dots,X_n\)相互独立而且具有相同分布函数\(F(x)\),有\(F_{max}(z)=[F(z)]^n,F_{min}(z)=1-[1-F(z)]^n\)

\(\Gamma\)分布
如果随机变量\(X\)的概率密度为 \(f(x)=\frac{\beta}{\Gamma(\alpha)}(\beta x)^{\alpha - 1}e^{-\beta x}\quad(x>0,\alpha>0,\beta >0)\)其他区间为0
则称\(X\)服从参数为\(\alpha,\beta\)的分布,记为\(X\sim \Gamma(\alpha,\beta)\)
一般结论:如果\(X_1,\dots,X_n\)相互独立,而且\(X_i\)服从参数为\(\alpha_i,\beta\)\(\Gamma\)分布,那么\(X_1+\dots+X_n\)服从参数为\(\alpha_1+\alpha_2+\dots+\alpha_n,\beta\)\(\Gamma\)分布

\(\Gamma\)函数
\(\Gamma(x) = \int_{0}^{+\infty}t^{x-1}e^{-t}dt(x>0)\)
性质

  1. \(\Gamma(\frac{1}{2})=\sqrt{\pi}\)
  2. \(\Gamma(1)=1\)
  3. 对于任何\(\alpha>0,\Gamma(\alpha+1)=\alpha\Gamma(\alpha)\)
  4. 对于任意正整数\(n\),有\(\Gamma(n)=(n-1)!\)

图像
image

posted @ 2022-11-05 17:31  RadiumStar  阅读(229)  评论(0编辑  收藏  举报