PT@多维随机变量@联合分布函数@联合分布律@边缘分布律@二维离散型随机变量和分布律

PT@多维随机变量@联合分布函数@联合分布律@边缘分布律@二维离散型随机变量和分布律

多维随机变量😊

  • X 1 , X 2 , ⋯   , X n 定义在同一个样本空间 S X_1,X_2,\cdots,X_n定义在同一个样本空间S X1,X2,,Xn定义在同一个样本空间S
    • X = ( X 1 , X 2 , ⋯   , X n ) 为 n 为随机向量或者随机变量 X=(X_1,X_2,\cdots,X_n)为n为随机向量或者随机变量 X=(X1,X2,,Xn)n为随机向量或者随机变量
  • 多维随机变量依赖于各个变量,还依赖与它们之间的联系

联合分布函数😊

  • 设 F ( X , Y ) = P ( {   X ⩽ x   } ∩ {   Y ⩽ y   } ) = ^ P ( X ⩽ x , Y ⩽ y ) 设F(X,Y)=P(\set{X\leqslant x}\cap \set{Y\leqslant y})\hat{=}P(X\leqslant x,Y\leqslant y) F(X,Y)=P({Xx}{Yy})=^P(Xx,Yy)

    • 其中, = ^ 可以读作 ( 理解为 ) \hat{=}可以读作(理解为) =^可以读作(理解为):记成
    • 偷懒点写,就直接用=,来表示了
  • 上式称为二维随机变量的分布函数

    • 为了强调多维,可以称为X与Y的联合分布函数
  • F(x,y)可以看做是随机点(X,Y),落在以x,y为右上角顶点的无穷大矩形 α \alpha α内的概率

    • 即发生事件: X < x , 且 Y < y 的概率 X<x,且Y<y的概率 X<x,Y<y的概率

性质

  • 右连续性:

    • F ( x , y ) 关于 x , y 都是一元右连续的 F(x,y)关于x,y都是一元右连续的 F(x,y)关于x,y都是一元右连续的
    • F ( x + 0 , y ) = F ( x , y ) , F ( x , y + 0 ) = F ( x , y ) F(x+0,y)=F(x,y),F(x,y+0)=F(x,y) F(x+0,y)=F(x,y),F(x,y+0)=F(x,y)
  • 规范性:

    • 0 ⩽ F ( x , y ) ⩽ 1 0\leqslant F(x,y)\leqslant 1 0F(x,y)1

      • lim ⁡ x → − ∞ F ( x , y ) = lim ⁡ y → − ∞ F ( x , y ) = lim ⁡ x → − ∞ y → − ∞ F ( x , y ) = 0 \lim\limits_{x\to-\infin}F(x,y) =\lim\limits_{y\to-\infin}F(x,y) =\lim\limits_{\begin{aligned}x\to-\infin\\y\to -\infin\end{aligned}}F(x,y)=0 xlimF(x,y)=ylimF(x,y)=xylimF(x,y)=0

      • lim ⁡ x → + ∞ y → + ∞ F ( x , y ) = 1 \lim\limits_{\begin{aligned}x\to+\infin\\y\to +\infin\end{aligned}}F(x,y)=1 x+y+limF(x,y)=1

  • 区间和概率:

    • 给定两个点 ( x 1 , y 1 ) , ( x 2 , y 2 ) 作为一个矩形的一条对角线 , 可以唯一确定一个矩形 给定两个点(x_1,y_1),(x_2,y_2)作为一个矩形的一条对角线,可以唯一确定一个矩形 给定两个点(x1,y1),(x2,y2)作为一个矩形的一条对角线,可以唯一确定一个矩形

      • x 1 < x 2 , y 2 < y 1 x_1<x_2,y_2<y_1 x1<x2,y2<y1

      • 并且可以确定下来全部的顶点:(顺时针环绕标记)

        • ∣ A ( x 1 , y 1 ) D ( x 2 , y 1 ) B ( x 1 , y 2 ) C ( x 2 , y 2 ) ∣ \boxed{ \begin{vmatrix} A(x_1,y_1)&&D(x_2,y_1) \\\\ B(x_1,y_2)&&C(x_2,y_2) \end{vmatrix} } A(x1,y1)B(x1,y2)D(x2,y1)C(x2,y2)

        • 左侧两点

        • A = ( x 1 , y 1 ) A=(x_1,y_1) A=(x1,y1)

        • B = ( x 1 , y 2 ) B=(x_1,y_2) B=(x1,y2)

        • 右侧两点

        • C = ( x 2 , y 2 ) C=(x_2,y_2) C=(x2,y2)

        • D = ( x 2 , y 1 ) D=(x_2,y_1) D=(x2,y1)

      • 分别以这4个点作为右上角顶点的无穷矩形(无穷大矩形)对应的也有4个

        • 为了便于描述 , 以无穷矩形的右上角顶点作为参数 , 描述 4 个矩形为 R ( X ) 为了便于描述,以无穷矩形的右上角顶点作为参数,描述4个矩形为R(X) 为了便于描述,以无穷矩形的右上角顶点作为参数,描述4个矩形为R(X)

          • X ∈ {   A , B , C , D   } X\in\set{A,B,C,D} X{A,B,C,D}
        • R(X)中包含了矩形ABCD的只有4个中的一个 ( 以 R ( C = ( x 2 , y 2 ) ) (以R(C=(x_2,y_2)) (R(C=(x2,y2))为右上角的矩形)

          • 从直观上看, S A B C D = S ( R ( D ) ) − S ( R ( A ) ) − [ S ( R ( C ) ) − S ( R ( B ) ) ] S_{ABCD}=S(R(D))-S(R(A))-[S(R(C))-S(R(B))] SABCD=S(R(D))S(R(A))[S(R(C))S(R(B))]
            • S A B C D = S ( R ( D ) ) − S ( R ( A ) ) − S ( R ( C ) ) + S ( R ( B ) ) S_{ABCD}=S(R(D))-S(R(A))-S(R(C))+S(R(B)) SABCD=S(R(D))S(R(A))S(R(C))+S(R(B))
    • P ( x 1 < X ⩽ x 2 , y 1 < Y ⩽ y 2 ) = F ( x 2 , y 2 ) − F ( x 1 , y 2 ) − F ( x 2 , y 1 ) + F ( x 1 , y 1 ) = ∑ i = 1 2 F ( x i , y i ) − ∑ i = 1 2 F ( x i , y 3 − i ) P(x_1< X\leqslant x_2,y_1< Y\leqslant y_2) \\ =F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1) \\ =\sum\limits_{i=1}^{2}F(x_i,y_i)-\sum\limits_{i=1}^{2}F(x_i,y_{3-i}) P(x1<Xx2,y1<Yy2)=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)=i=12F(xi,yi)i=12F(xi,y3i)

    • 证明
      P ( x 1 < X ⩽ x 2 , y 1 < Y ⩽ y 2 ) = S ( R ( C ) ) − S ( R ( B ) ) − S ( R ( D ) ) + S ( R ( A ) ) = P ( X ⩽ x 2 , Y ⩽ y 2 ) − P ( X ⩽ x 1 , Y ⩽ y 2 ) − P ( X ⩽ x 2 , Y ⩽ y 1 ) + P ( X ⩽ x 1 , Y ⩽ y 1 ) = F ( x 2 , y 2 ) − F ( x 1 , y 2 ) − F ( x 2 , y 1 ) + F ( x 1 , y 1 ) = ∑ i = 1 2 F ( x i , y i ) − ∑ i = 1 2 F ( x i , y 3 − i ) P(x_1< X\leqslant x_2,y_1< Y\leqslant y_2) \\=S(R(C))-S(R(B))-S(R(D))+S(R(A)) \\=P(X\leqslant x_2,Y\leqslant y_2)-P(X\leqslant x_1,Y\leqslant y_2) -P(X\leqslant x_2,Y\leqslant y_1)+P(X\leqslant x_1,Y\leqslant y_1) \\=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1) \\=\sum\limits_{i=1}^{2}F(x_i,y_i)-\sum\limits_{i=1}^{2}F(x_i,y_{3-i}) \\ P(x1<Xx2,y1<Yy2)=S(R(C))S(R(B))S(R(D))+S(R(A))=P(Xx2,Yy2)P(Xx1,Yy2)P(Xx2,Yy1)+P(Xx1,Yy1)=F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)=i=12F(xi,yi)i=12F(xi,y3i)

边缘分布函数🎈

  • 多维随机变量的每个分量都是一维随机变量

    • 它们都有各自的分布函数
      • 一般的(n维),有:
        • F X i ( x i ) = P ( X i ⩽ x i ) F_{X_i}(x_i)=P(X_i\leqslant x_i) FXi(xi)=P(Xixi)
      • 对于n=2维
        • F X ( x ) = P ( X ⩽ x ) F_X(x)=P(X\leqslant x) FX(x)=P(Xx)
        • F Y ( y ) = P ( Y ⩽ y ) F_Y(y)=P(Y\leqslant y) FY(y)=P(Yy)
        • 分别称,这两个分布函数为(X,Y)关于X和Y的边缘分布函数(边缘分布)
  • 对于任意一个随机变量分量 X i X_i Xi

    • {   X i < + ∞   } 是一个必然事件 , 它和任意事件 Φ 的交集都是 Φ \set{X_i<+\infin}是一个必然事件,它和任意事件\varPhi的交集都是\varPhi {Xi<+}是一个必然事件,它和任意事件Φ的交集都是Φ

      • 因为,任意一次试验,观察到的结果的分量 X i < + ∞ X_i<+\infin Xi<+总是成立的
    • 那么:

      • {   X ⩽ x   } = {   X ⩽ x   } ∩ {   Y < + ∞   } = {   X ⩽ x , Y ⩽ + ∞   } \set{X\leqslant x}=\set{X\leqslant x}\cap\set{Y<+\infin}=\set{X\leqslant x,Y\leqslant +\infin} {Xx}={Xx}{Y<+}={Xx,Y+}

      • F X ( x ) = P ( X ⩽ x ) = P ( X ⩽ x , Y < + ∞ ) = lim ⁡ y → + ∞ F ( x , y ) 记作 F X ( x ) = F X ( x , + ∞ ) 相应的 F Y ( y ) = F Y ( + ∞ , y ) F_X(x)= P(X\leqslant x)=P(X\leqslant x,Y<+\infin) =\lim\limits_{y\to+\infin}F(x,y) \\记作F_X(x)=F_X(x,+\infin) \\相应的F_{Y}(y)=F_Y(+\infin,y) FX(x)=P(Xx)=P(Xx,Y<+)=y+limF(x,y)记作FX(x)=FX(x,+)相应的FY(y)=FY(+,y)

分类

  • 以二维为例

    • 二维离散型随机变量分布函数(分布律)

    • 二维连续型随机变量分布函数

联合分布和边缘分布的关系

  • 联合分布通过求极限,可以确定唯一的边缘分布
  • 边缘分布却无法反过来确定唯一的联合分布
  • 因此,联合分布汇总不仅仅包含各个分量的信息而且包含了随机变量每个分量之间的关系的信息
    • 因此要从整体上研究多维随机变量
    • 而不仅仅独立研究各个分量

随机变量独立性

  • 例如,

    • 5件产品中有3件正品,2件次品

    • 从中抽取量次

      • X i = { 1 , 第 i 次取到正品 0 , 第 i 次取到次品 ( i = 1 , 2 ) X_i= \begin{cases} 1,第i次取到正品 \\ 0,第i次取到次品 \end{cases} \quad (i=1,2) Xi={1,i次取到正品0,i次取到次品(i=1,2)

      • 其中, X 1 , X 2 X_1,X_2 X1,X2分别表示一个随机变量

    • 对于有放回抽样 X 1 , X 2 X_1,X_2 X1,X2之间是相互独立的

    • 对于无放回抽样 X 1 , X 2 X_1,X_2 X1,X2之间是有关联的

      • X 2 将受到 X 1 的取值影响 X_2将受到X_1的取值影响 X2将受到X1的取值影响

联合分布函数😊

  • F ( x , y ) = P ( x ⩽ X , y ⩽ Y ) F(x,y)=P(x\leqslant{X},y\leqslant{Y}) F(x,y)=P(xX,yY)
    • 多维(二维)随机变量,无论是离散型还是连续型,都具有相同的基础定义形式
    • 不过离散型更多的使用分布律
    • 连续型更多的使用分布函数

二维离散型随机变量😊

  • 如果X,Y都是离散型随机变量,那么(X,Y)就是离散型随机变量
    • 只要有限或者可列无穷多对 ( x i , y j ) (x_i,y_j) (xi,yj)

联合分布律😊

  • 定义二维随机变量的分布律:
    • 研究每一对(X,Y)的取值以及其概率
    • 如果二维随机变量 ( X , Y ) 的全部可能取值可以被表示成 : {   ( x i , y j ) ∣ i , j = 1 , 2 , ⋯   } 如果二维随机变量(X,Y)的全部可能取值可以被表示成:\set{(x_i,y_j)|i,j=1,2,\cdots} 如果二维随机变量(X,Y)的全部可能取值可以被表示成:{(xi,yj)i,j=1,2,}
    • 那么关系式🎈
      • α : P ( X = x i , Y = y j ) = p i j \alpha:P(X=x_i,Y=y_j)=p_{ij} α:P(X=xi,Y=yj)=pij
      • p i j 表示事件 : X = x i , Y = y j 发生的概率 p_{ij}表示事件:X=x_i,Y=y_j发生的概率 pij表示事件:X=xi,Y=yj发生的概率
      • α 就是 ( X , Y ) 的分布律 ( 联合分布律 ) \alpha就是(X,Y)的分布律(联合分布律) α就是(X,Y)的分布律(联合分布律)
性质
  • 非负性

    • p i j ⩾ 0 p_{ij}\geqslant 0 pij0

    • ∑ i ⩾ 1 ∑ j ⩾ 1 p i j = 1 二重循环 \sum\limits_{i\geqslant1}\sum\limits_{j\geqslant1}^{}p_{ij}=1 \\二重循环 i1j1pij=1二重循环

      • 这一条性质从直观上也容易理解

      • 如果X,Y相互独立

      • 首先 , 根据一维分布律的性质 : { ∑ i ⩾ 1 p i = 1 ∑ j ⩾ 1 q j = 1 ( ∑ i ⩾ 1 p i ) ( ∑ j ⩾ 1 q j ) = 1 × 1 = 1 首先,根据一维分布律的性质:\\ \begin{cases} \sum\limits_{i\geqslant 1}p_i=1 \\\\ \sum\limits_{j\geqslant 1}q_j=1 \end{cases}\\ \\ \left(\sum\limits_{i\geqslant 1}p_i\right) \left(\sum\limits_{j\geqslant 1}q_j\right)=1\times 1=1 \\ 首先,根据一维分布律的性质: i1pi=1j1qj=1(i1pi)(j1qj)=1×1=1

      • 或者利用多项式乘法展开也一样有 : ∑ i ⩾ 1 ( q i ( ∑ j ⩾ 1 q j ) ) = ∑ i ⩾ 1 ( p i ⋅ 1 ) = ∑ i ⩾ 1 p i = 1 或者利用多项式乘法展开也一样有: \\\sum\limits_{i\geqslant 1}\left(q_i\left(\sum\limits_{j\geqslant 1}q_j\right)\right)=\sum\limits_{i\geqslant 1}(p_i\cdot 1) =\sum\limits_{i\geqslant 1}p_i=1 或者利用多项式乘法展开也一样有:i1(qi(j1qj))=i1(pi1)=i1pi=1

边缘分布律🎈

  • 边缘事件

  • { X = x i } = { X = x i , Y < + ∞ } = ⋃ j ⩾ 1 { X = x i , Y = y j } \{X=x_i\}=\{X=x_i,Y<+\infin\}=\bigcup\limits_{j\geqslant{1}}\{X=x_i,Y=y_j\} {X=xi}={X=xi,Y<+}=j1{X=xi,Y=yj}

    • 记:
      P ( X = x i ) = p i ⋅ ( i = 1 , 2 , ⋯   ) P ( Y = y j ) = p ⋅ j ( j = 1 , 2 , ⋯   ) P(X=x_i)=p_{i\cdot}(i=1,2,\cdots) \\ P(Y=y_j)=p_{\cdot{j}}(j=1,2,\cdots) P(X=xi)=pi(i=1,2,)P(Y=yj)=pj(j=1,2,)

    • 随机变量 X 的分布律 : P ( X = x i ) = ∑ j = 1 + ∞ P ( X = x i , Y = y j ) = ∑ j = 1 + ∞ p i j = p i ⋅ ( i = 1 , 2 , ⋯   , N X ) 随机变量 Y 的分布律 : P ( Y = y j ) = ∑ i = 1 + ∞ P ( X = x i , Y = y j ) = ∑ i = 1 + ∞ p i j = p ⋅ j ( j = 1 , 2 , ⋯   , N Y ) \\随机变量X的分布律: \\ P(X=x_i) =\sum\limits_{j=1}^{+\infin}P(X=x_i,Y=y_j) =\sum\limits_{j=1}^{+\infin}p_{ij} =p_{i\cdot} \quad (i=1,2,\cdots,N_X) \\随机变量Y的分布律: \\ P(Y=y_j) =\sum\limits_{i=1}^{+\infin}P(X=x_i,Y=y_j) =\sum\limits_{i=1}^{+\infin}p_{ij} =p_{\cdot j} \quad (j=1,2,\cdots,N_Y) 随机变量X的分布律:P(X=xi)=j=1+P(X=xi,Y=yj)=j=1+pij=pi(i=1,2,,NX)随机变量Y的分布律:P(Y=yj)=i=1+P(X=xi,Y=yj)=i=1+pij=pj(j=1,2,,NY)

  • 假设X的可能取值个数为 N X N_X NX

    • 那么 P ( X = x i ) , i = 1 , ⋯   , N X 就包含了 N X 个概率 那么P(X=x_i),i=1,\cdots,N_X就包含了N_X个概率 那么P(X=xi),i=1,,NX就包含了NX个概率
  • 从上述定义可以看出,边缘分布的对象是多维随机变量 S = ( X 1 , X 2 , ⋯   , X n ) \mathscr{S}=(X_1,X_2,\cdots,X_n) S=(X1,X2,,Xn)中的某个分量 X k X_k Xk

    • 记 x k i 记x_{ki} xki表示分量 X k X_k Xk的某个可能取值
    • N X k \large N_{X_k} NXk表示分量 X k X_k Xk的可能取值的个数,同时表征了i的取值范围 i ∈ [ 1 , N X k ] i\in[1,N_{X_k}] i[1,NXk]
    • P ( X k = x k i ) \huge P(X_k=x_{ki}) P(Xk=xki)表示将分量 X k X_k Xk的取值固定为 x k i x_{ki} xki后,其他分量( X l , l ≠ k X_l,l\neq{k} Xl,l=k)在事件 X k = x k i X_k=x_{ki} Xk=xki发生了的前提条件下,还可能取得的所有值对应的概率总和
  • 5件产品(3件正品/2件次品)

    • 从中抽取两次

      • 每次取一件


      • X i = { 1 , 第 i 次取到正品 0 , 第 i 次取到次品 i = 1 , 2 X_i= \begin{cases} 1,&第i次取到正品 \\0,&第i次取到次品 \end{cases} i=1,2 \\ Xi={1,0,i次取到正品i次取到次品i=1,2

        从上面的记法描述上看 : X 1 , X 2 是两个随机变量 , ( X 1 , X 2 ) 是二维随机变量 两个随机变量具有相同的取值范围 ( 可能 ) : 1 , 2 经过排列组合计算 , 可以确定离散型二维随机变量 ( X 1 , X 2 ) 有 4 取值可能 从上面的记法描述上看: \\X_1,X_2是两个随机变量, \\(X_1,X_2)是二维随机变量 \\ 两个随机变量具有相同的取值范围(可能):1,2 \\经过排列组合计算,可以确定离散型二维随机变量(X_1,X_2)有4取值可能 从上面的记法描述上看:X1,X2是两个随机变量,(X1,X2)是二维随机变量两个随机变量具有相同的取值范围(可能):1,2经过排列组合计算,可以确定离散型二维随机变量(X1,X2)4取值可能

    • 假设抽取是有放回的,那么:

      • 两次抽取可以看成是相互独立的

      • P ( X 1 = 0 , X 2 = 0 ) = P ( X 1 = 0 ) P ( X 2 = 0 ) = 2 5 2 5 = 4 25 P ( X 1 = 0 , X 2 = 1 ) = P ( X 1 = 0 ) P ( X 2 = 1 ) = 2 5 3 5 = 6 25 P ( X 1 = 1 , X 2 = 0 ) = P ( X 1 = 1 ) P ( X 2 = 0 ) = 3 5 2 5 = 6 25 P ( X 1 = 1 , X 2 = 1 ) = P ( X 1 = 1 ) P ( X 2 = 1 ) = 3 5 3 5 = 9 25 P(X_1=0,X_2=0)=P(X_1=0)P(X_2=0)=\frac{2}{5}\frac{2}{5}=\frac{4}{25} \\P(X_1=0,X_2=1)=P(X_1=0)P(X_2=1)=\frac{2}{5}\frac{3}{5}=\frac{6}{25} \\P(X_1=1,X_2=0)=P(X_1=1)P(X_2=0)=\frac{3}{5}\frac{2}{5}=\frac{6}{25} \\P(X_1=1,X_2=1)=P(X_1=1)P(X_2=1)=\frac{3}{5}\frac{3}{5}=\frac{9}{25} P(X1=0,X2=0)=P(X1=0)P(X2=0)=5252=254P(X1=0,X2=1)=P(X1=0)P(X2=1)=5253=256P(X1=1,X2=0)=P(X1=1)P(X2=0)=5352=256P(X1=1,X2=1)=P(X1=1)P(X2=1)=5353=259

        关于 X 1 的边缘分布律 : P ( X 1 = 0 ) = P ( X 1 = 0 , X 2 = 0 ) + P ( X 1 = 0 , X 2 = 1 ) = 10 25 = 2 5 P ( X 1 = 1 ) = P ( X 1 = 1 , X 2 = 0 ) + P ( X 1 = 1 , X 2 = 1 ) = 15 25 = 3 5 或者 P ( X 1 = 1 ) = 1 − P ( X 0 ) = 2 5 关于X_1的边缘分布律: \\P(X_1=0)=P(X_1=0,X_2=0)+P(X_1=0,X_2=1)=\frac{10}{25}=\frac{2}{5} \\P(X_1=1)=P(X_1=1,X_2=0)+P(X_1=1,X_2=1)=\frac{15}{25}=\frac{3}{5} \\或者P(X_1=1)=1-P(X_0)=\frac{2}{5} 关于X1的边缘分布律:P(X1=0)=P(X1=0,X2=0)+P(X1=0,X2=1)=2510=52P(X1=1)=P(X1=1,X2=0)+P(X1=1,X2=1)=2515=53或者P(X1=1)=1P(X0)=52

      • 类似的可以计算 X 2 的边缘分布律 类似的可以计算X_2的边缘分布律 类似的可以计算X2的边缘分布律

        • P ( X 2 = 0 ) = 2 5 P ( X 2 = 1 ) = 3 5 P(X_2=0)=\frac{2}{5} \\P(X_2=1)=\frac{3}{5} P(X2=0)=52P(X2=1)=53
    • 假设抽取是不放回的:(利用条件概率来计算)
      P ( X 1 = 0 , X 2 = 0 ) = P ( X 1 = 0 ) P ( X 2 = 0 ∣ x 1 = 0 ) = 2 5 1 4 = 1 10 P ( X 1 = 0 , X 2 = 1 ) = P ( X 1 = 0 ) P ( X 2 = 1 ∣ X 1 = 0 ) = 2 5 3 4 = 3 10 P ( X 1 = 1 , X 2 = 0 ) = P ( X 1 = 1 ) P ( X 2 = 0 ∣ X 1 = 1 ) = 3 5 2 4 = 3 10 P ( X 1 = 1 , X 2 = 1 ) = P ( X 1 = 1 ) P ( X 2 = 1 ∣ X 1 = 1 ) = 3 5 2 4 = 3 10 P(X_1=0,X_2=0)=P(X_1=0)P(X_2=0|x_1=0)=\frac{2}{5}\frac{1}{4}=\frac{1}{10} \\P(X_1=0,X_2=1)=P(X_1=0)P(X_2=1|X_1=0)=\frac{2}{5}\frac{3}{4}=\frac{3}{10} \\P(X_1=1,X_2=0)=P(X_1=1)P(X_2=0|X_1=1)=\frac{3}{5}\frac{2}{4}=\frac{3}{10} \\P(X_1=1,X_2=1)=P(X_1=1)P(X_2=1|X_1=1)=\frac{3}{5}\frac{2}{4}=\frac{3}{10} P(X1=0,X2=0)=P(X1=0)P(X2=0∣x1=0)=5241=101P(X1=0,X2=1)=P(X1=0)P(X2=1∣X1=0)=5243=103P(X1=1,X2=0)=P(X1=1)P(X2=0∣X1=1)=5342=103P(X1=1,X2=1)=P(X1=1)P(X2=1∣X1=1)=5342=103

    • 边缘分布可以类似的求

  • 三个球等可能放入编号为1,2,3的三个盒子中
    • 记:若干如第1号盒子中的球的个数为X
      • 落入第2号盒子中的球个数为Y
    • 设 ( X , Y ) 的所有可能取值 ( i , j ) , 其中 0 ⩽ i + j ⩽ 3 设(X,Y)的所有可能取值(i,j),其中0 \leqslant i+j\leqslant 3 (X,Y)的所有可能取值(i,j),其中0i+j3
      • i , j 单独来看 , 取值范围为 0 , 1 , 2 , 3 i,j单独来看,取值范围为0,1,2,3 i,j单独来看,取值范围为0,1,2,3
      • 但是整体上看,可更加准确的描述:
        • 例如,i=3,j=3不能同时发生
          • 或者说,如果已经知道X或者Y中某一个的取值,另一个分量的取值将会收到进一步的约束
            • 往往和条件概率相关
        • 因此,再次验证了,多个分量之间要以整体的角度来分析,而不单单是单个分量各自独立研究
    • 假设已经知道落入第2号盒子中的球的数量为j
      • 表示为 P ( Y = j ) = ( 3 j ) ( 1 3 ) j ( 2 3 ) 3 − j 表示为P(Y=j)=\binom{3}{j}(\frac{1}{3})^j(\frac{2}{3})^{3-j} 表示为P(Y=j)=(j3)(31)j(32)3j
      • 那么剩余 3 − j 个球的去处要么是 1 号盒子 , 要么是 3 号盒子 那么剩余3-j个球的去处要么是1号盒子,要么是3号盒子 那么剩余3j个球的去处要么是1号盒子,要么是3号盒子
        • 又因为 , 我们假设好落入到 1 号盒子中的球的个数为 i 又因为,我们假设好落入到1号盒子中的球的个数为i 又因为,我们假设好落入到1号盒子中的球的个数为i
          • i个球落入第1号盒子中的概率表示为:
            • P ( X = i ∣ Y = j ) = ( 3 − j i ) ( 1 2 ) i ( 1 2 ) 3 − j − i P(X=i|Y=j)=\binom{3-j}{i}(\frac{1}{2})^{i}(\frac{1}{2})^{3-j-i} P(X=iY=j)=(i3j)(21)i(21)3ji
            • 如果记 t = 3 − j , P ( X = i ∣ Y = j ) = ( t i ) ( 1 2 ) i ( 1 2 ) t − i 如果记t=3-j,P(X=i|Y=j)=\binom{t}{i}(\frac{1}{2})^{i}(\frac{1}{2})^{t-i} 如果记t=3j,P(X=iY=j)=(it)(21)i(21)ti
        • 可以看出上述两个式子都是二项分布

p i j = P ( X = i ∩ Y = j ) = P ( X = i ∣ Y = j ) P ( Y = j ) = ( 3 − j i ) ( 1 2 ) i ( 1 2 ) 3 − j − i ( 3 j ) ( 1 3 ) j ( 2 3 ) 3 − j = 1 3 3 ⋅ 3 ! i ! j ! ( 3 − j − i ) ! , ( 0 ⩽ i + j ⩽ 3 ) p_{ij}=P(X=i\cap Y=j)=P(X=i|Y=j)P(Y=j) \\ =\binom{3-j}{i}(\frac{1}{2})^i(\frac{1}{2})^{3-j-i} \binom{3}{j}(\frac{1}{3})^j(\frac{2}{3})^{3-j} \\=\frac{1}{3^3}\cdot \frac{3!}{i!j!(3-j-i)!},(0\leqslant i+j\leqslant 3) pij=P(X=iY=j)=P(X=iY=j)P(Y=j)=(i3j)(21)i(21)3ji(j3)(31)j(32)3j=331i!j!(3ji)!3!,(0i+j3)

多维随机变量分布

多项分布

  • 假设进行n次独立重复试验,每次试验有r个可能的结果:

    • {   A 1   } , i = 1 , 2 , ⋯   , r \set{A_1},i=1,2,\cdots,r {A1},i=1,2,,r

      每次试验中, P ( A i ) = p i P(A_i)=p_i P(Ai)=pi

    • 记 X i 为 n 次独立重复试验中 A i 发生的次数 记X_i为n次独立重复试验中A_i发生的次数 Xin次独立重复试验中Ai发生的次数

      • X i = n i 表示 n 次独立试验中 , 事件 A i 发生的次数为 n i 次 X_i=n_i表示n次独立试验中,事件A_i发生的次数为n_i次 Xi=ni表示n次独立试验中,事件Ai发生的次数为ni
      • 显然,有 ∑ i = 1 r n i = n \sum\limits_{i=1}^{r}n_i=n i=1rni=n
    • r 维随机变量 ( X i , ⋯   , X r ) 的分布律 : r维随机变量(X_i,\cdots,X_r)的分布律: r维随机变量(Xi,,Xr)的分布律:

      • n ! n 1 ! ⋯ n r ! p 1 n 1 × ⋯ × p r n r , when  ∑ i = 1 r n i = n {n! \over n_{1}!\cdots n_{r}!}p_{1}^{n_{1}}\times \cdots \times p_{r}^{n_{r}}, {\text{when }}\sum _{i=1}^{r}n_{i}=n n1!nr!n!p1n1××prnr,when i=1rni=n

      • P ( X 1 = n 1 , X 2 = n 2 , ⋯   , X r = n r ) = P ( ⋂ i = 1 r X i = n i ) = n ! ∏ i = 1 r n i ! ∏ i = 1 r p i n i = n ! ∏ i = 1 r p i n i n i ! P(X_1=n_1,X_2=n_2,\cdots,X_r=n_r) \\=P(\bigcap_{i=1}^{r}X_i=n_i) \\=\frac{n!}{\prod\limits_{i=1}^{r}{n_i !}}{\prod_{i=1}^{r}{p_i^{n_i}}} \\=n!\prod_{i=1}^{r}\frac{p_i^{n_i}}{n_i!} P(X1=n1,X2=n2,,Xr=nr)=P(i=1rXi=ni)=i=1rni!n!i=1rpini=n!i=1rni!pini

最大分布&最小分布

  • 设随机变量序列 S = X 1 , X 2 , ⋯   , X n 相互独立 ‾ , X i 的分布函数为 F X i ( x ) , i = 1 , ⋯   , n 令 M = m a x ( S ) N = m i n ( S ) 设随机变量序列S=X_1,X_2,\cdots,X_n\underline{相互独立}, \\X_i的分布函数为F_{X_i}(x),i=1,\cdots,n \\令M=max(S) \\N=min(S) 设随机变量序列S=X1,X2,,Xn相互独立,Xi的分布函数为FXi(x),i=1,,nM=max(S)N=min(S)

    • M 的分布函数为 F M ( x ) = ∏ i = 1 n F X i ( x ) F M ( x ) = P ( M ⩽ x ) = P ( M a x ( S ) ⩽ x ) = P ( ⋂ i = 1 n ( X i ⩽ x ) ) 根据 X 1 , ⋯   , X n 间的独立性 = ∏ i = 1 n P ( X i ⩽ x ) = ∏ i = 1 n F X i ( x ) \\ M的分布函数为F_{M}(x)=\prod_{i=1}^{n}F_{X_i}(x) \\ F_{M}(x)=P(M\leqslant{x})=P(Max{(S)}\leqslant{x}) \\=P(\bigcap\limits_{i=1}^{n}(X_i\leqslant{x})) \\根据X_1,\cdots,X_n间的独立性 \\=\prod_{i=1}^{n}P(X_i\leqslant{x}) \\=\prod_{i=1}^{n}F_{X_i}(x) \\ M的分布函数为FM(x)=i=1nFXi(x)FM(x)=P(Mx)=P(Max(S)x)=P(i=1n(Xix))根据X1,,Xn间的独立性=i=1nP(Xix)=i=1nFXi(x)

    • N 的分布函数为 F N ( x ) = 1 − ∏ i = 1 n ( 1 − F X i ( x ) ) F N ( x ) = P ( N ⩽ x ) = P ( M i n ( S ) ⩽ x ) = P ( ⋂ i = 1 n ( X i ⩽ x ) ) 但这个式子不容易推出结果 尝试从反面来间接计算 ( 利用规范性 : F ( x ) = P ( X ⩽ x ) = 1 − P ( X > x ) ) P ( N > x ) = P ( M i n ( S ) > S ) = P ( ⋂ i = 1 n ( X i ⩾ x ) ) = 根据 X 1 , ⋯   , X n 间的独立性 = ∏ i = 1 n P ( X i ⩾ x ) = ∏ i = 1 n ( 1 − P ( X i ⩽ x ) ) = ∏ i = 1 n ( 1 − F X i ( x ) ) 从而 : F N ( x ) = P ( N ⩽ x ) = 1 − P ( N > x ) = 1 − ∏ i = 1 n ( 1 − F X i ( x ) ) N的分布函数为F_{N}(x)=1-\prod_{i=1}^{n}(1-F_{X_i}(x)) \\ F_{N}(x)=P(N\leqslant{x})=P(Min{(S)}\leqslant{x}) \\=P(\bigcap\limits_{i=1}^{n}(X_i\leqslant{x})) \\但这个式子不容易推出结果 \\尝试从反面来间接计算(利用规范性:F(x)=P(X\leqslant{x})=1-P(X>x)) \\\begin{aligned} \\P(N>x)&=P(Min(S)>S) \\&=P(\bigcap_{i=1}^{n}(X_i\geqslant{x})) \\ &\xlongequal{根据X_1,\cdots,X_n间的独立性} \\&=\prod_{i=1}^{n}P(X_i\geqslant{x}) \\&=\prod_{i=1}^{n}(1-P(X_i\leqslant{x})) \\&=\prod_{i=1}^{n}(1-F_{X_i}(x)) \end{aligned} \\从而: \\F_{N}(x)=P(N\leqslant{x})=1-P(N>x) \\=1-\prod_{i=1}^{n}(1-F_{X_i}(x)) N的分布函数为FN(x)=1i=1n(1FXi(x))FN(x)=P(Nx)=P(Min(S)x)=P(i=1n(Xix))但这个式子不容易推出结果尝试从反面来间接计算(利用规范性:F(x)=P(Xx)=1P(X>x))P(N>x)=P(Min(S)>S)=P(i=1n(Xix))根据X1,,Xn间的独立性 =i=1nP(Xix)=i=1n(1P(Xix))=i=1n(1FXi(x))从而:FN(x)=P(Nx)=1P(N>x)=1i=1n(1FXi(x))

  • 特别的如果 X 1 , ⋯   , X n X_1,\cdots,X_n X1,,Xn独立同分布,那么有:

    • 由 : F M ( x ) = F M a x ( x ) = ∏ i = 1 n F X i ( x ) F N ( x ) = F M i n ( x ) = 1 − ∏ i = 1 n ( 1 − F X i ( x ) ) 得到 : F M ( x ) = F M a x ( x ) = ( F X i ( x ) ) n F N ( x ) = F M i n ( x ) = 1 − ( 1 − F X i ( x ) ) n 由: \\F_{M}(x)=F_{Max}(x)=\prod_{i=1}^{n}F_{X_i}(x) \\F_{N}(x)=F_{Min}(x)=1-\prod_{i=1}^{n}(1-F_{X_i}(x)) \\\\得到: F_{M}(x)=F_{Max}(x)= (F_{X_i}(x))^n \\F_{N}(x)=F_{Min}(x)=1- (1-F_{X_i}(x))^n :FM(x)=FMax(x)=i=1nFXi(x)FN(x)=FMin(x)=1i=1n(1FXi(x))得到:FM(x)=FMax(x)=(FXi(x))nFN(x)=FMin(x)=1(1FXi(x))n

    • 基于独立同分布 , 如果 X i , i = 1 , 2 , ⋯   , n 还都是连续型的 : 基于独立同分布,如果X_i,i=1,2,\cdots,n还都是连续型的: 基于独立同分布,如果Xi,i=1,2,,n还都是连续型的:

      • 设 X i 的概率密度为 f ( x ) 设X_i的概率密度为f(x) Xi的概率密度为f(x)

      • 由符合函数求导法:

      • F M ( x ) = n ( F n − 1 ( x ) ) f ( x ) F N ( x ) = n ( 1 − F ( x ) ) n − 1 f ( x ) F_{M}(x)=n(F^{n-1}(x))f(x) \\F_{N}(x)=n(1-F(x))^{n-1}f(x) FM(x)=n(Fn1(x))f(x)FN(x)=n(1F(x))n1f(x)

posted @   xuchaoxin1375  阅读(11)  评论(0编辑  收藏  举报  
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
历史上的今天:
2021-10-24 powershell@Get-ChildItem美化@ls文件列表文件图标样式和配色@Terminal-icons@lsd
点击右上角即可分享
微信分享提示