PT@多维随机变量@联合分布函数@联合分布律@边缘分布律@二维离散型随机变量和分布律

文章目录

PT@多维随机变量@联合分布函数@联合分布律@边缘分布律@二维离散型随机变量和分布律

PT@多维随机变量@联合分布函数@联合分布律@边缘分布律@二维离散型随机变量和分布律

多维随机变量😊

$X_1,X_2,\cdots,X_n定义在同一个样本空间S$
- $X=(X_1,X_2,\cdots,X_n)为n为随机向量或者随机变量$
多维随机变量依赖于各个变量,还依赖与它们之间的联系

联合分布函数😊

$设F(X,Y)=P(\set{X\leqslant x}\cap \set{Y\leqslant y})\hat{=}P(X\leqslant x,Y\leqslant y)$
- 其中, $\hat{=}可以读作(理解为)$ :记成
- 偷懒点写,就直接用=,来表示了
上式称为二维随机变量的分布函数
- 为了强调多维,可以称为X与Y的联合分布函数
F(x,y)可以看做是随机点(X,Y),落在以x,y为右上角顶点的无穷大矩形 $\alpha$ 内的概率
- 即发生事件: $X < x, 且 Y < y 的概率$

性质

右连续性:
- $F (x, y) 关于 x, y 都是一元右连续的$
- $F (x + 0, y) = F (x, y), F (x, y + 0) = F (x, y)$
规范性:
- $0\leqslant F(x,y)\leqslant 1$
  - $\lim\limits_{x\to-\infin}F(x,y) =\lim\limits_{y\to-\infin}F(x,y) =\lim\limits_{\begin{aligned}x\to-\infin\\y\to -\infin\end{aligned}}F(x,y)=0$
  - $\lim\limits_{\begin{aligned}x\to+\infin\\y\to +\infin\end{aligned}}F(x,y)=1$
区间和概率:
- $给定两个点(x_1,y_1),(x_2,y_2)作为一个矩形的一条对角线,可以唯一确定一个矩形$
  - 设 $x_1<x_2,y_2<y_1$
  - 并且可以确定下来全部的顶点:(顺时针环绕标记)
    - $\boxed{ \begin{vmatrix} A(x_1,y_1)&&D(x_2,y_1) \\\\ B(x_1,y_2)&&C(x_2,y_2) \end{vmatrix} }$
    - 左侧两点
    - $A=(x_1,y_1)$
    - $B=(x_1,y_2)$
    - 右侧两点
    - $C=(x_2,y_2)$
    - $D=(x_2,y_1)$
  - 分别以这4个点作为右上角顶点的无穷矩形(无穷大矩形)对应的也有4个
    - $为了便于描述, 以无穷矩形的右上角顶点作为参数, 描述 4 个矩形为 R (X)$
      - $X\in\set{A,B,C,D}$
    - R(X)中包含了矩形ABCD的只有4个中的一个 $以R(C=(x_2,y_2))$ 为右上角的矩形)
      - 从直观上看, $S_{ABCD}=S(R(D))-S(R(A))-[S(R(C))-S(R(B))]$
        $S_{ABCD}=S(R(D))-S(R(A))-S(R(C))+S(R(B))$
- $P(x_1< X\leqslant x_2,y_1< Y\leqslant y_2) \\ =F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1) \\ =\sum\limits_{i=1}^{2}F(x_i,y_i)-\sum\limits_{i=1}^{2}F(x_i,y_{3-i})$
- 证明
  $P(x_1< X\leqslant x_2,y_1< Y\leqslant y_2) \\=S(R(C))-S(R(B))-S(R(D))+S(R(A)) \\=P(X\leqslant x_2,Y\leqslant y_2)-P(X\leqslant x_1,Y\leqslant y_2) -P(X\leqslant x_2,Y\leqslant y_1)+P(X\leqslant x_1,Y\leqslant y_1) \\=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1) \\=\sum\limits_{i=1}^{2}F(x_i,y_i)-\sum\limits_{i=1}^{2}F(x_i,y_{3-i}) \\$

边缘分布函数🎈

多维随机变量的每个分量都是一维随机变量
- 它们都有各自的分布函数
  - 一般的(n维),有:
    - $F_{X_i}(x_i)=P(X_i\leqslant x_i)$
  - 对于n=2维
    - $F_X(x)=P(X\leqslant x)$
    - $F_Y(y)=P(Y\leqslant y)$
    - 分别称,这两个分布函数为(X,Y)关于X和Y的边缘分布函数(边缘分布)
对于任意一个随机变量分量 $X_i$
- $\set{X_i<+\infin}是一个必然事件,它和任意事件\varPhi的交集都是\varPhi$
  - 因为,任意一次试验,观察到的结果的分量 $X_i<+\infin$ 总是成立的
- 那么:
  - $\set{X\leqslant x}=\set{X\leqslant x}\cap\set{Y<+\infin}=\set{X\leqslant x,Y\leqslant +\infin}$
  - $F_X(x)= P(X\leqslant x)=P(X\leqslant x,Y<+\infin) =\lim\limits_{y\to+\infin}F(x,y) \\记作F_X(x)=F_X(x,+\infin) \\相应的F_{Y}(y)=F_Y(+\infin,y)$

联合分布和边缘分布的关系

联合分布通过求极限,可以确定唯一的边缘分布
边缘分布却无法反过来确定唯一的联合分布
因此,联合分布汇总不仅仅包含各个分量的信息而且包含了随机变量每个分量之间的关系的信息
- 因此要从整体上研究多维随机变量
- 而不仅仅独立研究各个分量

随机变量独立性

例如,
- 5件产品中有3件正品,2件次品
- 从中抽取量次
- 记
  - $X_i= \begin{cases} 1,第i次取到正品 \\ 0,第i次取到次品 \end{cases} \quad (i=1,2)$
  - 其中, $X_1,X_2$ 分别表示一个随机变量
- 对于有放回抽样 $X_1,X_2$ 之间是相互独立的
- 对于无放回抽样 $X_1,X_2$ 之间是有关联的
  - $X_2将受到X_1的取值影响$

联合分布函数😊

$F(x,y)=P(x\leqslant{X},y\leqslant{Y})$
- 多维(二维)随机变量,无论是离散型还是连续型,都具有相同的基础定义形式
- 不过离散型更多的使用分布律
- 连续型更多的使用分布函数

二维离散型随机变量😊

如果X,Y都是离散型随机变量,那么(X,Y)就是离散型随机变量
- 只要有限或者可列无穷多对 $x_i,y_j)$

联合分布律😊

定义二维随机变量的分布律:
- 研究每一对(X,Y)的取值以及其概率
- $如果二维随机变量(X,Y)的全部可能取值可以被表示成:\set{(x_i,y_j)|i,j=1,2,\cdots}$
- 那么关系式🎈
  - $\alpha:P(X=x_i,Y=y_j)=p_{ij}$
  - $p_{ij}表示事件:X=x_i,Y=y_j发生的概率$
  - $\alpha就是(X,Y)的分布律(联合分布律)$

性质

非负性
- $p_{ij}\geqslant 0$
- $\sum\limits_{i\geqslant1}\sum\limits_{j\geqslant1}^{}p_{ij}=1 \\二重循环$
  - 这一条性质从直观上也容易理解
  - 如果X,Y相互独立
  - $首先,根据一维分布律的性质:\\ \begin{cases} \sum\limits_{i\geqslant 1}p_i=1 \\\\ \sum\limits_{j\geqslant 1}q_j=1 \end{cases}\\ \\ \left(\sum\limits_{i\geqslant 1}p_i\right) \left(\sum\limits_{j\geqslant 1}q_j\right)=1\times 1=1 \\$
  - $\\\sum\limits_{i\geqslant 1}\left(q_i\left(\sum\limits_{j\geqslant 1}q_j\right)\right)=\sum\limits_{i\geqslant 1}(p_i\cdot 1) =\sum\limits_{i\geqslant 1}p_i=1$

边缘分布律🎈

边缘事件
$\{X=x_i\}=\{X=x_i,Y<+\infin\}=\bigcup\limits_{j\geqslant{1}}\{X=x_i,Y=y_j\}$
- 记:
  $P(X=x_i)=p_{i\cdot}(i=1,2,\cdots) \\ P(Y=y_j)=p_{\cdot{j}}(j=1,2,\cdots)$
- $\\随机变量X的分布律: \\ P(X=x_i) =\sum\limits_{j=1}^{+\infin}P(X=x_i,Y=y_j) =\sum\limits_{j=1}^{+\infin}p_{ij} =p_{i\cdot} \quad (i=1,2,\cdots,N_X) \\随机变量Y的分布律: \\ P(Y=y_j) =\sum\limits_{i=1}^{+\infin}P(X=x_i,Y=y_j) =\sum\limits_{i=1}^{+\infin}p_{ij} =p_{\cdot j} \quad (j=1,2,\cdots,N_Y)$
假设X的可能取值个数为 $N_X$
- $那么P(X=x_i),i=1,\cdots,N_X就包含了N_X个概率$
从上述定义可以看出,边缘分布的对象是多维随机变量 $\mathscr{S}=(X_1,X_2,\cdots,X_n)$ 中的某个分量 $X_k$
- $记x_{ki}$ 表示分量 $X_k$ 的某个可能取值
- $\large N_{X_k}$ 表示分量 $X_k$ 的可能取值的个数,同时表征了i的取值范围 $i\in[1,N_{X_k}]$
- $\huge P(X_k=x_{ki})$ 表示将分量 $X_k$ 的取值固定为 $x_{ki}$ 后,其他分量( $X_l,l\neq{k}$ )在事件 $X_k=x_{ki}$ 发生了的前提条件下,还可能取得的所有值对应的概率总和

例

5件产品(3件正品/2件次品)
- 从中抽取两次
  - 每次取一件
  - 记
    $X_i= \begin{cases} 1,&第i次取到正品 \\0,&第i次取到次品 \end{cases} i=1,2 \\$
    
    $从上面的记法描述上看: \\X_1,X_2是两个随机变量, \\(X_1,X_2)是二维随机变量 \\ 两个随机变量具有相同的取值范围(可能):1,2 \\经过排列组合计算,可以确定离散型二维随机变量(X_1,X_2)有4取值可能$
- 假设抽取是有放回的,那么:
  - 两次抽取可以看成是相互独立的
  - $P(X_1=0,X_2=0)=P(X_1=0)P(X_2=0)=\frac{2}{5}\frac{2}{5}=\frac{4}{25} \\P(X_1=0,X_2=1)=P(X_1=0)P(X_2=1)=\frac{2}{5}\frac{3}{5}=\frac{6}{25} \\P(X_1=1,X_2=0)=P(X_1=1)P(X_2=0)=\frac{3}{5}\frac{2}{5}=\frac{6}{25} \\P(X_1=1,X_2=1)=P(X_1=1)P(X_2=1)=\frac{3}{5}\frac{3}{5}=\frac{9}{25}$
    
    $关于X_1的边缘分布律: \\P(X_1=0)=P(X_1=0,X_2=0)+P(X_1=0,X_2=1)=\frac{10}{25}=\frac{2}{5} \\P(X_1=1)=P(X_1=1,X_2=0)+P(X_1=1,X_2=1)=\frac{15}{25}=\frac{3}{5} \\或者P(X_1=1)=1-P(X_0)=\frac{2}{5}$
  - $类似的可以计算X_2的边缘分布律$
    - $P(X_2=0)=\frac{2}{5} \\P(X_2=1)=\frac{3}{5}$
- 假设抽取是不放回的:(利用条件概率来计算)
  $P(X_1=0,X_2=0)=P(X_1=0)P(X_2=0|x_1=0)=\frac{2}{5}\frac{1}{4}=\frac{1}{10} \\P(X_1=0,X_2=1)=P(X_1=0)P(X_2=1|X_1=0)=\frac{2}{5}\frac{3}{4}=\frac{3}{10} \\P(X_1=1,X_2=0)=P(X_1=1)P(X_2=0|X_1=1)=\frac{3}{5}\frac{2}{4}=\frac{3}{10} \\P(X_1=1,X_2=1)=P(X_1=1)P(X_2=1|X_1=1)=\frac{3}{5}\frac{2}{4}=\frac{3}{10}$
- 边缘分布可以类似的求

例

三个球等可能放入编号为1,2,3的三个盒子中
- 记:若干如第1号盒子中的球的个数为X
  - 落入第2号盒子中的球个数为Y
- $\leqslant i+j\leqslant 3$
  - $i, j 单独来看, 取值范围为 0, 1, 2, 3$
  - 但是整体上看,可更加准确的描述:
    - 例如,i=3,j=3不能同时发生
      - 或者说,如果已经知道X或者Y中某一个的取值,另一个分量的取值将会收到进一步的约束
        往往和条件概率相关
    - 因此,再次验证了,多个分量之间要以整体的角度来分析,而不单单是单个分量各自独立研究
- 假设已经知道落入第2号盒子中的球的数量为j
  - $表示为P(Y=j)=\binom{3}{j}(\frac{1}{3})^j(\frac{2}{3})^{3-j}$
  - $那么剩余 3 - j 个球的去处要么是 1 号盒子, 要么是 3 号盒子$
    - $又因为, 我们假设好落入到 1 号盒子中的球的个数为 i$
      - i个球落入第1号盒子中的概率表示为:
        $P(X=i|Y=j)=\binom{3-j}{i}(\frac{1}{2})^{i}(\frac{1}{2})^{3-j-i}$
        $如果记t=3-j,P(X=i|Y=j)=\binom{t}{i}(\frac{1}{2})^{i}(\frac{1}{2})^{t-i}$
    - 可以看出上述两个式子都是二项分布

$p_{ij}=P(X=i\cap Y=j)=P(X=i|Y=j)P(Y=j) \\ =\binom{3-j}{i}(\frac{1}{2})^i(\frac{1}{2})^{3-j-i} \binom{3}{j}(\frac{1}{3})^j(\frac{2}{3})^{3-j} \\=\frac{1}{3^3}\cdot \frac{3!}{i!j!(3-j-i)!},(0\leqslant i+j\leqslant 3)$

多维随机变量分布

多项分布

假设进行n次独立重复试验,每次试验有r个可能的结果:
- $\set{A_1},i=1,2,\cdots,r$
  
  每次试验中, $P(A_i)=p_i$
- $记X_i为n次独立重复试验中A_i发生的次数$
  - $X_i=n_i表示n次独立试验中,事件A_i发生的次数为n_i次$
  - 显然,有 $\sum\limits_{i=1}^{r}n_i=n$
- $r维随机变量(X_i,\cdots,X_r)的分布律:$
  - $\over n_{1}!\cdots n_{r}!}p_{1}^{n_{1}}\times \cdots \times p_{r}^{n_{r}}, {\text{when }}\sum _{i=1}^{r}n_{i}=n$
  - $P(X_1=n_1,X_2=n_2,\cdots,X_r=n_r) \\=P(\bigcap_{i=1}^{r}X_i=n_i) \\=\frac{n!}{\prod\limits_{i=1}^{r}{n_i !}}{\prod_{i=1}^{r}{p_i^{n_i}}} \\=n!\prod_{i=1}^{r}\frac{p_i^{n_i}}{n_i!}$

最大分布&最小分布

$设随机变量序列S=X_1,X_2,\cdots,X_n\underline{相互独立}, \\X_i的分布函数为F_{X_i}(x),i=1,\cdots,n \\令M=max(S) \\N=min(S)$
- $\\ M的分布函数为F_{M}(x)=\prod_{i=1}^{n}F_{X_i}(x) \\ F_{M}(x)=P(M\leqslant{x})=P(Max{(S)}\leqslant{x}) \\=P(\bigcap\limits_{i=1}^{n}(X_i\leqslant{x})) \\根据X_1,\cdots,X_n间的独立性 \\=\prod_{i=1}^{n}P(X_i\leqslant{x}) \\=\prod_{i=1}^{n}F_{X_i}(x) \\$
- $N的分布函数为F_{N}(x)=1-\prod_{i=1}^{n}(1-F_{X_i}(x)) \\ F_{N}(x)=P(N\leqslant{x})=P(Min{(S)}\leqslant{x}) \\=P(\bigcap\limits_{i=1}^{n}(X_i\leqslant{x})) \\但这个式子不容易推出结果 \\尝试从反面来间接计算(利用规范性:F(x)=P(X\leqslant{x})=1-P(X>x)) \\\begin{aligned} \\P(N>x)&=P(Min(S)>S) \\&=P(\bigcap_{i=1}^{n}(X_i\geqslant{x})) \\ &\xlongequal{根据X_1,\cdots,X_n间的独立性} \\&=\prod_{i=1}^{n}P(X_i\geqslant{x}) \\&=\prod_{i=1}^{n}(1-P(X_i\leqslant{x})) \\&=\prod_{i=1}^{n}(1-F_{X_i}(x)) \end{aligned} \\从而: \\F_{N}(x)=P(N\leqslant{x})=1-P(N>x) \\=1-\prod_{i=1}^{n}(1-F_{X_i}(x))$
特别的如果 $X_1,\cdots,X_n$ 独立同分布,那么有:
- $\\F_{M}(x)=F_{Max}(x)=\prod_{i=1}^{n}F_{X_i}(x) \\F_{N}(x)=F_{Min}(x)=1-\prod_{i=1}^{n}(1-F_{X_i}(x)) \\\\得到: F_{M}(x)=F_{Max}(x)= (F_{X_i}(x))^n \\F_{N}(x)=F_{Min}(x)=1- (1-F_{X_i}(x))^n$
- $基于独立同分布,如果X_i,i=1,2,\cdots,n还都是连续型的:$
  - $设X_i的概率密度为f(x)$
  - 由符合函数求导法:
  - $F_{M}(x)=n(F^{n-1}(x))f(x) \\F_{N}(x)=n(1-F(x))^{n-1}f(x)$

posted @ 2022-10-24 10:25 xuchaoxin1375 阅读(11) 评论(0) 编辑收藏举报来源

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· PT@多维随机变量独立性@条件分布

· PT_数字特征_矩协方差相关系数

· 第四章随机向量

· 数学mathematical formula

· 第四章随机向量精简版

阅读排行：
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码，我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了，比商业数据库还牛
· 记一次.NET内存居高不下排查解决与启示
· 白话解读 Dapr 1.15：你的「微服务管家」又秀新绝活了

历史上的今天：
2021-10-24 powershell@Get-ChildItem美化@ls文件列表文件图标样式和配色@Terminal-icons@lsd

公告

昵称： xuchaoxin1375
园龄： 4年10个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

xuchaoxin1375

PT@多维随机变量@联合分布函数@联合分布律@边缘分布律@二维离散型随机变量和分布律

文章目录

PT@多维随机变量@联合分布函数@联合分布律@边缘分布律@二维离散型随机变量和分布律

多维随机变量😊

联合分布函数😊

性质

边缘分布函数🎈

分类

联合分布和边缘分布的关系

随机变量独立性

联合分布函数😊

二维离散型随机变量😊

联合分布律😊

性质

边缘分布律🎈

例

例

多维随机变量分布

多项分布

最大分布&最小分布

公告

搜索

常用链接

随笔档案

阅读排行榜

推荐排行榜