《概率入门》 4.3 条件分布(Conditional Distribution)

假设 X 和 Y 都是离散的或都是连续的,具有联合 pmf/pdf \(f_{X,Y}\),并且假设 \(f_X(x)>0\)。既定 X = x 时对于所有y, Y 的条件 pdf/pmf 定义为

$f_{Y|X}(y|x)=\frac{f_{X,Y}(x,y)}{f_X(x)}$   (4.7)

X 取值 x 既定,我们可以将 $f_{Y|X}( .|x)$ 解释为 Y 的 pmf/pdf。对于离散随机变量,定义只是 1.6 小节中公式 (1.4) 的结果改写。即, $$ f_{Y|X}(y|x)=\mathbb{P}(Y=y|X=x)=\frac{\mathbb{P}(X=x,Y=y)}{\mathbb{P}(X=x)}=\frac{f_{X,Y}(x,y)}{f_X(x)} $$

示例 4.11 我们从下面三角形 D 上的 10 个点中“均匀地”画出一个点 (X, Y )。因此,每个点被绘制的可能性相同。也就是说,联合 pmf 和边际 pmf 很容易确定:

\[f_{X,Y}(x,y)=\mathbb{P}(X=x,Y=y)=\frac{1}{10},~(x,y)\in D \]

X 和 Y 的边缘 pmf 为 $$ f_X(x)=\mathbb{P}(X=x)=\frac{5-x}{10}, ~x \in\{1,2,3,4\} $$ 和 $$ f_Y(y)=\mathbb{P}(Y=y)=\frac{y}{10},~y\in\{1,2,3,4\} $$ 显然 X 和 Y 不是独立的。事实上,如果我们知道 X = 2,那么Y只能取值j = 2、3或4。相应的概率是 $$ \mathbb{P}(Y=y|x=2)=\frac{\mathbb{P}(Y=y,X=2)}{\mathbb{P}(X=2)}=\frac{1/10}{3/10}=\frac{1}{3} $$ 换句话说,既定 X=2 时 Y 得条件 pmf 为 $$ f_{Y|X}(y|2)=\frac{f_{X,Y}(2,y)}{f_X(2)}=\frac{1}{3},~y=2,3,4 $$ 因此,既定 X=2 时,Y取值 2,3 和 4 的概率相等。

当X连续时,我们不能再直接应用(1.4)来定义条​​件密度。相反,既定 X = x 为极限时,我们首先定义 Y 的条件 cdf

\[F_Y(y|x):=lim_{h \to 0}F_Y(y|x<X\leq x+h) \]

现在,(1.4)可以被应用到 \(F_Y(y|x<X\leq x+h)\) 并得到

\[F_Y(y|x<X\leq x+h)=\frac{\int_{-\infty}^y~\int_x^{x+h}~f_{X,Y}(u,v)~du~dv}{\int_x^{x+h}~f_X(u)~du} \]

现在,对于小 h,积分 \(\int_x^{x+h}~f_{X,Y}(u,v)~du\) 大约等于 \(h~f_{X,Y}(x,v)\) 加上比 h 更趋近于零的小项。类似地,\(\int_x^{x+h}~f_X(u)~du \approx h~f_X(x)\) (加上更小的项)。因此,对于 h → 0,\(F_Y(y|x<X\leq {x+h})\) 极限为

\[F_Y(y|x)=\frac{\int_{-\infty}^yf_{X,Y}(x,v)~dv}{f_X(x)} \]

请注意,\(F_Y(y|x)\) 作为 y 的函数具有 cdf 的所有属性。通过对 y 的 cdf 的微分,我们可以得到既定X = x 时连续情况下 Y 的条件 pdf,这给出了与离散情况的公式相同(4.7)。

由于条件 pmf (pdf) 具有概率质量(密度)函数的所有属性,因此将相应的条件期望定义(在连续情况下)是有意义的:

\[\mathbb{E}[Y|X=x]=\int~y~f_{Y|X}(y|x)~dy \]

两个以上随机变量的条件 pmf 和 pdf 的定义类似。例如,既定 \(X_1,\cdots,X_{n-1}\) 情况下,\(X_n\) 的条件 pmf 如下

\[f_{X_n|X_1,\cdots,X_{x_{n-1}}}(x_n|x_1,\cdots,x_{n-1})=\frac{\mathbb{P}(X_1=x_1,\cdots,X_n=x_n)}{\mathbb{P}(X_1=x_1,\cdots,X_{n-1}=x_{n-1})} \]

posted @ 2025-01-14 16:50  李思默  阅读(282)  评论(0)    收藏  举报