《概率入门》 4.3 条件分布(Conditional Distribution)
假设 X 和 Y 都是离散的或都是连续的,具有联合 pmf/pdf \(f_{X,Y}\),并且假设 \(f_X(x)>0\)。既定 X = x 时对于所有y, Y 的条件 pdf/pmf 定义为
$f_{Y|X}(y|x)=\frac{f_{X,Y}(x,y)}{f_X(x)}$ (4.7)
X 取值 x 既定,我们可以将 $f_{Y|X}( .|x)$ 解释为 Y 的 pmf/pdf。对于离散随机变量,定义只是 1.6 小节中公式 (1.4) 的结果改写。即, $$ f_{Y|X}(y|x)=\mathbb{P}(Y=y|X=x)=\frac{\mathbb{P}(X=x,Y=y)}{\mathbb{P}(X=x)}=\frac{f_{X,Y}(x,y)}{f_X(x)} $$示例 4.11 我们从下面三角形 D 上的 10 个点中“均匀地”画出一个点 (X, Y )。因此,每个点被绘制的可能性相同。也就是说,联合 pmf 和边际 pmf 很容易确定:
当X连续时,我们不能再直接应用(1.4)来定义条件密度。相反,既定 X = x 为极限时,我们首先定义 Y 的条件 cdf
现在,(1.4)可以被应用到 \(F_Y(y|x<X\leq x+h)\) 并得到
现在,对于小 h,积分 \(\int_x^{x+h}~f_{X,Y}(u,v)~du\) 大约等于 \(h~f_{X,Y}(x,v)\) 加上比 h 更趋近于零的小项。类似地,\(\int_x^{x+h}~f_X(u)~du \approx h~f_X(x)\) (加上更小的项)。因此,对于 h → 0,\(F_Y(y|x<X\leq {x+h})\) 极限为
请注意,\(F_Y(y|x)\) 作为 y 的函数具有 cdf 的所有属性。通过对 y 的 cdf 的微分,我们可以得到既定X = x 时连续情况下 Y 的条件 pdf,这给出了与离散情况的公式相同(4.7)。
由于条件 pmf (pdf) 具有概率质量(密度)函数的所有属性,因此将相应的条件期望定义(在连续情况下)是有意义的:
两个以上随机变量的条件 pmf 和 pdf 的定义类似。例如,既定 \(X_1,\cdots,X_{n-1}\) 情况下,\(X_n\) 的条件 pmf 如下
浙公网安备 33010602011771号