1 定义

依分布收敛的定义是这样的:随机变量序列\(\{X_n\}_{n=1}^{\infty}\),若它们的累积分布函数cdf序列\(\{F_1\}_{n=1}^{\infty}\),与某个随机变量\(X\)的cdf \(F\),满足

\[\lim_{n\to\infty} F_n(x)=F(x) \]

在任意\(F(x)\)的连续点\(x\)处都成立。则称它们依分布收敛到随机变量\(X\),记为\(X_n\stackrel{D}\longrightarrow X\)

在这个定义中,有两个极易忽视但又重要的点,一是必须要对应到某个随机变量的cdf,而不是任意一个函数,二是只要求在\(F(x)\)的连续点处条件成立即可。

接下来,我们分析为何要如此定义。

2 极限函数必须是cdf

考虑\(X_n\sim N(0,\sigma_n^2)\)\(\sigma_n\to +\infty\),我们有

\[F_n(x)=P(\dfrac{x_n}{\sigma_n}\leq \dfrac{x}{\sigma_n})=\Phi(\dfrac{x}{\sigma_n}) \]

在任一点\(x\)处,都有\(\Phi(\dfrac{x}{\sigma_n})\to\Phi(0)=\dfrac{1}{2}\),因此,可设\(F(x)=\dfrac{1}{2}\),就满足定义中的极限条件。但此时,\(F(x)\)不是任何随机变量的cdf,因为随机变量的cdf需要满足\(\lim\limits_{x\to -\infty}F(x)=0\)以及\(\lim\limits_{x\to \infty}F(x)=1\)

这一点如何修正?我们只需让序列\(\{X_n\}_{n=1}^{\infty}\)是依概率有界即可。而在定义中,就要求cdf函数列的极限形式,一定要对应到某个随机变量的cdf。

3 只考虑连续点

回忆cdf的另一个性质:右连续,即\(F(x)=F(x+)\)。但在依分布收敛的情形中,很可能会出现不满足的情况,如\(X_n=X+\dfrac1 n\),易知

\[F_n(x)=P(X_n\leq x)=P(X\leq x-\dfrac 1 n)=F(x-\dfrac{1}{n}) \]

\(n\to\infty\),则\(F_n(x)\to F(x-)\)。若\(F\)\(x\)处不满足左连续,那么不能满足\(F_n(x)\to F(x)\),因此在定义中,需将\(F\)的不连续点排除。

举个具体的例子,如\(X_n\sim U_{(0,1/n)}\),则\(X_n\)在极限时的分布会退化为\(X=1\),而\(F_n(0)=0\)恒成立,但\(F(0)=1\),因此对于\(x=0\)无法满足\(F_n(x)\to F(x)\),但\(x=0\)\(F(x)\)的不连续点,因此可以剔除。所以还是认为\(X_n\stackrel{D}\longrightarrow X\)