数字特征:方差

【引入】

有一批灯泡,知其平均寿命是 $E(X)=1000$ (小时)。仅由这一指标我们还不能判定这批灯泡的质量好坏。

事实上,有可能其中绝大部分灯泡的寿命都在950~1050小时;

也有可能其中约有一半是高质量的,它们的寿命大约有1300小时,另一半却是质量很差的,其寿命大约只有700小时,

为要评定这批灯泡质量的好坏,还需进一步考察灯泡的寿命 $X$ 与其平均值 $E(X)=1000$ 的偏离程度。

若偏离程度较小,表示质量比较稳定。从这个意义上来说,我们认为质量较好。  

前面也曾提到在检验棉花的质量时,既要注意纤维的平均长度,还要注意纤维长度与平均长度的偏离程度。

由此可见,研究随机变量与其构成的偏离程度是必要的。

那么,用怎样的量去度量这个偏离程度呢?

容易看到 $E\{ |X-E(X)|\}$ 能度量随机变量与其均值 $E(X)$ 的偏离程度,

但由于上式带有绝对值,运算不方便,为运算方便起见,通常用量 $E\{ [X-E(X)]^2\}$ 来度量随机变量X与其均值 $E(X)$ 的偏离程度。

 

【定义】

设 $X$ 是一个随机变量,若 $E\{ [X-E(X)]^2\}$ 存在,则称 $E\{ [X-E(X)]^2\}$ 为 $X$ 的方差,记为 $D(X)$ 或 $Var(X)$,

$$D(X)=Var(X)=E\{ [X-E(X)]^2\}\tag{2.1}$$

在应用上还引入量 $\sqrt{D(X)}$ ,记为 $\sigma (X)$ ,称为标准差或均方差。

 

【含义】

按定义,随机变量 $X$ 的方差表达了 $X$ 的取值与其数学期望的偏离程度。

若 $D(X)$ 较小意味着 $X$ 的取值比较集中在 $E(X)$ 的附近,反之,若 $D(X)$ 较大则表示 $X$ 的取值较分散。

因此, $D(X)$ 是刻画 $X$  取值分散程度的一个量,它是衡量 $X$ 取值分散程度的一个尺度。

 

【定义】

由定义知,方差实际上就是随机变量 $X$ 的函数 $g(X)=(X-E(X))^2$ 的数学期望。

于是对于离散型随机变量,按(1.3)式有

$$D(X)=\sum_{k=1}^{\infty}[x_k-E(X)]^2p_k\tag{2.2}$$

其中,$P\{ X=x_k\}=p_k,k=1,2,…$ 是 $X$ 的分布律

对于连续型随机变量,按(1.4)式有

$$D(X)=\int_{-\infty}^{\infty}[x-E(X)]^2f(x)dx\tag{2.3}$$

其中 $f(x)$ 是 $X$ 的概率密度

 

【计算】

随机变量 $X$ 的方差可按下列公式计算

$$D(X)=E(X^2)-[E(X)]^2\tag{2.4}$$

证:(省略,日后再补)

 

【例1】标准化变量

 设随机变量 $X$ 具有数学期望 $E(X)=\mu$ ,方差 $D(X)=\sigma ^2\neq 0$ 。

$$X^*=\frac{X-\mu}{\sigma}$$

$$E(X^*)=\frac{1}{\sigma}E(X-\mu)=\frac{1}{\sigma}[E(X)-\mu ]=0;$$

$$D(X^*)=E(X^*)-[E(X^*)]^2=E[(\frac{X-\mu}{\sigma})^2]$$

$$=\frac{1}{\sigma ^2}E[(X-\mu )^2]=\frac{\sigma ^2}{\sigma ^2}=1$$

即 $X^*=\frac{X-\mu}{\sigma}$ 的数学期望为0,方差为1. $X^*$ 称为 $X$ 的标准化变量。

【例2】(离散)(0-1)分布

设随机变量 $X$ 具有(0-1)分布,其分布律为 $P\{ X=0\} =1-p,\quad P\{ X=1\}=p$ ,求 $D(X)$ 。

解:

$$E(X)=0·(1-p)+1·p=p$$

$$E(X^2)=o^2·(1-p)+1^2·p=p$$

由(2.4)式,

$$D(X)=E(X^2)-[E(x)]^2=p-p^2=p(1-p)$$

【例3】(离散)泊松分布

设随机变量 $X\sim \pi (\lambda)$,求 $D(X)$

解:随机变量 $X$ 的分布律为

$$P \{ X=k\} =\frac{\lambda ^ke^{-\lambda}}{k!},k=0,1,2,…,\lambda >0$$

上节【例6】已算得 $E(X)=\lambda$ ,而

$$E(X^2)=E[X(X-1)+X]=E[X(X-1)]+E(X)\qquad \qquad \qquad \quad \ $$

$$=\sum\limits_{k=0}^{\infty}k(k-1)\frac{\lambda ^ke^{}-\lambda}{k!}+\lambda=\lambda^2e^{-\lambda}\sum\limits_{k=2}^{\infty}\frac{\lambda^{k-2}}{(k-2)!}+\lambda$$

$$=\lambda^2e^{-\lambda}e^{\lambda}+\lambda=\lambda^2+\lambda\qquad \qquad \qquad \qquad \qquad \qquad \$$

所以方差

$$D(X)=E(X^2)-[E(X)]^2=\lambda^2+\lambda-\lambda^2=\lambda$$

由此可知,泊松分布的数学期望与方差相等,都等于参数 $\lambda$

因为泊松分布只包含一个参数 $\lambda$ 只要知道它的数学期望和方差就能完全确定它的分布了。

【例4】(连续)均匀分布

设随机变量 $X\sim U(a,b)$,求 $D(X)$

解:$X$ 的概率密度为

$$f(x)=\begin{cases}\frac{1}{b-a},& \textrm{a<x<b}\\ 0,& \textrm{其他}\end{cases}$$

上节【例7】已算得 $E(X)=\frac{a+b}{2}$,方差为

$$D(X)=E(X^2)-[E(X)]^2$$

$$=\int_{a}^{b}x^2\frac{1}{b-a}dx-(\frac{a+b}{2})^2=\frac{(b-a)^2}{12}$$

【例5】(连续)指数分布

设随机变量 $X$ 服从指数分布,其概率密度为

$$f(x)=\begin{cases}\frac{1}{\theta}e^{1\frac{-x}{\theta}},& \textrm{x>0}\\ 0,& textrm{x\leq 0}\end{cases}$$

其中 $\theta >0$,求 $E(X),D(X)$ 。

解:

$$E(X)=\int_{-\infty}^{\infty}xf(x)dx=\int_{0}^{\infty}e^{\frac{-x}{\theta}}dx$$

$$=\left .-xe^{\frac{-x}{\theta}}\right |_{0}^{\infty}+\int_{0}^{\infty}e^{\frac{-x}{\theta}}dx=\theta$$

$$$$

 


 

方差的性质

1.设 $C$ 是常数,则 $D(C)=0$ 

证:

2.设 $X$ 是随机变量,$C$ 是常数,则有 $D(CX)=C^2D(X),\qquad D(X+C)=D(X)$

证:

3.设 $X,Y$ 是两个随机变量,则有 $D(X+Y)=D(X)+D(Y)+2E\{ (X-E(X)(Y-E(Y)))\}\tag{2.5}$

特别,若 $X,Y$ 相互独立,则有 $D(X+Y)=D(X)+D(Y)\tag{2.6}$

这一性质可以推广到任意有限多个相互独立的随机变量之和的情况。

证:

4. $D(X)=0$ 的充要条件是 $X$ 以概率1取常数 $E(X)$ ,即 $P\{ X=E(X)\} =1$

证:

【例6】(离散)二项分布

【例7】(连续)正态分布

【例8】

【定理】切比雪夫不等式

证:(省略,日后再补)

 

posted @ 2018-03-19 21:57  ForTech  阅读(934)  评论(0编辑  收藏  举报