第四章 随机变量的数字特征

第一节 随机变量的数学期望

反映了一组分布的平均情况。

1.离散型:

如果级数
∑ i = 1 ∞ x i p i \sum_{i=1}^{\infty}x_ip_i i=1xipi
绝对收敛,则该级数为X的数学期望E(X)。

2.连续型:

如果广义积分
∫ − ∞ + ∞ x f ( x ) d x \int_{-\infty}^{+\infty}xf(x)dx +xf(x)dx
绝对收敛,则该积分为X的数学期望E(X)。

3.一些分布的数学期望:

离散型:

  • 二项分布:
    E ( X ) = n p E(X)=np E(X)=np

  • 泊松分布:
    E ( X ) = λ E(X)=\lambda E(X)=λ

  • 几何分布:
    E ( X ) = 1 p E(X)=\frac{1}{p} E(X)=p1

连续型:

  • 均匀分布:
    E ( X ) = ∫ a b x b − a d x = a + b 2 E(X)=\int_{a}^{b}\frac{x}{b-a}dx=\frac{a+b}{2} E(X)=abbaxdx=2a+b

  • 指数分布:
    E ( X ) = ∫ 0 + ∞ x λ e − λ x = 1 λ E(X)=\int_{0}^{+\infty}x\lambda e^{-\lambda x}=\frac{1}{\lambda} E(X)=0+xλeλx=λ1

  • 正态分布:
    E ( X ) = μ E(X)=\mu E(X)=μ

4.随机变量函数的数学期望
离 散 型 : E ( X ) = ∑ i = 1 ∞ g ( x i ) p i 连 续 型 : E ( X ) = ∫ − ∞ + ∞ g ( x ) f ( x ) d x 假 设 Z = g ( X , Y ) 是 随 机 变 量 ( X , Y ) 的 函 数 , 且 g ( x , y ) 为 连 续 函 数 , 则 : E ( Z ) = E ( g ( X , Y ) ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ g ( x , y ) f ( x , y ) d x d y 离散型:E(X)=\sum_{i=1}^{\infty}g(x_i)p_i\\ 连续型:E(X)=\int_{-\infty}^{+\infty}g(x)f(x)dx\\ 假设Z=g(X,Y)是随机变量(X,Y)的函数,且g(x,y)为连续函数,则:E(Z)=E(g(X,Y))=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy E(X)=i=1g(xi)piE(X)=+g(x)f(x)dxZ=g(X,Y)(X,Y)g(x,y):E(Z)=E(g(X,Y))=++g(x,y)f(x,y)dxdy
5.数学期望的一些性质:

  • 常数分布的数学期望是常数本身:
    E ( c ) = c E(c)=c E(c)=c

  • E ( a X + b ) = a E ( X ) + b E(aX+b)=aE(X)+b E(aX+b)=aE(X)+b

  • E ( ∑ i = 1 n X i ) = ∑ i = 1 n E ( X i ) ( 这 个 好 理 解 : 在 每 一 个 X 基 础 上 再 加 上 个 X , 平 均 值 增 加 个 E ( X ) ) E(\sum_{i=1}^nX_i)=\sum_{i=1}^{n}E(X_i)(这个好理解:在每一个X基础上再加上个X,平均值增加个E(X)) E(i=1nXi)=i=1nE(Xi)(XXE(X))

  • 如果X与Y相互独立,那么:
    E ( X ⋅ Y ) = E ( X ) E ( Y ) E(X·Y)=E(X)E(Y) E(XY)=E(X)E(Y)
    反之不一定成立。

6.二维随机变量的数学期望
E ( X ) = ∫ − ∞ + ∞ x f X ( x ) d x = ∫ − ∞ + ∞ ∫ − ∞ + ∞ x f ( x , y ) d x d y E ( Y ) = ∫ − ∞ + ∞ y f Y ( y ) d y = ∫ − ∞ + ∞ ∫ − ∞ + ∞ y f ( x , y ) d x d y E(X)=\int_{-\infty}^{+\infty}xf_X(x)dx=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}xf(x,y)dxdy\\ E(Y)=\int_{-\infty}^{+\infty}yf_Y(y)dy=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}yf(x,y)dxdy E(X)=+xfX(x)dx=++xf(x,y)dxdyE(Y)=+yfY(y)dy=++yf(x,y)dxdy

第二节 方差

反映了分布的数据离散程度。

1.方差基本定义式
D ( X ) = E [ X − E ( X ) ] 2 ( X − E ( X ) 平 方 的 期 望 ) = E ( X 2 − 2 X E ( X ) + E ( X ) 2 ) = E ( X 2 ) − 2 E ( X ) 2 + E ( X ) 2 = E ( X 2 ) − [ E ( X ) ] 2 D(X)=E[X-E(X)]^2(X-E(X)平方的期望)=\\ E(X^2-2XE(X)+E(X)^2)=E(X^2)-2E(X)^2+E(X)^2=\\E(X^2)-[E(X)]^2 D(X)=E[XE(X)]2(XE(X))=E(X22XE(X)+E(X)2)=E(X2)2E(X)2+E(X)2=E(X2)[E(X)]2
2.离散型和连续型:

  • 离散型:
    ∑ i = 1 n [ x i − E ( X ) ] 2 p k \sum_{i=1}^{n}[x_i-E(X)]^2p_k i=1n[xiE(X)]2pk

  • 连续型:
    ∫ − ∞ + ∞ [ x − E ( X ) ] 2 f ( x ) d x \int_{-\infty}^{+\infty}[x-E(X)]^2f(x)dx +[xE(X)]2f(x)dx

3.常见的分布方差:

  • 二项分布:
    D ( X ) = p ( 1 − p ) D(X)=p(1-p) D(X)=p(1p)

  • n重伯努利实验:
    D ( X ) = n p ( 1 − p ) D(X)=np(1-p) D(X)=np(1p)

  • 泊松分布:
    D ( X ) = λ D(X)=\lambda D(X)=λ

  • 均匀分布:
    D ( X ) = 1 12 ( b − a ) 2 D(X)=\frac{1}{12}(b-a)^2 D(X)=121(ba)2

  • 指数分布:
    D ( X ) = 1 λ 2 D(X)=\frac{1}{\lambda^2} D(X)=λ21

  • 正态分布:
    D ( X ) = σ 2 D(X)=\sigma^2 D(X)=σ2

4.方差性质:

  • D©=0;

  • $$
    D(aX+b)=a^2D(X)

    $$

  • D ( X + Y ) = D ( X ) + D ( Y ) = 2 E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = D ( X ) + D ( Y ) ( 如 果 X 与 Y 独 立 ) D(X+Y)=D(X)+D(Y)=2E[(X-E(X))(Y-E(Y))]\\ =D(X)+D(Y)(如果X与Y独立) D(X+Y)=D(X)+D(Y)=2E[(XE(X))(YE(Y))]=D(X)+D(Y)(XY)

5.二维随机变量方差

  • 离散型:先化为边缘分布,然后使用一维离散型方差公式即可。

  • 连续型:与连续型数据期望的求法一样
    D ( X ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x , y ) d x d y D ( Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( y − E ( Y ) ) 2 f ( x , y ) d x d y D(X)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}(x-E(X))^2f(x,y)dxdy\\ D(Y)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}(y-E(Y))^2f(x,y)dxdy D(X)=++(xE(X))2f(x,y)dxdyD(Y)=++(yE(Y))2f(x,y)dxdy

第三节 协方差

协方差代表了一组分布两种变量之间的一种相关性。

1.基本定义式:
c o v ( X , Y ) = E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] cov(X,Y)=E[(X-E(X))(Y-E(Y))] cov(X,Y)=E[(XE(X))(YE(Y))]
那么我们不难发现,当Y=X时,cov(X,X)=D(X),cov(Y,Y)=D(Y)

2.相关性质

  • c o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) 证 明 : c o v ( X , Y ) = E [ X Y − Y E ( X ) − X E ( Y ) + E ( X ) E ( Y ) ] = E ( X Y ) − E ( X ) E ( Y ) cov(X,Y)=E(XY)-E(X)E(Y)\\ 证明:cov(X,Y)=E[XY-YE(X)-XE(Y)+E(X)E(Y)]=E(XY)-E(X)E(Y) cov(X,Y)=E(XY)E(X)E(Y):cov(X,Y)=E[XYYE(X)XE(Y)+E(X)E(Y)]=E(XY)E(X)E(Y)

  • 交换律:X、Y交换一下位置,协方差依然代表两个随机变量的之间的相关性,这相关性没有发生变化。

  • 相加性:
    c o v ( X 1 + X 2 , Y ) = c o v ( X 1 , Y ) + c o v ( X 2 , Y ) cov(X_1+X_2,Y)=cov(X_1,Y)+cov(X_2,Y) cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y)

  • 乘法脱项:
    c o v ( a X 1 , b X 2 ) = a b c o v ( X 1 , X 2 ) cov(aX_1,bX_2)=abcov(X_1,X_2) cov(aX1,bX2)=abcov(X1,X2)

  • 一个随机变量与任何常熟协方差为0:
    c o v ( X , a ) = c o v ( Y , b ) = 0 cov(X,a)=cov(Y,b)=0 cov(X,a)=cov(Y,b)=0

  • 求方差的新解法:
    D ( X + Y ) = D ( X ) + D ( Y ) + 2 c o v ( X , Y ) D(X+Y)=D(X)+D(Y)+2cov(X,Y) D(X+Y)=D(X)+D(Y)+2cov(X,Y)

3.相关系数
ρ X Y = ρ = c o v ( X , Y ) D ( X ) D ( Y ) \rho_{XY}=\rho=\frac{cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} ρXY=ρ=D(X) D(Y) cov(X,Y)
tips:

  • 如果相关系数为0,说明X与Y没有关系。

  • 相关系数的取值范围:
    ∣ ρ ∣ ≤ 1 |\rho|\le 1 ρ1

  • ∣ ρ ∣ = 1 ↔ P ( Y = a X + b ) = 1 , 其 中 a 、 b 为 常 数 |\rho|=1 \leftrightarrow P(Y=aX+b)=1,其中a、b为常数 ρ=1P(Y=aX+b)=1,ab

  • 对于二维正态分布,其独立性不相关性是等价性。

4.矩与协方差矩阵

如果X是随机变量,如果说:
E ( ∣ X ∣ k ) < + ∞ E(|X|^k)<+\infty E(Xk)<+
记:
v k = E ( X k ) , a k = E ( ∣ X ∣ k ) v_k=E(X^k),a_k=E(|X|^k) vk=E(Xk),ak=E(Xk)
那么vk为X的k阶原点矩,ak为X的k阶原点绝对矩。比如说数学期望就是一阶原点矩


如果E(X)存在,且:
E ( ∣ X − E ( X ) ∣ k ) < + ∞ E(|X-E(X)|^k)<+\infty E(XE(X)k)<+
记:
μ k = E ( X − E ( X ) ) k \mu_k=E(X-E(X))^k μk=E(XE(X))k
则我们称uk为X的k阶中心矩,同样的如果是绝对值的k次方就是X的k阶中心绝对矩。


假设有n维随机变量:
( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn)
记忆:
σ i j = c o v ( X i , X j ) ( i , j = 1 , 2 , . . . , n ) \sigma_{ij}=cov(X_i,X_j)(i,j=1,2,...,n) σij=cov(Xi,Xj)(i,j=1,2,...,n)
则称呼:
∑ = [ σ 11 σ 12 . . . σ 1 n σ 21 σ 22 . . . σ 2 n . . . . . . σ n 1 σ n 2 . . . σ n n ] \sum= \begin{bmatrix} \sigma_{11} & \sigma_{12} ... \sigma_{1n}\\ \sigma_{21} & \sigma_{22} ... \sigma_{2n}\\ &......\\ \sigma_{n1} & \sigma_{n2} ... \sigma_{nn}\\ \end{bmatrix} =σ11σ21σn1σ12...σ1nσ22...σ2n......σn2...σnn
协方差矩阵,很明显根据协方差的对称性,我们可以知道协方差矩阵为一个对称矩阵。

=cov(X_i,X_j)(i,j=1,2,…,n)
则 称 呼 : 则称呼:
\sum=
\begin{bmatrix}
\sigma_{11} & \sigma_{12} … \sigma_{1n}\
\sigma_{21} & \sigma_{22} … \sigma_{2n}\
&…\
\sigma_{n1} & \sigma_{n2} … \sigma_{nn}\
\end{bmatrix}
$$
协方差矩阵,很明显根据协方差的对称性,我们可以知道协方差矩阵为一个对称矩阵。