第四章 随机变量的数字特征
第一节 随机变量的数学期望
反映了一组分布的平均情况。
1.离散型:
如果级数
∑
i
=
1
∞
x
i
p
i
\sum_{i=1}^{\infty}x_ip_i
i=1∑∞xipi
绝对收敛,则该级数为X的数学期望E(X)。
2.连续型:
如果广义积分
∫
−
∞
+
∞
x
f
(
x
)
d
x
\int_{-\infty}^{+\infty}xf(x)dx
∫−∞+∞xf(x)dx
绝对收敛,则该积分为X的数学期望E(X)。
3.一些分布的数学期望:
离散型:
-
二项分布:
E ( X ) = n p E(X)=np E(X)=np -
泊松分布:
E ( X ) = λ E(X)=\lambda E(X)=λ -
几何分布:
E ( X ) = 1 p E(X)=\frac{1}{p} E(X)=p1
连续型:
-
均匀分布:
E ( X ) = ∫ a b x b − a d x = a + b 2 E(X)=\int_{a}^{b}\frac{x}{b-a}dx=\frac{a+b}{2} E(X)=∫abb−axdx=2a+b -
指数分布:
E ( X ) = ∫ 0 + ∞ x λ e − λ x = 1 λ E(X)=\int_{0}^{+\infty}x\lambda e^{-\lambda x}=\frac{1}{\lambda} E(X)=∫0+∞xλe−λx=λ1 -
正态分布:
E ( X ) = μ E(X)=\mu E(X)=μ
4.随机变量函数的数学期望
离
散
型
:
E
(
X
)
=
∑
i
=
1
∞
g
(
x
i
)
p
i
连
续
型
:
E
(
X
)
=
∫
−
∞
+
∞
g
(
x
)
f
(
x
)
d
x
假
设
Z
=
g
(
X
,
Y
)
是
随
机
变
量
(
X
,
Y
)
的
函
数
,
且
g
(
x
,
y
)
为
连
续
函
数
,
则
:
E
(
Z
)
=
E
(
g
(
X
,
Y
)
)
=
∫
−
∞
+
∞
∫
−
∞
+
∞
g
(
x
,
y
)
f
(
x
,
y
)
d
x
d
y
离散型:E(X)=\sum_{i=1}^{\infty}g(x_i)p_i\\ 连续型:E(X)=\int_{-\infty}^{+\infty}g(x)f(x)dx\\ 假设Z=g(X,Y)是随机变量(X,Y)的函数,且g(x,y)为连续函数,则:E(Z)=E(g(X,Y))=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}g(x,y)f(x,y)dxdy
离散型:E(X)=i=1∑∞g(xi)pi连续型:E(X)=∫−∞+∞g(x)f(x)dx假设Z=g(X,Y)是随机变量(X,Y)的函数,且g(x,y)为连续函数,则:E(Z)=E(g(X,Y))=∫−∞+∞∫−∞+∞g(x,y)f(x,y)dxdy
5.数学期望的一些性质:
-
常数分布的数学期望是常数本身:
E ( c ) = c E(c)=c E(c)=c -
E ( a X + b ) = a E ( X ) + b E(aX+b)=aE(X)+b E(aX+b)=aE(X)+b
-
E ( ∑ i = 1 n X i ) = ∑ i = 1 n E ( X i ) ( 这 个 好 理 解 : 在 每 一 个 X 基 础 上 再 加 上 个 X , 平 均 值 增 加 个 E ( X ) ) E(\sum_{i=1}^nX_i)=\sum_{i=1}^{n}E(X_i)(这个好理解:在每一个X基础上再加上个X,平均值增加个E(X)) E(i=1∑nXi)=i=1∑nE(Xi)(这个好理解:在每一个X基础上再加上个X,平均值增加个E(X))
-
如果X与Y相互独立,那么:
E ( X ⋅ Y ) = E ( X ) E ( Y ) E(X·Y)=E(X)E(Y) E(X⋅Y)=E(X)E(Y)
反之不一定成立。
6.二维随机变量的数学期望
E
(
X
)
=
∫
−
∞
+
∞
x
f
X
(
x
)
d
x
=
∫
−
∞
+
∞
∫
−
∞
+
∞
x
f
(
x
,
y
)
d
x
d
y
E
(
Y
)
=
∫
−
∞
+
∞
y
f
Y
(
y
)
d
y
=
∫
−
∞
+
∞
∫
−
∞
+
∞
y
f
(
x
,
y
)
d
x
d
y
E(X)=\int_{-\infty}^{+\infty}xf_X(x)dx=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}xf(x,y)dxdy\\ E(Y)=\int_{-\infty}^{+\infty}yf_Y(y)dy=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}yf(x,y)dxdy
E(X)=∫−∞+∞xfX(x)dx=∫−∞+∞∫−∞+∞xf(x,y)dxdyE(Y)=∫−∞+∞yfY(y)dy=∫−∞+∞∫−∞+∞yf(x,y)dxdy
第二节 方差
反映了分布的数据离散程度。
1.方差基本定义式
D
(
X
)
=
E
[
X
−
E
(
X
)
]
2
(
X
−
E
(
X
)
平
方
的
期
望
)
=
E
(
X
2
−
2
X
E
(
X
)
+
E
(
X
)
2
)
=
E
(
X
2
)
−
2
E
(
X
)
2
+
E
(
X
)
2
=
E
(
X
2
)
−
[
E
(
X
)
]
2
D(X)=E[X-E(X)]^2(X-E(X)平方的期望)=\\ E(X^2-2XE(X)+E(X)^2)=E(X^2)-2E(X)^2+E(X)^2=\\E(X^2)-[E(X)]^2
D(X)=E[X−E(X)]2(X−E(X)平方的期望)=E(X2−2XE(X)+E(X)2)=E(X2)−2E(X)2+E(X)2=E(X2)−[E(X)]2
2.离散型和连续型:
-
离散型:
∑ i = 1 n [ x i − E ( X ) ] 2 p k \sum_{i=1}^{n}[x_i-E(X)]^2p_k i=1∑n[xi−E(X)]2pk -
连续型:
∫ − ∞ + ∞ [ x − E ( X ) ] 2 f ( x ) d x \int_{-\infty}^{+\infty}[x-E(X)]^2f(x)dx ∫−∞+∞[x−E(X)]2f(x)dx
3.常见的分布方差:
-
二项分布:
D ( X ) = p ( 1 − p ) D(X)=p(1-p) D(X)=p(1−p) -
n重伯努利实验:
D ( X ) = n p ( 1 − p ) D(X)=np(1-p) D(X)=np(1−p) -
泊松分布:
D ( X ) = λ D(X)=\lambda D(X)=λ -
均匀分布:
D ( X ) = 1 12 ( b − a ) 2 D(X)=\frac{1}{12}(b-a)^2 D(X)=121(b−a)2 -
指数分布:
D ( X ) = 1 λ 2 D(X)=\frac{1}{\lambda^2} D(X)=λ21 -
正态分布:
D ( X ) = σ 2 D(X)=\sigma^2 D(X)=σ2
4.方差性质:
-
D©=0;
-
$$
D(aX+b)=a^2D(X)$$
-
D ( X + Y ) = D ( X ) + D ( Y ) = 2 E [ ( X − E ( X ) ) ( Y − E ( Y ) ) ] = D ( X ) + D ( Y ) ( 如 果 X 与 Y 独 立 ) D(X+Y)=D(X)+D(Y)=2E[(X-E(X))(Y-E(Y))]\\ =D(X)+D(Y)(如果X与Y独立) D(X+Y)=D(X)+D(Y)=2E[(X−E(X))(Y−E(Y))]=D(X)+D(Y)(如果X与Y独立)
5.二维随机变量方差
-
离散型:先化为边缘分布,然后使用一维离散型方差公式即可。
-
连续型:与连续型数据期望的求法一样
D ( X ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( x − E ( X ) ) 2 f ( x , y ) d x d y D ( Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( y − E ( Y ) ) 2 f ( x , y ) d x d y D(X)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}(x-E(X))^2f(x,y)dxdy\\ D(Y)=\int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}(y-E(Y))^2f(x,y)dxdy D(X)=∫−∞+∞∫−∞+∞(x−E(X))2f(x,y)dxdyD(Y)=∫−∞+∞∫−∞+∞(y−E(Y))2f(x,y)dxdy
第三节 协方差
协方差代表了一组分布两种变量之间的一种相关性。
1.基本定义式:
c
o
v
(
X
,
Y
)
=
E
[
(
X
−
E
(
X
)
)
(
Y
−
E
(
Y
)
)
]
cov(X,Y)=E[(X-E(X))(Y-E(Y))]
cov(X,Y)=E[(X−E(X))(Y−E(Y))]
那么我们不难发现,当Y=X时,cov(X,X)=D(X),cov(Y,Y)=D(Y)
2.相关性质
-
c o v ( X , Y ) = E ( X Y ) − E ( X ) E ( Y ) 证 明 : c o v ( X , Y ) = E [ X Y − Y E ( X ) − X E ( Y ) + E ( X ) E ( Y ) ] = E ( X Y ) − E ( X ) E ( Y ) cov(X,Y)=E(XY)-E(X)E(Y)\\ 证明:cov(X,Y)=E[XY-YE(X)-XE(Y)+E(X)E(Y)]=E(XY)-E(X)E(Y) cov(X,Y)=E(XY)−E(X)E(Y)证明:cov(X,Y)=E[XY−YE(X)−XE(Y)+E(X)E(Y)]=E(XY)−E(X)E(Y)
-
交换律:X、Y交换一下位置,协方差依然代表两个随机变量的之间的相关性,这相关性没有发生变化。
-
相加性:
c o v ( X 1 + X 2 , Y ) = c o v ( X 1 , Y ) + c o v ( X 2 , Y ) cov(X_1+X_2,Y)=cov(X_1,Y)+cov(X_2,Y) cov(X1+X2,Y)=cov(X1,Y)+cov(X2,Y) -
乘法脱项:
c o v ( a X 1 , b X 2 ) = a b c o v ( X 1 , X 2 ) cov(aX_1,bX_2)=abcov(X_1,X_2) cov(aX1,bX2)=abcov(X1,X2) -
一个随机变量与任何常熟协方差为0:
c o v ( X , a ) = c o v ( Y , b ) = 0 cov(X,a)=cov(Y,b)=0 cov(X,a)=cov(Y,b)=0 -
求方差的新解法:
D ( X + Y ) = D ( X ) + D ( Y ) + 2 c o v ( X , Y ) D(X+Y)=D(X)+D(Y)+2cov(X,Y) D(X+Y)=D(X)+D(Y)+2cov(X,Y)
3.相关系数
ρ
X
Y
=
ρ
=
c
o
v
(
X
,
Y
)
D
(
X
)
D
(
Y
)
\rho_{XY}=\rho=\frac{cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}
ρXY=ρ=D(X)D(Y)cov(X,Y)
tips:
-
如果相关系数为0,说明X与Y没有关系。
-
相关系数的取值范围:
∣ ρ ∣ ≤ 1 |\rho|\le 1 ∣ρ∣≤1 -
∣ ρ ∣ = 1 ↔ P ( Y = a X + b ) = 1 , 其 中 a 、 b 为 常 数 |\rho|=1 \leftrightarrow P(Y=aX+b)=1,其中a、b为常数 ∣ρ∣=1↔P(Y=aX+b)=1,其中a、b为常数
-
对于二维正态分布,其独立性与不相关性是等价性。
4.矩与协方差矩阵
如果X是随机变量,如果说:
E
(
∣
X
∣
k
)
<
+
∞
E(|X|^k)<+\infty
E(∣X∣k)<+∞
记:
v
k
=
E
(
X
k
)
,
a
k
=
E
(
∣
X
∣
k
)
v_k=E(X^k),a_k=E(|X|^k)
vk=E(Xk),ak=E(∣X∣k)
那么vk为X的k阶原点矩,ak为X的k阶原点绝对矩。比如说数学期望就是一阶原点矩。
如果E(X)存在,且:
E
(
∣
X
−
E
(
X
)
∣
k
)
<
+
∞
E(|X-E(X)|^k)<+\infty
E(∣X−E(X)∣k)<+∞
记:
μ
k
=
E
(
X
−
E
(
X
)
)
k
\mu_k=E(X-E(X))^k
μk=E(X−E(X))k
则我们称uk为X的k阶中心矩,同样的如果是绝对值的k次方就是X的k阶中心绝对矩。
假设有n维随机变量:
(
X
1
,
X
2
,
.
.
.
,
X
n
)
(X_1,X_2,...,X_n)
(X1,X2,...,Xn)
记忆:
σ
i
j
=
c
o
v
(
X
i
,
X
j
)
(
i
,
j
=
1
,
2
,
.
.
.
,
n
)
\sigma_{ij}=cov(X_i,X_j)(i,j=1,2,...,n)
σij=cov(Xi,Xj)(i,j=1,2,...,n)
则称呼:
∑
=
[
σ
11
σ
12
.
.
.
σ
1
n
σ
21
σ
22
.
.
.
σ
2
n
.
.
.
.
.
.
σ
n
1
σ
n
2
.
.
.
σ
n
n
]
\sum= \begin{bmatrix} \sigma_{11} & \sigma_{12} ... \sigma_{1n}\\ \sigma_{21} & \sigma_{22} ... \sigma_{2n}\\ &......\\ \sigma_{n1} & \sigma_{n2} ... \sigma_{nn}\\ \end{bmatrix}
∑=⎣⎢⎢⎡σ11σ21σn1σ12...σ1nσ22...σ2n......σn2...σnn⎦⎥⎥⎤
为协方差矩阵,很明显根据协方差的对称性,我们可以知道协方差矩阵为一个对称矩阵。
=cov(X_i,X_j)(i,j=1,2,…,n)
则
称
呼
:
则称呼:
则称呼:
\sum=
\begin{bmatrix}
\sigma_{11} & \sigma_{12} … \sigma_{1n}\
\sigma_{21} & \sigma_{22} … \sigma_{2n}\
&…\
\sigma_{n1} & \sigma_{n2} … \sigma_{nn}\
\end{bmatrix}
$$
为协方差矩阵,很明显根据协方差的对称性,我们可以知道协方差矩阵为一个对称矩阵。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!