模式识别学习笔记-数学知识
数学期望(均值)和方差
随机变量X的数学期望(或称均值)记作 E ( x ) E(x) E(x),它描述了随机变量的取值中心,随机变量 ( X − E ( X ) ) 2 (X-E(X))^2 (X−E(X))2的数学期望称为 X X X的方差,记作 σ 2 \sigma^2 σ2,而 σ \sigma σ称为 X X X的均方差(标准差)。它描述了随机变量与均值的偏差的疏密程度。
- 若 X X X是连续型随机变量,其分布密度为 p ( x ) p(x) p(x),则当积分绝对收敛的时候
m = E ( X ) = ∫ − ∞ ∞ x p ( x ) d x σ 2 = E { ( X − m ) 2 } = ∫ − ∞ ∞ ( x − m ) 2 p ( x ) d x m = E(X)=\int_{-\infty}^{\infty}xp(x)dx \\ \sigma^2 = E\{(X-m)^2\} = \int_{-\infty}^{\infty}(x-m)^2p(x)dx m=E(X)=∫−∞∞xp(x)dxσ2=E{(X−m)2}=∫−∞∞(x−m)2p(x)dx
- 若
X
X
X是离散型随机变量,其可能取值为
x
k
,
k
=
1
,
2
,
.
.
.
,
x_k,k=1,2,...,
xk,k=1,2,...,且
P
(
X
=
x
k
)
=
p
k
P(X=x_k)=p_k
P(X=xk)=pk,则(当级数是绝对收敛时)
m = E ( X ) = ∑ k = 1 ∞ x k p k D ( X ) = ∑ k = 1 ∞ ( x k − m ) 2 p k m = E(X)=\sum^{\infty}_{k=1}x_kp_k \\ D(X) = \sum^{\infty}_{k=1}(x_k-m)^2p_k m=E(X)=k=1∑∞xkpkD(X)=k=1∑∞(xk−m)2pk
协方差矩阵
协方差矩阵说明随机向量
X
X
X的各分量的分散情况,定义为:
c
=
E
{
(
X
−
m
)
(
X
−
m
)
T
}
=
E
{
[
(
X
1
−
m
1
)
⋮
(
X
1
−
m
1
)
]
[
(
X
1
−
m
1
)
⋯
(
X
n
−
m
n
)
]
}
=
[
E
[
(
X
1
−
m
1
)
(
X
1
−
m
1
)
]
⋯
E
[
(
X
1
−
m
1
)
(
X
n
−
m
n
)
]
⋮
⋱
⋮
E
[
(
X
n
−
m
n
)
(
X
1
−
m
1
)
]
⋯
E
[
(
X
n
−
m
n
)
(
X
n
−
m
n
)
]
]
=
(
λ
11
⋯
λ
1
n
⋮
⋱
⋮
λ
n
1
⋯
λ
n
n
)
c=E{(X−m)(X−m)T}=E⎩
⎨
⎧⎣
⎡(X1−m1)⋮(X1−m1)⎦
⎤[(X1−m1)⋯(Xn−mn)]⎭
⎬
⎫=⎣
⎡E[(X1−m1)(X1−m1)]⋯E[(X1−m1)(Xn−mn)]⋮⋱⋮E[(Xn−mn)(X1−m1)]⋯E[(Xn−mn)(Xn−mn)]⎦
⎤=⎝
⎛λ11⋯λ1n⋮⋱⋮λn1⋯λnn⎠
⎞
其中,协方差矩阵的各分量为:
λ
i
j
=
E
[
(
X
i
−
m
i
)
(
X
j
−
m
j
)
]
\lambda_{ij} = E[(X_i-m_i)(X_j-m_j)]
λij=E[(Xi−mi)(Xj−mj)]
若
i
≠
j
i \neq j
i=j,则
λ
i
j
\lambda_{ij}
λij是
X
X
X的第
i
i
i个分量与第
j
j
j个分量的协方差;
若
i
=
j
i = j
i=j,则
λ
i
j
\lambda_{ij}
λij是随机变量
X
i
X_i
Xi的方差,即协方差矩阵的对角分量;
一维正态密度函数
一维随机变量
X
X
X的正态密度函数表示为:
p
(
x
)
=
1
2
π
σ
e
x
p
[
−
(
x
−
m
)
2
2
σ
2
]
p(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\left[-\frac{(x-m)^2}{2\sigma^2}\right]
p(x)=2πσ1exp[−2σ2(x−m)2]
其中均值
m
=
E
(
X
)
=
∫
−
∞
∞
x
p
(
x
)
d
x
m=E(X)=\int_{-\infty}^{\infty}xp(x)dx
m=E(X)=∫−∞∞xp(x)dx;方差
σ
2
=
E
{
(
X
−
m
)
2
}
=
∫
−
∞
∞
(
x
−
m
)
2
p
(
x
)
d
x
\sigma^2=E\{(X-m)^2\}=\int_{-\infty}^{\infty}(x-m)^2p(x)dx
σ2=E{(X−m)2}=∫−∞∞(x−m)2p(x)dx,
σ
\sigma
σ为标准差。
在
m
m
m左右各为
k
σ
k\sigma
kσ的范围内,概率为:
p
{
m
−
k
σ
≤
x
≤
m
+
k
σ
}
=
∫
m
−
k
σ
m
+
k
σ
1
2
π
σ
e
x
p
[
−
1
2
(
x
−
m
σ
)
2
]
d
x
=
1
2
π
∫
−
k
k
e
x
p
[
−
y
2
2
]
d
y
p{m−kσ≤x≤m+kσ}=∫m−kσm+kσ2πσ1exp[−21(σx−m)2]dx=2π1∫−kkexp[−2y2]dy
其中,
y
=
(
x
−
m
)
/
σ
y=(x-m)/\sigma
y=(x−m)/σ,此时
p
p
p与
k
k
k的关系:
p
{
m
−
k
σ
≤
x
≤
m
+
k
σ
}
=
{
0.683
k
=
1
0.954
k
=
2
0.997
k
=
3
p\{m-k\sigma \leq x \leq m + k\sigma\}=
p{m−kσ≤x≤m+kσ}=⎩
⎨
⎧0.6830.9540.997k=1k=2k=3
因此,在区间
∣
x
−
m
∣
≤
3
σ
|x-m|\leq 3\sigma
∣x−m∣≤3σ内,差不多包含了全部由正态样本取样的子样本。
正态密度函数可完全由均值和方差所决定,因此可以由下式表示:
p
(
x
)
∼
N
(
m
,
σ
2
)
p(x)\sim N(m,\sigma^2)
p(x)∼N(m,σ2)
多维正态密度函数
n
n
n维随机向量的正态密度函数表示为:
p
(
x
)
=
1
(
2
π
)
n
2
∣
C
∣
1
2
e
x
p
{
−
1
2
(
x
−
m
)
T
C
−
1
(
x
−
m
)
}
p(x)=\frac{1}{(\sqrt{2\pi})^{\frac{n}{2}}|C|^\frac{1}{2}}exp\left\{-\frac{1}{2}(x-m)^TC^{-1}(x-m)\right\}
p(x)=(2π)2n∣C∣211exp{−21(x−m)TC−1(x−m)}
其中
x
=
[
x
1
⋮
x
n
]
,
m
=
[
m
1
⋮
m
n
]
,
C
=
[
σ
11
2
⋯
σ
1
n
2
⋮
⋱
⋮
σ
n
1
2
⋯
σ
n
n
2
]
x= \left[ \right], m= \left[ \right], C= \left[ \right]
x=⎣
⎡x1⋮xn⎦
⎤,m=⎣
⎡m1⋮mn⎦
⎤,C=⎣
⎡σ112⋮σn12⋯⋱⋯σ1n2⋮σnn2⎦
⎤
∣
C
∣
|C|
∣C∣为协方差矩阵
C
C
C的行列式。
多维正态密度函数由其均值
m
m
m和协方差矩阵
C
C
C确定,因此可用下式表示:
p
(
x
)
∼
N
(
m
,
C
)
p(x) \sim N(m, C)
p(x)∼N(m,C)
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通