模式识别学习笔记-数学知识

数学期望(均值)和方差

随机变量X的数学期望(或称均值)记作 E ( x ) E(x) E(x),它描述了随机变量的取值中心,随机变量 ( X − E ( X ) ) 2 (X-E(X))^2 (XE(X))2的数学期望称为 X X X的方差,记作 σ 2 \sigma^2 σ2,而 σ \sigma σ称为 X X X的均方差(标准差)。它描述了随机变量与均值的偏差的疏密程度。

  • X X X是连续型随机变量,其分布密度为 p ( x ) p(x) p(x),则当积分绝对收敛的时候

m = E ( X ) = ∫ − ∞ ∞ x p ( x ) d x σ 2 = E { ( X − m ) 2 } = ∫ − ∞ ∞ ( x − m ) 2 p ( x ) d x m = E(X)=\int_{-\infty}^{\infty}xp(x)dx \\ \sigma^2 = E\{(X-m)^2\} = \int_{-\infty}^{\infty}(x-m)^2p(x)dx m=E(X)=xp(x)dxσ2=E{(Xm)2}=(xm)2p(x)dx

  • X X X是离散型随机变量,其可能取值为 x k , k = 1 , 2 , . . . , x_k,k=1,2,..., xk,k=1,2,..., P ( X = x k ) = p k P(X=x_k)=p_k P(X=xk)=pk,则(当级数是绝对收敛时)
    m = E ( X ) = ∑ k = 1 ∞ x k p k D ( X ) = ∑ k = 1 ∞ ( x k − m ) 2 p k m = E(X)=\sum^{\infty}_{k=1}x_kp_k \\ D(X) = \sum^{\infty}_{k=1}(x_k-m)^2p_k m=E(X)=k=1xkpkD(X)=k=1(xkm)2pk

协方差矩阵

协方差矩阵说明随机向量 X X X的各分量的分散情况,定义为:
c = E { ( X − m ) ( X − m ) T } = E { [ ( X 1 − m 1 ) ⋮ ( X 1 − m 1 ) ] [ ( X 1 − m 1 ) ⋯ ( X n − m n ) ] } = [ E [ ( X 1 − m 1 ) ( X 1 − m 1 ) ] ⋯ E [ ( X 1 − m 1 ) ( X n − m n ) ] ⋮ ⋱ ⋮ E [ ( X n − m n ) ( X 1 − m 1 ) ] ⋯ E [ ( X n − m n ) ( X n − m n ) ] ] = ( λ 11 ⋯ λ 1 n ⋮ ⋱ ⋮ λ n 1 ⋯ λ n n ) c=E{(Xm)(Xm)T}=E{[(X1m1)(X1m1)][(X1m1)(Xnmn)]}=[E[(X1m1)(X1m1)]E[(X1m1)(Xnmn)]E[(Xnmn)(X1m1)]E[(Xnmn)(Xnmn)]]=(λ11λ1nλn1λnn) c=E{(Xm)(Xm)T}=E (X1m1)(X1m1) [(X1m1)(Xnmn)] = E[(X1m1)(X1m1)]E[(X1m1)(Xnmn)]E[(Xnmn)(X1m1)]E[(Xnmn)(Xnmn)] = λ11λ1nλn1λnn
其中,协方差矩阵的各分量为:
λ i j = E [ ( X i − m i ) ( X j − m j ) ] \lambda_{ij} = E[(X_i-m_i)(X_j-m_j)] λij=E[(Ximi)(Xjmj)]
i ≠ j i \neq j i=j,则 λ i j \lambda_{ij} λij X X X的第 i i i个分量与第 j j j个分量的协方差;
i = j i = j i=j,则 λ i j \lambda_{ij} λij是随机变量 X i X_i Xi的方差,即协方差矩阵的对角分量;

一维正态密度函数

一维随机变量 X X X的正态密度函数表示为:
p ( x ) = 1 2 π σ e x p [ − ( x − m ) 2 2 σ 2 ] p(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\left[-\frac{(x-m)^2}{2\sigma^2}\right] p(x)=2π σ1exp[2σ2(xm)2]
其中均值 m = E ( X ) = ∫ − ∞ ∞ x p ( x ) d x m=E(X)=\int_{-\infty}^{\infty}xp(x)dx m=E(X)=xp(x)dx;方差 σ 2 = E { ( X − m ) 2 } = ∫ − ∞ ∞ ( x − m ) 2 p ( x ) d x \sigma^2=E\{(X-m)^2\}=\int_{-\infty}^{\infty}(x-m)^2p(x)dx σ2=E{(Xm)2}=(xm)2p(x)dx σ \sigma σ为标准差。
m m m左右各为 k σ k\sigma 的范围内,概率为:
p { m − k σ ≤ x ≤ m + k σ } = ∫ m − k σ m + k σ 1 2 π σ e x p [ − 1 2 ( x − m σ ) 2 ] d x = 1 2 π ∫ − k k e x p [ − y 2 2 ] d y p{mkσxm+kσ}=mkσm+kσ12πσexp[12(xmσ)2]dx=12πkkexp[y22]dy p{mxm+}=mm+2π σ1exp[21(σxm)2]dx=2π 1kkexp[2y2]dy
其中, y = ( x − m ) / σ y=(x-m)/\sigma y=(xm)/σ,此时 p p p k k k的关系:
p { m − k σ ≤ x ≤ m + k σ } = { 0.683 k = 1 0.954 k = 2 0.997 k = 3 p\{m-k\sigma \leq x \leq m + k\sigma\}= {0.683k=10.954k=20.997k=3 p{mxm+}= 0.6830.9540.997k=1k=2k=3
因此,在区间 ∣ x − m ∣ ≤ 3 σ |x-m|\leq 3\sigma xm3σ内,差不多包含了全部由正态样本取样的子样本。
正态密度函数可完全由均值和方差所决定,因此可以由下式表示:
p ( x ) ∼ N ( m , σ 2 ) p(x)\sim N(m,\sigma^2) p(x)N(m,σ2)

多维正态密度函数

n n n维随机向量的正态密度函数表示为:
p ( x ) = 1 ( 2 π ) n 2 ∣ C ∣ 1 2 e x p { − 1 2 ( x − m ) T C − 1 ( x − m ) } p(x)=\frac{1}{(\sqrt{2\pi})^{\frac{n}{2}}|C|^\frac{1}{2}}exp\left\{-\frac{1}{2}(x-m)^TC^{-1}(x-m)\right\} p(x)=(2π )2nC211exp{21(xm)TC1(xm)}
其中
x = [ x 1 ⋮ x n ] , m = [ m 1 ⋮ m n ] , C = [ σ 11 2 ⋯ σ 1 n 2 ⋮ ⋱ ⋮ σ n 1 2 ⋯ σ n n 2 ] x= \left[ x1xn \right], m= \left[ m1mn \right], C= \left[ σ112σ1n2σn12σnn2 \right] x= x1xn ,m= m1mn ,C= σ112σn12σ1n2σnn2
∣ C ∣ |C| C为协方差矩阵 C C C的行列式。
多维正态密度函数由其均值 m m m和协方差矩阵 C C C确定,因此可用下式表示:
p ( x ) ∼ N ( m , C ) p(x) \sim N(m, C) p(x)N(m,C)

posted @   eryo  阅读(59)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示