模式识别学习笔记-数学知识

数学期望(均值)和方差

随机变量X的数学期望(或称均值）记作 $E (x)$ ，它描述了随机变量的取值中心，随机变量 $X-E(X))^2$ 的数学期望称为 $X$ 的方差，记作 $\sigma^2$ ，而 $\sigma$ 称为 $X$ 的均方差（标准差）。它描述了随机变量与均值的偏差的疏密程度。

若 $X$ 是连续型随机变量，其分布密度为 $p (x)$ ，则当积分绝对收敛的时候

$E(X)=\int_{-\infty}^{\infty}xp(x)dx \\ \sigma^2 = E\{(X-m)^2\} = \int_{-\infty}^{\infty}(x-m)^2p(x)dx$

若 $X$ 是离散型随机变量，其可能取值为 $x_k,k=1,2,...,$ 且 $P(X=x_k)=p_k$ ，则（当级数是绝对收敛时）
$E(X)=\sum^{\infty}_{k=1}x_kp_k \\ D(X) = \sum^{\infty}_{k=1}(x_k-m)^2p_k$

协方差矩阵

协方差矩阵说明随机向量 $X$ 的各分量的分散情况，定义为：
$\begin{aligned} c & = E {(X - m) (X - m)^{T}} \\ = E {[\begin{matrix} (X_{1} - m_{1}) \\ ⋮ \\ (X_{1} - m_{1}) \end{matrix}] [\begin{matrix} (X_{1} - m_{1}) \dots (X_{n} - m_{n}) \end{matrix}]} \\ = [\begin{matrix} E [(X_{1} - m_{1}) (X_{1} - m_{1})] \dots E [(X_{1} - m_{1}) (X_{n} - m_{n})] \\ ⋮ ⋱ ⋮ \\ E [(X_{n} - m_{n}) (X_{1} - m_{1})] \dots E [(X_{n} - m_{n}) (X_{n} - m_{n})] \end{matrix}] \\ = (\begin{matrix} λ_{11} \dots λ_{1 n} \\ ⋮ ⋱ ⋮ \\ λ_{n 1} \dots λ_{n n} \end{matrix}) \end{aligned}$
其中，协方差矩阵的各分量为：
$\lambda_{ij} = E[(X_i-m_i)(X_j-m_j)]$
若 $\neq j$ ，则 $\lambda_{ij}$ 是 $X$ 的第 $i$ 个分量与第 $j$ 个分量的协方差；
若 $i = j$ ，则 $\lambda_{ij}$ 是随机变量 $X_i$ 的方差，即协方差矩阵的对角分量；

一维正态密度函数

一维随机变量 $X$ 的正态密度函数表示为：
$p(x)=\frac{1}{\sqrt{2\pi}\sigma}exp\left[-\frac{(x-m)^2}{2\sigma^2}\right]$
其中均值 $m=E(X)=\int_{-\infty}^{\infty}xp(x)dx$ ；方差 $\sigma^2=E\{(X-m)^2\}=\int_{-\infty}^{\infty}(x-m)^2p(x)dx$ ， $\sigma$ 为标准差。
在 $m$ 左右各为 $k\sigma$ 的范围内，概率为：
$\begin{aligned} p {m - k σ \leq x \leq m + k σ} & = \int_{m - k σ}^{m + k σ} \frac{1}{\sqrt{2 π} σ} e x p [- \frac{1}{2} {(\frac{x - m}{σ})}^{2}] d x \\ = \frac{1}{\sqrt{2 π}} \int_{- k}^{k} e x p [- \frac{y^{2}}{2}] d y \end{aligned}$
其中， $y=(x-m)/\sigma$ ，此时 $p$ 与 $k$ 的关系：
${\begin{cases} 0.683 & k = 1 \\ 0.954 & k = 2 \\ 0.997 & k = 3 \end{cases}$
因此，在区间 $|x-m|\leq 3\sigma$ 内，差不多包含了全部由正态样本取样的子样本。
正态密度函数可完全由均值和方差所决定，因此可以由下式表示：
$p(x)\sim N(m,\sigma^2)$

多维正态密度函数

$n$ 维随机向量的正态密度函数表示为：
$p(x)=\frac{1}{(\sqrt{2\pi})^{\frac{n}{2}}|C|^\frac{1}{2}}exp\left\{-\frac{1}{2}(x-m)^TC^{-1}(x-m)\right\}$
其中
$\begin{matrix} x_{1} \\ ⋮ \\ x_{n} \end{matrix}$
$∣ C ∣$ 为协方差矩阵 $C$ 的行列式。
多维正态密度函数由其均值 $m$ 和协方差矩阵 $C$ 确定，因此可用下式表示：
$\sim N(m, C)$