条件高斯分布和卡尔曼滤波

这段时间有个卡尔曼滤波的作业，正好在刑波（Eric Xing）的概率图模型课程上也谈到了这一点，所以从这个角度来阐述卡尔曼滤波，同时介绍其中用到的条件高斯分布的推导过程。这一推导过程来自于《模式识别与机器学习》（PRML）。

1. 条件高斯分布

本节要解决的问题是已知，，计算。

按照 $X$ 的划分方法，可以将均值和协方差矩阵分块如下所示。（其中协方差矩阵是对称的）

为简单起见，记，同时分块为

多维高斯分布可表示为

$f(X)=\frac{1}{(2\pi)^{D/2}|\Sigma|^{1/2}}e^{-\frac{1}{2}(X-\mu)^T\Sigma^{-1}(X-\mu)}$

计算

该式同时可表示为

也服从高斯分布，所以我们只需计算均值和协方差矩阵即可。由上式可知协方差矩阵对应二次项，而均值对于一次项（协方差矩阵已知），那么对应有

分块矩阵的逆满足下式（左侧少了一个-1）

$\begin{pmatrix} \mathbf{A} & \mathbf{B}\\ \mathbf{C} & \mathbf{D} \end{pmatrix}^{-1}= \begin{pmatrix} \mathbf{M} & \mathbf{-MBD^{-1}}\\ \mathbf{-D^{-1}CM} & \mathbf{D^{-1}+D^{-1}CMBD^{-1}} \end{pmatrix}^$

其中 $\mathbf{M}$ 为

故可求条件高斯分布的协方差矩阵和期望分别为

$\mu_{a|b}=\mu_{a}+\Sigma_{ab}\Sigma_{bb}^{-1}(X_b-\mu_b)$

至此可得条件高斯分布的概率密度。

2. 卡尔曼滤波

卡尔曼滤波公式可表现为

$\begin{matrix} Y_{k+1} = HY_k+u_k\\ X_{k} = FY_k+v_k \end{matrix}$

从这个式子中可以看出 $X,Y$ 之间的关系，可以通过贝叶斯网络描述。

不考虑初始时刻（这个时刻可以认为只有观测值，没有先验知识，采用ML等准则比较容易估计），中间时刻可以认为通过两个步骤估计状态，其一是先验知识，其二是观测数据。如下图所示

当然，之前的数据也是通过之前的观测量估计出来的，所以先验实际上是该时刻之前的观测量给出的现在时刻的状态估计。卡尔曼滤波中假设噪声服从高斯分布，此处我们计算均值和协方差有

注意：我实在是转不过来了，下面的X是状态，而Y是观测值，和上面的是反的。

$\hat x_{k+1|k} = E(X_{k+1|k}|y_{1,...,k}) = E(HX_{k|k}+u_k|y_{1,...,k})=H\hat x_{k|k}$

$\begin{align*} E((X_{k+1|k}-\hat x_{k|k})^T(X_{k+1|k}-\hat x_{k|k})|y_{1,...,k}) &= E((HX_{k|k}-\hat x_{k|k}+u_k)^T(HX_{k|k}-\hat x_{k|k}+u_k)|y_{1,...,k}) \\ &= H^TP_{k|k}H+E(u_k^Tu_k) \end{align*}$