序列蒙特卡罗（Sequential Monte Carlo）

发现网上看到的序列蒙特卡罗的中文理解很少，就稍微整理一下自己看到的，欢迎讨论~

内容引入

许多现实世界的数据分析任务都涉及从一些给定的观察数据中估计预测未知的数据。大多数应用场景下可以使用一些先验知识来辅助建模，即贝叶斯模型【通过未知量的先验分布以及与这些量与观测值相关的似然函数得到后验分布来刻画和分析一些东西】。通常情况下，观测数据是按时间顺序记录的，这有助于执行在线推理，不断更新后验分布。使用雷达测量跟踪飞机、使用噪声测量估计数字通信信号、使用股票市场数据估计金融工具的波动性等都属于此类情况。

序列蒙特卡罗的另一种叫法是粒子滤波【利用粒子集来表示概率，通过寻找一组在状态空间中传播的随机样本来近似表示概率密度函数，用样本均值代替积分运算，获得系统状态的最小方差估计过程】。

不得不提的一个是卡尔曼滤波 -- 用线性高斯状态空间模型对数据进行建模，推导出精确的解析表达式来计算后验分布的演化序列。还有一个是隐马尔可夫模型HMM滤波器，将数据建模为部分观察的有限状态空间马尔可夫链，也有可能得到一个解析解。这两个滤波器在实际中是最为普遍和著名的，但在解决实际问题时，我们得到的数据通常涉及非高斯性、高维性和非线性因素，一般得不到解析解。这是一个渗透在大多数科学学科中的基础性的重要问题。根据感兴趣的领域，出现了许多不同的名称，包括贝叶斯过滤，最优(非线性)过滤，随机过滤和在线推理与学习。三十多年来，为了解决这一问题，人们提出了许多近似方案，如扩展卡尔曼滤波、高斯和逼近和基于网格的滤波器。前两种方法没有考虑到所考虑过程的所有显著统计特征，常常导致较差的结果。基于网格的过滤器。基于确定性数值积分的方法，可以得到精确的结果，但很难实现，计算代价太高，在高维中没有任何实际应用。

而序列蒙特卡罗 (Sequential Monte Carlo)是一种基于仿真的方法，为计算后验分布提供了便捷，不一定非要计算出显式结果。

模型描述

使用 $x$ 来描述信号， $y$ 来描述观测值。我们的目的是在时间上递归估计后验分布 $p(x_{0:t}|y_{1:t})$ 及其相关特征（均值、方差、协方差等）。

理论上带入贝叶斯公式，都可以计算和预测，具体公式如下：

由于上述常数、后验边缘等涉及高维积分，真的不好计算。大家想了很多办法来近似分布进行抽样估计，如重要性抽样、顺序重要性抽样等。