隐马尔可夫模型

隐马尔可夫模型定义

隐马尔可夫模型是描述两个时序序列联合分布p(x,y)的概率模型，x序列外界可见，称为观测序列；y序列外界不可见，称为状态序列。比如观测x为单词，状态y为词性。

隐马尔可夫模型利用三个要素来模拟时序序列的发生过程，初始状态概率向量，状态转移概率矩阵和发射概率矩阵。

$\lambda=(\pi, A, B)$

其中 $\pi$ 为初始时刻的概率分布 $A$ 为状态转移矩阵 $B$ 为发射矩阵

模型的详细定义见 https://zhuanlan.zhihu.com/p/380298879

马尔科夫假设（确定了状态与观测之间的依赖关系）

每个事件的发生概率只取决于前一个事件，将满足该假设的连续多个事件串联在一起，就构成了马尔可夫链。

任意时刻的观测x只依赖于该时刻的状态y，与其他时刻的状态或观测独立无关。

隐马尔可夫模型要解决的三个问题

（1）样本生成问题：给定模型，生成满足模型约束的样本，即一系列观测序列及其对应的状态序列。（Evaluation问题）

（2）模型训练问题：给定训练集观测序列和状态序列，估计模型参数（Learning问题）

（3）序列预测问题：已知模型参数，给定观测序列x，求最可能的状态序列y（最具有实际意义的问题）（Decoding问题）

Evaluation问题是给定模型参数去求所有可能的观测序列的概率，所有的观测序列有N的T次方种可能，复杂度太大，直接求解不太现实，因此采用前向算法降低了时间复杂度， $\alpha_t(i)$ 代表前 $t$ 时刻的观测变量与 $t$ 时刻的隐状态， $i$ 代表 $t$ 时刻的隐状态为 $q_i$ ，通过 $\alpha_{t+1}$ 与 $\alpha_t$ 的递推式快速计算出 $P(O|\lambda)$ 降低了时间复杂度。

posted on 2021-12-22 22:53 啥123 阅读(81) 评论(0) 编辑收藏举报