隐马尔科夫模型

马尔科夫模型

二阶马尔科夫模型案例

初始概率分布

状态转移概率分布

状态集合

状态集合S={sunny,cloudy,rainy}。

观测序列

观测状态序列可以是X=x₁,...,x_t,...,x_T，其中xt∈S。

观测序列就是一个系列的状态。马尔科夫模型在计算状态序列的概率时，考虑了转移概率，也就是从一个状态转移到另一个状态的概率。

观测序列概率计算

使用马尔科夫模型计算观测状态序列的概率：

其中θ为模型参数，θ={ p(x) | x∈S }∪{ p(x'|x) | x,x' ∈ S }，也就是初始概率和转移概率，这些都为参数。

P(x;θ)表示在参数θ下，观测状态序列的概率。

因为当前状态的生成只依赖于前一个状态，故称为二阶马尔科夫模型。

连续四天下雨的概率

P(rainny,rainny,rainny,rainny;θ)

=P(x₁=s₃,x₂=s₃,x₃=s₃,x₄=s₃;θ)

=P(x₁=s₃) x P(x₂=s₃ | x₁=s₃) x P(x₃=s₃ | x₂=s₃) x P(x₄=s₃|x₃=s₃)

=π₃ x a₃₃ x a₃₃ x a₃₃

=0.3 x 0.4 x 0.4 x 0.4

=0.0192

状态初始化概率

状态初始化概率就是初始时状态的概率，定义为：

π_i=p(x₁=s_i)，1≤i≤N。

状态初始化概率满足的性质

非负性：π_i≥0

归一性：

在天气案例中，状态初始化概率分别为：π₁=0.4，π₂=0.3，π₃=0.3。

状态转移概率

状态转移概率就是从当前状态转移到另一个状态的概率，定义为：

a_ij=p(x_t=s_j | x_t-1 = s_i) ,1≤i , j≤N

表明在前一个状态为s_i事件发生下，后一个状态为s_j的概率，这是一个条件概率。

状态转移概率满足的性质：

非负性：

归一性：

归一性表明，从状态i转移到其他所有状态的概率总和为1。

例如在天气案例中，a₁₂表明前一个状态为晴天时，后一个状态为阴天的概率，a₁₂=0.5。

马尔科夫模型的极大似然估计

给定包含D个样本的训练数据D={x^(d)}^D_d=1，使用极大似然估计来从训练数据中自动获取最优模型参数（初始概率和转移概率）：

似然函数L(θ)通常以对数形式定义：

其中T^(d)表示第d个序列的长度，x_t^(d)表示第d个序列x^(d)中的第t个状态。

构造拉格朗日函数：

计算初始概率

估计初始概率，就要对初始概率求偏导，求目标函数的极值

δ(a,b)中，当a=b时为1，否则为0。令式子等于0，得到：

计算λ

估计λ的值，就要对λ求导，求目标函数的极值：

令式子等于0，得到：

将代入式子中，得到：

注意，在λ表达式中，x表示的是S集合中任意状态，是与式子无关的量，而在p(x)式中，x是与p(x)有关的一个量，表示特定的一个状态，在整合的时候应当区分开，使用x'代替，将λ的结果代入p(x)中可以得到：

计算状态转移概率

估计状态转移概率，就要对转移概率求导：

令式子等于0，得到：

计算参数γ

目标函数对参数γ_x求偏导：

令式子等于0，同时将代入，得到：

注意，在γ_x式子中，x'表示为集合S中任何一个状态，与γ_x无关，但是在p(x'|x)式子中，是与p(x'|x)有关的一个变量，表示特定的一个状态'。因此在整合的时候要区分开，将γ_x中使用x''代替，得到最终式子：

参数估计公式

经过上述推导，得到参数估计公式。回想一下，δ(a,b)中，当a=b时为1，否则为0。

状态初始化概率的估计公式为：

分子表示在所有状态序列中，第一个状态序列为x的次数；分母表示在所有状态序列中，第一个状态为任意状态的次数，也就是状态序列的总数；整个式子描述了第一个状态为x的状态序列占总的状态序列的比例，也就是初始状态概率。

状态转移概率的估计公式为：

分子表示在所有的状态序列中，前一个状态为x，后一个状态为x'，这样成对出现的次数；分母表示在所有状态序列中，前一个状态为x，后一个状态为状态集合中任意状态，这样成对出现的次数；整个式子描述了以状态x为起点且以状态x'的结束的序列占以状态x为起点以任意状态x''结束的序列的比例，也就是状态转移概率

隐马尔科夫模型

隐状态与观测状态

假定⼀个囚徒被关在暗⽆天⽇的牢房⾥，不知道外⾯的天⽓（如晴天、阴天、⾬天），但是可以通过触摸感受到地⾯的潮湿程度（如⼲燥、潮湿），从⽽推测天⽓情况。在这个例⼦⾥，地⾯潮湿程度是观测状态，外⾯的天⽓是隐状态。

隐状态无法被直接观测，只能通过观测状态来推断隐状态，观测状态的生成取决于隐状态，可以理解为隐状态是原因，观测状态是结果，求隐状态序列的概率就是通过观测的结果来推断原因。

如图中所示，当前得到的观测状态的概率，既取决于由某个隐状态生成该观测状态概率，也取决于上一个隐状态转移到当前隐状态的转移概率。

隐马尔科夫模型

隐马尔科夫模型相比与马尔科夫模型，引入了隐状态。

O={o₁,...,o_m}表示观测状态集合，S={s₁,...,s_N}表示隐状态集合。

x=x₁,...,x_t,...,x_T表示观测状态序列，z=z₁,...,z_t,...,z_T表示隐状态序列。

二阶隐马尔科夫模型表示：

其中θ为参数，θ= { p(z) | z ∈ S } ∪ { p(z'|z) | z,z' ∈ S } ∪ { p(x|z) | x∈O ∧ z ∈ S }。

马尔科夫模型中参数只有两个，分别为状态初始概率和状态转移概率，在隐马尔科夫模型中参数有3个，分别是隐状态初始概率，隐状态转移概率，隐状态生成观测状态概率。

p(z)：表示隐状态的初始概率。

p(z_t|z_t-1)：表示上一个隐状态为z_t-1的条件下，当前隐状态为z_t的条件概率。

p(x_t|z_t)：表示隐状态为z_t的条件下，观测为x_t的条件概率。

该表达式中描述了隐状态生成观测状态的概率和隐状态转移概率。

隐状态初始化概率

隐状态初始化概率就是初始时隐状态为某一状态的概率，表示为：

π_i=p(z_i=s_i),1≤i≤N

隐状态初始化概率性质：

非负性：π_i ≥ 0。

归一性：。

在天气案例中，隐状态初始概率如下：

隐状态转移概率

隐状态转移概率就是从一个隐状态转移到另一个隐状态的概率，表示为：

a_ij = p(z_t = s_j |z_t-1 = s_i )，1 ≤ i，j ≤ N。

隐状态转移概率的性质：
非负性：a_ij ≥ 0。

归一性：。

归一性说明从一个隐状态转移到其他所有隐状态的概率总和为1.

天气案例中，隐状态转移概率如下：

观测状态生成概率

观测状态生成概率指的是从一个隐状态生成一个观测状态的概率，是一个条件概率，表示为：

b_j(k) = p(x_t = o_k | z_t =s_j)，1 ≤ j ≤ N ∧1 ≤ k ≤ M。

b_j(k)表明由隐状态j生成观测状态k的概率。

观测状态生成概率性质：

非负性：b_j(k) ≥ 0。

归一性：。

归一性说明：由一个隐状态生成其他所有观测状态的概率总和为1。

观测状态序列计算

任务定义

给定模型参数（隐状态初始概率，隐状态转移概率，观测状态生成概率），计算观测状态序列的概率。

观测状态序列的概率描述了所有隐状态组合并且转移形成该观测状态序列的概率，所以需要全枚举。

计算复杂度

因为一个观测状态序列可以由多个隐状态序列得到，因此要计算观测状态序列的概率时，要枚举所有的隐状态序列。

假设观测状态序列长度为T，也就是有T个观测状态，隐状态一共有N中，如果全部枚举的话，一共有N^T隐状态序列，计算量非常大。

假设观测状态序列为“干燥，潮湿”，则总共有3²=9种隐状态序列：

搜索空间的表示

隐马尔科夫模型的搜索空间可以使用一个有向图表示，节点表示隐状态，边表示隐状态之间的转移。

如下图所示，路径等价于P(x,z;θ)= π₃b₃(x₁) X a₃₂b₂(x₂) X a₂₁b₁(x₃) X a₁₃b₃(x₄)

每一个时间节点的状态，由隐状态生成观测状态概率和隐状态转移概率决定。

如在时间节点2，a₃₂b₂(x₂) 表示当前状态由从上一个隐状态3转移到当前隐状态2的概率乘以隐状态2生成观测状态x2（观测序列是给定的，目的是求其概率）的概率。

从图的角度，计算观测状态序列等价于计算所有路劲之和（因为每个时间节点的不同隐状态都可以生成特定的观测状态）。

计算路劲之和有两种方法，全枚举法和动态规划法。

全枚举法

列出所有路径，计算其取值。

动态规划法

利用动态规划的思想，dp[i]表示节点i的累积值，dp[i]可以从dp[i]的所有前驱节点得到，也就是要加上其所有前驱的累积值。

状态转移方程：

dp[i]= sum dp[j]_j∈heads(i)，其中j为i的前驱，dp[j]为i的前驱j累积的值。

后向路径

与前向路径一致，使用动态规划求解

前向概率

部分观测状态序列x1,...,xt与第t个隐状态为s_i的联合概率称为前向概率。前项概率描述了最后一个观测状态为x_t且隐状态为z_t=s_i时，从初始状态转移到该状态的所有情况的概率总和。

定义：a_t(i)=P(x₁,...,x_t,z_t=s_i;θ)

想要知道x₁,...,x_t序列中，也就是最后一个观测状态为x_t时，隐状态为z_t的概率，就必须知道是如何转移过来的，也就是要知道x₁,...x_t-1中，也就是最后一个观测状态为x_t-1时，隐状态z_t-1从不同的状态转移到z_t的概率，最终乘以当前的观测状态生成概率。

P(x₁,...,x_t,z_t=s_i;θ)=sum [ P(x₁,...,x_t-1,z_t-1;θ) P(z_t=s_i|z_t-1) ] P(x_t|z_t=s_i)

初始化：t=1

递归：t=2,...,T

终止：

假设观测状态序列为“干燥，潮湿，干燥”。前向概率为P(x₁=干燥,x₂=潮湿,x₃=干燥,z₃;θ)

P(x₁=干燥,x₂=潮湿,x₃=干燥,z₃;θ)

P(x1=干,z₁=晴;θ) = p( z₁=晴) x p( x₁=干 | z₁=晴) = 0.4 x 0.8 = 0.32

P(x1=干,z₁=阴;θ) = p( z₁=阴) x p( x₁=干 | z₁=阴) = 0.3 x 0.6 = 0.18

P(x1=干,z₁=雨;θ) = p( z₁=雨) x p( x₁=干 | z₁=雨) = 0.3 x 0.3 = 0.09

P(x1=干,x2=湿,z₂=晴;θ)=[ p(z₂=晴|z₁=晴) x P(x1=干,z₁=晴;θ) + p(z₂=晴|z₁=阴)x P(x1=干,z₁=阴;θ) + p(z₂=晴|z₁=雨) x P(x1=干,z₁=雨;θ) ] x p(x₂=晴|z₂=湿) = ( 0.32 x 0.4 + 0.18 x 0.3 + 0.09 x 0.1 ) x 0.2 = 0.0382

P(x1=干,x2=湿,z₂=阴;θ)=[ p(z₂=阴|z₁=晴) x P(x1=干,z₁=晴;θ) + p(z₂=阴|z₁=阴)x P(x1=干,z₁=阴;θ) + p(z₂=阴|z₁=雨) x P(x1=干,z₁=雨;θ) ] x p(x₂=阴|z₂=湿) = ( 0.32 x 0.5 + 0.18 x 0.4 + 0.09 x 0.5 ) x 0.4 = 0.1108

P(x1=干,x2=湿,z₂=雨;θ)=[ p(z₂=雨|z₁=晴) x P(x1=干,z₁=晴;θ) + p(z₂=雨|z₁=阴)x P(x1=干,z₁=阴;θ) + p(z₂=雨|z₁=雨) x P(x1=干,z₁=雨;θ) ] x p(x₂=雨|z₂=湿) = ( 0.32 x 0.1 + 0.18 x 0.3 + 0.09 x 0.4 ) x 0.7 = 0.0854

P(x1=干,x2=湿,x3=干,z₃=晴;θ)=[ p(z₃=晴|z₂=晴) x P(x1=干,x2=湿,z₂=晴;θ) + p(z₃=晴|z₂=阴) x P(x1=干,x2=湿,z₂=阴;θ) + p(z₃=晴|z2=雨) x P(x1=干,x2=湿,z₂=雨;θ) ] x p(x₃=晴|z₃=干) = ( 0.0382x 0.4 + 0.1108x 0.3 + 0.0854x 0.1 ) x 0.8 = 0.045648

P(x1=干,x2=湿,x3=干,z₃=阴;θ)=[ p(z₃=阴|z₂=晴) x P(x1=干,x2=湿,z₂=晴;θ) + p(z₃=阴|z₂=阴) x P(x1=干,x2=湿,z₂=阴;θ) + p(z₃=阴|z2=雨) x P(x1=干,x2=湿,z₂=雨;θ) ] x p(x₃=阴|z₃=干) = ( 0.0382x 0.5 + 0.1108x 0.4 + 0.0854x 0.5 ) x 0.6 = 0.063672

P(x1=干,x2=湿,x3=干,z₃=雨;θ)=[ p(z₃=雨|z₂=晴) x P(x1=干,x2=湿,z₂=晴;θ) + p(z₃=雨|z₂=阴) x P(x1=干,x2=湿,z₂=阴;θ) + p(z₃=雨|z2=雨) x P(x1=干,x2=湿,z₂=雨;θ) ] x p(x₃=雨|z₃=干) = ( 0.0382x 0.1 + 0.1108x 0.3 + 0.0854x 0.4 ) x 0.3 = 0.021366

P(x₁=干燥,x₂=潮湿,x₃=干燥,z₃;θ)=P(x1=干,x2=湿,x3=干,z₃=晴;θ) + P(x1=干,x2=湿,x3=干,z₃=阴;θ) + P(x1=干,x2=湿,x3=干,z₃=雨;θ) =0.045648+0.063672+0.021366=0.1307

最终观测序列“干燥，潮湿，干燥”的前向概率为0.1307

后向概率

后向概率类似于前项概率，但是计算方式与前向概率相反，第t个隐状态为s_i生成部分观测状态序列x_t+1,...,x_T的概率称为后向概率，定义为：

β_t(i)=P(x_t+1,...,x_T | z_t=s_i ; θ )

初始化：t=T，β_T(i)=1,1≤i≤N

递归：t=T-1,...,1

终止：

当前状态的概率要考虑当前隐状态转移到后一个隐状态的概率以及后一个的观测状态生成概率，还要乘以后一个隐状态的后向概率。

例如计算观测序列“干燥，潮湿，干燥”的后向概率，p(x1=干,x2=湿,x3=干|z ; θ)。

在后向概率中，初始值一般设置为1

_β3(晴)=1

β₃(阴)=1

β₃(雨)=1

p(x:θ)=p(z₀=晴)p(x₁=干燥|z₁=晴)β₁(晴) + p(z₀=阴)β₁(阴)p(x₁=干燥|z₁=阴) + p(z₀=雨)β₁(雨)p(x₁=干燥|z₁=雨)=0.4 x0.8 x 0.2010 + 0.3 x 0.6 x 0.2352 +0.3 x 0.3 x 0.2670 = 0.1307

posted @ 2023-02-20 17:50 Laplace蒜子阅读(459) 评论(0) 收藏举报

RedNoseBo

隐马尔科夫模型

马尔科夫模型

二阶马尔科夫模型案例

初始概率分布

状态转移概率分布

状态集合

观测序列

观测序列概率计算

连续四天下雨的概率

状态初始化概率

状态转移概率

马尔科夫模型的极大似然估计

计算初始概率

计算λ

计算状态转移概率

计算参数γ

参数估计公式

隐马尔科夫模型

隐状态与观测状态

隐马尔科夫模型

隐状态初始化概率

隐状态转移概率

观测状态生成概率

观测状态序列计算

任务定义

计算复杂度

搜索空间的表示

全枚举法

动态规划法

后向路径

前向概率

后向概率

公告