维特比(Viterbi)算法，近似算法序列过长导致出现0概率而使程序运行失败的处理方法

原始Viterbi算法

(1) 初始化 (初始状态向量乘以第一个观测 $o_{1}$ ) :

\begin{array}{l} δ_{1} (i) = π_{i} b_{i} (o_{1}), i = 1, 2, \dots, N \\ ψ_{1} (i) = 0, t = 1, 2, \dots, N \end{array}

$\begin{array}{l} \delta_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \quad i=1,2, \cdots, N \\ \psi_{1}(i)=0, \quad t=1,2, \ldots, N \end{array}$

(2) 递推，对于 $t=2,3, \ldots, T$

δ_{t} (i) = max_{1 \leq j < N} [δ_{t - 1} (j) a_{j i}] b_{i} (O_{t}) i = 1, 2, \dots, N

$\delta_{t}(i)=\max _{1 \leq j<N}\left[\delta_{t-1}(j) a_{j i}\right] b_{i}\left(O_{t}\right) i=1,2, \ldots, N$

记录当前状态:

ψ_{t} (i) = \arg max_{1 ⩽ j ⩽ N} [δ_{t - 1} (j) a_{j i}] i = 1, 2, \dots, N

$\psi_{t}(i)=\arg \max _{1 \leqslant j \leqslant N}\left[\delta_{t-1}(j) a_{j i}\right] i=1,2, \ldots, N$

(3) 终止:

\begin{array}{l} P^{*} = max_{1 ⩽ i ⩽ N} δ_{T} (i) \\ i_{T}^{*} = \arg max_{1 \leq i \leq N} [δ_{T} (i)] \end{array}

$\begin{array}{l} P^{*}=\max _{1 \leqslant i \leqslant N} \delta_{T}(i) \\ i_{T}^{*}=\arg \max _{1 \leq i \leq N}\left[\delta_{T}(i)\right] \end{array}$

(4) 最优路径回溯.对于 $t=T-1, T-2, \cdots, 1$

i_{t}^{*} = ψ_{t + 1} (i_{t + 1}^{*})

$i_{t}^{*}=\psi_{t+1}\left(i_{t+1}^{*}\right)$

求得的最优路径也就是最可能的状态序列为:

I^{*} = (i_{1}^{*}, i_{2}^{*}, \dots, i_{T}^{*})

$I^{*}=\left(i_{1}^{*}, i_{2}^{*}, \cdots, i_{T}^{*}\right)$

对原始Viterbi算法进行改进，在计算 $t$ 时刻的局部状态 $\boldsymbol{\delta_t}$ 后，对 $\boldsymbol{\delta_t}$ 进行发大处理

δ_{t} = δ_{t} / max (δ_{t})

$\boldsymbol{\delta_t}=\boldsymbol{\delta_t}/\max(\boldsymbol{\delta_t})$

改进Viterbi算法

(1) 初始化 (初始状态向量乘以第一个观测 $o_{1}$ ) :

\begin{array}{l} δ_{1} (i) = π_{i} b_{i} (o_{1}), i = 1, 2, \dots, N \\ ψ_{1} (i) = 0, t = 1, 2, \dots, N \end{array}

$\begin{array}{l} \delta_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \quad i=1,2, \cdots, N \\ \psi_{1}(i)=0, \quad t=1,2, \ldots, N \end{array}$

对中间状态变量 $\boldsymbol{\delta_t}$ 进行发大

δ_{1} = δ_{1} / max (δ_{1})

$\boldsymbol{\delta_1}=\boldsymbol{\delta_1}/\max(\boldsymbol{\delta_1})$

(2) 递推，对于 $t=2,3, \ldots, T$

δ_{t} (i) = max_{1 \leq j < N} [δ_{t - 1} (j) a_{j i}] b_{i} (O_{t}) i = 1, 2, \dots, N

$\delta_{t}(i)=\max _{1 \leq j<N}\left[\delta_{t-1}(j) a_{j i}\right] b_{i}\left(O_{t}\right) i=1,2, \ldots, N$

记录当前状态:

ψ_{t} (i) = \arg max_{1 ⩽ j ⩽ N} [δ_{t - 1} (j) a_{j i}] i = 1, 2, \dots, N

$\psi_{t}(i)=\arg \max _{1 \leqslant j \leqslant N}\left[\delta_{t-1}(j) a_{j i}\right] i=1,2, \ldots, N$

对中间状态变量 $\boldsymbol{\delta_t}$ 进行发大

δ_{t} = δ_{t} / max (δ_{t})

$\boldsymbol{\delta_t}=\boldsymbol{\delta_t}/\max(\boldsymbol{\delta_t})$

(3) 终止:

\begin{array}{l} P^{*} = max_{1 ⩽ i ⩽ N} δ_{T} (i) \\ i_{T}^{*} = \arg max_{1 \leq i \leq N} [δ_{T} (i)] \end{array}

$\begin{array}{l} P^{*}=\max _{1 \leqslant i \leqslant N} \delta_{T}(i) \\ i_{T}^{*}=\arg \max _{1 \leq i \leq N}\left[\delta_{T}(i)\right] \end{array}$

(4) 最优路径回溯.对于 $t=T-1, T-2, \cdots, 1$

i_{t}^{*} = ψ_{t + 1} (i_{t + 1}^{*})

$i_{t}^{*}=\psi_{t+1}\left(i_{t+1}^{*}\right)$

求得的最优路径也就是最可能的状态序列为:

I^{*} = (i_{1}^{*}, i_{2}^{*}, \dots, i_{T}^{*})

$I^{*}=\left(i_{1}^{*}, i_{2}^{*}, \cdots, i_{T}^{*}\right)$

该算法下求得的最优路径与原算法求得的最优路径相同。

证明：

设原算法的中间变量为 $\delta,\psi$ ，最优路径 $I^*$ ，改进算法的中间变量为 $\delta',\psi'$ ，最优路径 $I^{*'}$

$t=1$ 时：

\begin{array}{l} δ_{1} (i) = π_{i} b_{i} (o_{1}), i = 1, 2, \dots, N \\ ψ_{1} (i) = 0, t = 1, 2, \dots, N \end{array}

$\begin{array}{l} \delta_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \quad i=1,2, \cdots, N \\ \psi_{1}(i)=0, \quad t=1,2, \ldots, N \end{array}$

令 $a=\max(\boldsymbol{\delta_1})$

\begin{array}{l} δ_{1} (i)^{'} & = δ_{1} (i) / a \\ = δ_{1} (i) / max (δ_{1}) i = 1, 2, \dots, N \end{array}

$\begin{array}{l} \delta_{1}(i)'&=\delta_1(i)/a \\ &=\delta_1(i)/\max(\boldsymbol{\delta_1}) \quad i=1,2, \ldots, N \end{array}$

\begin{array}{l} ψ_{1}^{'} (i) & = ψ_{1} (i) \end{array}

$\begin{array}{l} \psi_1'(i)&=\psi_{1}(i)\\ \end{array}$

$t=2$ 时：

δ_{2} (i) = max_{1 \leq j < N} [δ_{1} (j) a_{j i}] b_{i} (O_{2}) i = 1, 2, \dots, N

$\delta_{2}(i)=\max _{1 \leq j<N}\left[\delta_{1}(j) a_{j i}\right] b_{i}\left(O_{2}\right) \quad i=1,2, \ldots, N$

\begin{array}{l} ψ_{2} (i) = \arg max_{1 ⩽ j ⩽ N} [δ_{1} (j) a_{j i}] \end{array}

$\begin{array}{l} \psi_{2}(i)=\arg \max _{1 \leqslant j \leqslant N}\left[\delta_{1}(j) a_{j i}\right] \end{array}$

\begin{array}{l} δ_{2}^{'} (i) & = max_{1 \leq j < N} [δ_{2}^{'} (j) a_{j i}] b_{i} (O_{2}) \\ = max_{1 \leq j < N} [δ_{1} (j) / max (δ_{t}) a_{j i}] b_{i} (O_{2}) \\ = max_{1 \leq j < N} [δ_{1} (j) a_{j i}] b_{i} (O_{2}) / max (δ_{1}) \\ = δ_{2} (i) / max (δ_{1}) i = 1, 2, \dots, N \end{array}

$\begin{array}{l} \delta_{2}'(i)&=\max _{1 \leq j<N}\left[\delta_{2}'(j) a_{j i}\right] b_{i}\left(O_{2}\right) \\ &=\max _{1 \leq j<N}\left[\delta_{1}(j)/\max(\boldsymbol{\delta_{t}}) a_{j i}\right] b_{i}\left(O_{2}\right)\\ &=\max _{1 \leq j<N}\left[\delta_{1}(j) a_{j i}\right] b_{i}\left(O_{2}\right)/\max(\boldsymbol{\delta_{1}})\\ &=\delta_{2}(i)/\max(\boldsymbol{\delta_{1}}) \quad i=1,2, \ldots, N \end{array}$

\begin{array}{l} ψ_{2}^{'} (i) & = \arg max_{1 ⩽ j ⩽ N} [δ_{1}^{'} (j) a_{j i}] \\ = \arg max_{1 ⩽ j ⩽ N} [δ_{1} (i) / max (δ_{1}) a_{j i}] \\ = \arg max_{1 ⩽ j ⩽ N} [δ_{1} (i) a_{j i}] \\ = ψ_{2} (i) \end{array}

$\begin{array}{l} \psi_2'(i)&=\arg \max _{1 \leqslant j \leqslant N}\left[\delta_{1}'(j) a_{j i}\right]\\ &=\arg \max _{1 \leqslant j \leqslant N}\left[\delta_1(i)/\max(\boldsymbol{\delta_1}) a_{j i}\right]\\ &=\arg \max _{1 \leqslant j \leqslant N}\left[\delta_1(i) a_{j i}\right]\\ &=\psi_2(i) \end{array}$

令

\begin{array}{l} a & = max (δ_{2}^{'}) \\ = max_{1 \leq i \leq N} [δ_{2} (i) / max (δ_{1})] \\ = max (δ_{2}) / m a x (δ_{1}) \end{array}

$\begin{array}{l} a &=\max(\boldsymbol{\delta_{2}'})\\ &=\max_{1\leq i\leq N} \left[ \delta_{2}(i)/\max(\boldsymbol{\delta_{1}})\right]\\ &=\max(\boldsymbol{\delta_{2}})/max(\boldsymbol{\delta_{1}}) \end{array}$

则

\begin{array}{l} δ_{2}^{'} (i) & = δ_{2}^{'} (i) / a \\ = {δ_{2} (i) / max (δ_{1})} / {max (δ_{2}) / m a x (δ_{1})} \\ = δ_{2} (i) / max (δ_{2}) \end{array}

$\begin{array}{l} \delta_{2}'(i)&=\delta_{2}'(i)/a\\ &=\left\{\delta_{2}(i)/\max(\boldsymbol{\delta_{1}})\right\}/\left\{\max(\boldsymbol{\delta_{2}})/max(\boldsymbol{\delta_{1}})\right\}\\ &=\delta_{2}(i)/\max(\boldsymbol{\delta_{2}}) \end{array}$

同理可递推得到以下结论

δ_{t}^{'} (i) = δ_{t} (i) / max (δ_{t}) i = 2, 3, \dots, N

$\delta_{t}'(i)=\delta_{t}(i)/\max(\boldsymbol{\delta_{t}}) \quad i=2,3, \ldots, N$

ψ_{t}^{'} (i) = ψ_{t} (i) i = 2, 3 \dots, N

$\psi_t'(i)=\psi_t(i) \quad i=2,3 \ldots, N$

终止条件

\begin{array}{l} P^{*^{'}} & = max_{1 ⩽ i ⩽ N} δ_{T}^{'} (i) \\ = max_{1 \leq i \leq N} [δ_{T} (i) / max (δ_{t})] \\ = max_{1 \leq i \leq N} [δ_{T} (i)] \\ = P^{*} \end{array}

$\begin{array}{l} P^{*'}&=\max _{1 \leqslant i \leqslant N} \delta_{T}'(i) \\ &= \max _{1 \leq i \leq N}\left[\delta_{T}(i)/\max(\boldsymbol{\delta_{t}})\right]\\ &= \max _{1 \leq i \leq N}\left[\delta_{T}(i)\right]\\ &=P^{*} \end{array}$

\begin{array}{l} i_{T}^{*^{'}} & = \arg max_{1 \leq i \leq N} [δ_{T}^{'} (i)] \\ = \arg max_{1 \leq i \leq N} [δ_{T} (i) / max (δ_{t})] \\ = \arg max_{1 \leq i \leq N} [δ_{T} (i)] \\ = i_{T}^{*} \end{array}

$\begin{array}{l} i_{T}^{*'}&=\arg \max _{1 \leq i \leq N}\left[\delta_{T}'(i)\right]\\ &=\arg \max _{1 \leq i \leq N}\left[\delta_{T}(i)/\max(\boldsymbol{\delta_{t}})\right]\\ &=\arg \max _{1 \leq i \leq N}\left[\delta_{T}(i)\right]\\ &=i_{T}^{*} \end{array}$

最优路径回溯.对于 $t=T-1, T-2, \cdots, 1$

\begin{array}{l} i_{t}^{*^{'}} & = ψ_{t + 1}^{'} (i_{t + 1}^{*^{'}}) \\ = ψ_{t + 1} (i_{t + 1}^{*}) \\ = i_{t}^{*} \end{array}

$\begin{array}{l} i_{t}^{*'}&=\psi_{t+1}'\left(i_{t+1}^{*'}\right)\\ &=\psi_{t+1}\left(i_{t+1}^{*}\right)\\ &=i_{t}^{*} \end{array}$

求得的最优路径也就是最可能的状态序列为:

\begin{array}{l} I^{*^{'}} & = (i_{1}^{*^{'}}, i_{2}^{*^{'}}, \dots, i_{T}^{*^{'}}) \\ = (i_{1}^{*}, i_{2}^{*}, \dots, i_{T}^{*}) \\ = I^{*} \end{array}

$\begin{array}{l} I^{*'}&=\left(i_{1}^{*'}, i_{2}^{*'}, \cdots, i_{T}^{*'}\right) \\ &=\left(i_{1}^{*}, i_{2}^{*}, \cdots, i_{T}^{*}\right)\\ &=I^{*} \end{array}$

得证。

近似算法

前向算法

计算初值

α_{1} (i) = π_{i} b_{i} (o_{1}), i = 1, 2, \dots, N

$\alpha_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \quad i=1,2, \cdots, N$

递推计算 $t+1$ 时刻，状态为 $q_{i}$ 的向前概率:

α_{t + 1} (i) = [\sum_{j = 1}^{N} α_{t} (j) a_{j i}] b_{i} (o_{t + 1}), i = 1, 2, \dots, N

$\alpha_{t+1}(i)=\left[\sum_{j=1}^{N} \alpha_{t}(j) a_{j i}\right] b_{i}\left(o_{t+1}\right), \quad i=1,2, \cdots, N$

后向算法

计算初值:

β_{T} (i) = 1, i = 1, 2, \dots, N

$\beta_{T}(i)=1, \quad i=1,2, \cdots, N$

β_{t} (i) = \sum_{j = 1}^{N} a_{i j} b_{j} (o_{t + 1}) β_{t + 1} (j), i = 1, 2, \dots, N

$\beta_{t}(i)=\sum_{j=1}^{N} a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j), \quad i=1,2, \cdots, N$

近似算法

γ_{t} (i) = \frac{α_{t} (i) β_{t} (i)}{P (O ∣ λ)} = \frac{α_{t} (i) β_{t} (i)}{\sum_{j = 1}^{N} α_{t} (j) β_{t} (j)}

$\gamma_{t}(i)=\frac{\alpha_{t}(i) \beta_{t}(i)}{P(O \mid \lambda)}=\frac{\alpha_{t}(i) \beta_{t}(i)}{\sum_{j=1}^{N} \alpha_{t}(j) \beta_{t}(j)}$

在每一时刻 $\mathrm{t}$ 最有可能的状态 $i_{t}^{*}$ 是:

i_{t}^{*} = \arg max_{1 ⩽ i ⩽ N} [γ_{t} (i)], t = 1, 2, \dots, T

$i_{t}^{*}=\arg \max _{1 \leqslant i \leqslant N}\left[\gamma_{t}(i)\right], \quad t=1,2, \cdots, T$

从而得到状态序列 $I^{*}$ :

I^{*} = (i_{1}^{*}, i_{2}^{*}, \dots, i_{T}^{*})

$I^{*}=\left(i_{1}^{*}, i_{2}^{*}, \cdots, i_{T}^{*}\right)$

与改进Viterbi算法类似，在计算前向算法的中间状态概率 $\alpha_t(i)$ 和后向算法的中间状态概率 $\beta_t(i)$ 时，对两个概率进行放大

\begin{array}{l} α_{t} (i) = α_{t} (i) / max (α_{t}) \\ β_{t} (i) = β_{t} (i) / max (β_{t}) \end{array}

$\begin{array}{l} \alpha_t(i)=\alpha_t(i)/\max(\boldsymbol{\alpha_t})\\ \beta_t(i)=\beta_t(i)/\max(\boldsymbol{\beta_t}) \end{array}$

则改进近似算法中的前向和后向算法的计算流程如下：

前向算法

计算初值

α_{1} (i) = π_{i} b_{i} (o_{1}), i = 1, 2, \dots, N

$\alpha_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \quad i=1,2, \cdots, N$

α_{1} (i) = α_{1} (i) / max (α_{1})

$\alpha_1(i)=\alpha_1(i)/\max(\boldsymbol{\alpha_1})$

向前递推

α_{t + 1} (i) = [\sum_{j = 1}^{N} α_{t} (j) a_{j i}] b_{i} (o_{t + 1}), i = 1, 2, \dots, N

$\alpha_{t+1}(i)=\left[\sum_{j=1}^{N} \alpha_{t}(j) a_{j i}\right] b_{i}\left(o_{t+1}\right), \quad i=1,2, \cdots, N$

α_{t + 1} (i) = α_{t + 1} (i) / max (α_{t + 1})

$\alpha_{t+1}(i)=\alpha_{t+1}(i)/\max(\boldsymbol{\alpha_{t+1}})$

后向算法

计算初值:

β_{T} (i) = 1, i = 1, 2, \dots, N

$\beta_{T}(i)=1, \quad i=1,2, \cdots, N$

β_{T} (i) = β_{T} (i) / max (β_{T})

$\beta_T(i)=\beta_T(i)/\max(\boldsymbol{\beta_T})$

向后递推

β_{t} (i) = \sum_{j = 1}^{N} a_{i j} b_{j} (o_{t + 1}) β_{t + 1} (j), i = 1, 2, \dots, N

$\beta_{t}(i)=\sum_{j=1}^{N} a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j), \quad i=1,2, \cdots, N$

β_{t} (i) = β_{t} (i) / max (β_{t})

$\beta_t(i)=\beta_t(i)/\max(\boldsymbol{\beta_t})$

近似算法

γ_{t} (i) = \frac{α_{t} (i) β_{t} (i)}{P (O ∣ λ)} = \frac{α_{t} (i) β_{t} (i)}{\sum_{j = 1}^{N} α_{t} (j) β_{t} (j)}

$\gamma_{t}(i)=\frac{\alpha_{t}(i) \beta_{t}(i)}{P(O \mid \lambda)}=\frac{\alpha_{t}(i) \beta_{t}(i)}{\sum_{j=1}^{N} \alpha_{t}(j) \beta_{t}(j)}$

在每一时刻 $\mathrm{t}$ 最有可能的状态 $i_{t}^{*}$ 是:

i_{t}^{*} = \arg max_{1 ⩽ i ⩽ N} [γ_{t} (i)], t = 1, 2, \dots, T

$i_{t}^{*}=\arg \max _{1 \leqslant i \leqslant N}\left[\gamma_{t}(i)\right], \quad t=1,2, \cdots, T$

从而得到状态序列 $I^{*}$ :

I^{*} = (i_{1}^{*}, i_{2}^{*}, \dots, i_{T}^{*})

$I^{*}=\left(i_{1}^{*}, i_{2}^{*}, \cdots, i_{T}^{*}\right)$

改进近似算法得到的状态序列与原始算法相同

证明：

设原算法中前向算法和后向算法的中间状态概率分别为 $\alpha,\beta$ ，改进近似算法中前向算法和后向算法的中间状态概率分别为 $\alpha',\beta'$

前向算法

$t=1$ 时

α_{1} (i) = π_{i} b_{i} (o_{1}), i = 1, 2, \dots, N

$\alpha_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \quad i=1,2, \cdots, N$

α_{1}^{'} (i) = α_{1} (i) / max (α_{1}) i = 1, 2, \dots, N

$\alpha_1'(i)=\alpha_1(i)/\max(\boldsymbol{\alpha_1}) \quad i=1,2, \cdots, N$

$t=2$ 时

α_{2} (i) = [\sum_{j = 1}^{N} α_{1} (j) a_{j i}] b_{i} (o_{2}), i = 1, 2, \dots, N

$\alpha_{2}(i)=\left[\sum_{j=1}^{N} \alpha_{1}(j) a_{j i}\right] b_{i}\left(o_{2}\right), \quad i=1,2, \cdots, N$

\begin{array}{l} α_{2}^{'} (i) & = [\sum_{j = 1}^{N} α_{1}^{'} (j) a_{j i}] b_{i} (o_{2}) \\ = [\sum_{j = 1}^{N} α_{1} (i) / max (α_{1}) a_{j i}] b_{i} (o_{2}) \\ = [\sum_{j = 1}^{N} α_{1} (i) a_{j i}] b_{i} (o_{2}) / max (α_{1}) \\ = α_{2} (i) / max (α_{1}) i = 1, 2, \dots, N \end{array}

$\begin{array}{l} \alpha_{2}'(i)&=\left[\sum_{j=1}^{N} \alpha_{1}'(j) a_{j i}\right] b_{i}\left(o_{2}\right)\\ &=\left[\sum_{j=1}^{N} \alpha_1(i)/\max(\boldsymbol{\alpha_1}) a_{j i}\right] b_{i}\left(o_{2}\right)\\ &=\left[\sum_{j=1}^{N} \alpha_1(i) a_{j i}\right] b_{i}\left(o_{2}\right)/\max(\boldsymbol{\alpha_1})\\ &=\alpha_2(i)/\max(\boldsymbol{\alpha_1})\quad i=1,2, \cdots, N \end{array}$

令

\begin{array}{l} a & = max (α_{2}^{'}) \\ = max_{1 \leq i \leq N} [α_{2} (i) / max (α_{1})] \\ = max (α_{2}) / m a x (α_{1}) \end{array}

$\begin{array}{l} a &=\max(\boldsymbol{\alpha_{2}'})\\ &=\max_{1\leq i\leq N} \left[ \alpha_{2}(i)/\max(\boldsymbol{\alpha_{1}})\right]\\ &=\max(\boldsymbol{\alpha_{2}})/max(\boldsymbol{\alpha_{1}}) \end{array}$

则

\begin{array}{l} α_{2}^{'} (i) & = α_{2}^{'} (i) / a \\ = {α_{2} (i) / max (α_{1})} / {max (α_{2}) / m a x (α_{1})} \\ = α_{2} (i) / max (α_{2}) \end{array}

$\begin{array}{l} \alpha_{2}'(i)&=\alpha_{2}'(i)/a\\ &=\left\{\alpha_2(i)/\max(\boldsymbol{\alpha_1})\right\}/\left\{\max(\boldsymbol{\alpha_{2}})/max(\boldsymbol{\alpha_{1}})\right\}\\ &=\alpha_2(i)/\max(\boldsymbol{\alpha_{2}}) \end{array}$

递推可得

α_{t}^{'} (i) = α_{t} (i) / max (α_{t}) t = 2, 3, \dots T

$\alpha_{t}'(i)=\alpha_t(i)/\max(\boldsymbol{\alpha_{t}}) \quad t=2,3,\cdots T$

后向算法

$t=T$ 时

β_{T} (i) = 1 i = 1, 2, \dots, N

$\beta_{T}(i)=1 \quad i=1,2, \cdots, N$

β_{T}^{'} (i) = β_{T} (i) / max (β_{T}) i = 1, 2, \dots, N

$\beta_T'(i)=\beta_T(i)/\max(\boldsymbol{\beta_T}) \quad i=1,2, \cdots, N$

$t=T-1$ 时

β_{T - 1} (i) = \sum_{j = 1}^{N} a_{i j} b_{j} (o_{T}) β_{T} (j), i = 1, 2, \dots, N

$\beta_{T-1}(i)=\sum_{j=1}^{N} a_{i j} b_{j}\left(o_{T}\right) \beta_{T}(j), \quad i=1,2, \cdots, N$

\begin{array}{l} β_{T - 1}^{'} (i) & = \sum_{j = 1}^{N} a_{i j} b_{j} (O_{T}) β_{T}^{'} (j) \\ = \sum_{j = 1}^{N} a_{i j} b_{j} (O_{T}) β_{T} (i) / max (β_{T}) \\ = β_{T - 1}^{'} (i) / max (β_{T}) i = 1, 2, \dots, N \end{array}

$\begin{array}{l} \beta_{T-1}'(i)&=\sum_{j=1}^{N} a_{i j} b_{j}\left(O_{T}\right) \beta_{T}'(j)\\ &=\sum_{j=1}^{N} a_{i j} b_{j}\left(O_{T}\right)\beta_T(i)/\max(\boldsymbol{\beta_T})\\ &=\beta_{T-1}'(i)/\max(\boldsymbol{\beta_T})\quad i=1,2, \cdots, N \end{array}$

令

\begin{array}{l} a & = max (β_{T - 1}^{'}) \\ = max_{1 \leq i \leq N} [β_{T - 1} (i) / max (β_{T})] \\ = max (β_{T - 1}) / m a x (β_{T}) \end{array}

$\begin{array}{l} a &=\max(\boldsymbol{\beta_{T-1}'})\\ &=\max_{1\leq i\leq N} \left[ \beta_{T-1}(i)/\max(\boldsymbol{\beta_{T}})\right]\\ &=\max(\boldsymbol{\beta_{T-1}})/max(\boldsymbol{\beta_{T}}) \end{array}$

则

\begin{array}{l} β_{T - 1}^{'} (i) & = β_{T - 1}^{'} (i) / a \\ = {β_{T - 1} (i) / max (β_{T})} / {max (β_{T - 1}) / m a x (β_{T})} \\ = β_{T - 1} (i) / max (β_{T - 1}) \end{array}

$\begin{array}{l} \beta_{T-1}'(i)&=\beta_{T-1}'(i)/a\\ &=\left\{\beta_{T-1}(i)/\max(\boldsymbol{\beta_T})\right\}/\left\{\max(\boldsymbol{\beta_{T-1}})/max(\boldsymbol{\beta_{T}})\right\}\\ &=\beta_{T-1}(i)/\max(\boldsymbol{\beta_{T-1}}) \end{array}$

递推可得

β_{t}^{'} (i) = β_{t} (i) / max (β_{t}) t = 1, 2, \dots T - 1

$\beta_{t}'(i)=\beta_t(i)/\max(\boldsymbol{\beta_{t}}) \quad t=1,2,\cdots T-1$

改进近似算法

\begin{array}{l} γ_{t}^{'} (i) & = \frac{α_{t}^{'} (i) β_{t}^{'} (i)}{\sum_{j = 1}^{N} α_{t}^{'} (j) β_{t}^{'} (j)} \\ = \frac{α_{t} (i) β_{t} (i) / {max (α_{t}) max (β_{t})}}{\sum_{j = 1}^{N} α_{t} (j) β_{t} (j) / {max (α_{t}) max (β_{t})}} \\ = \frac{α_{t} (i) β_{t} (i)}{\sum_{j = 1}^{N} α_{t} (j) β_{t} (j)} \\ = γ_{t} (i) i = 1, 2, \dots, N \end{array}

$\begin{array}{l} \gamma_{t}'(i)&=\frac{\alpha_{t}'(i) \beta_{t}'(i)}{\sum_{j=1}^{N} \alpha_{t}'(j) \beta_{t}'(j)}\\ &=\frac{\alpha_t(i)\beta_t(i)/\left\{\max(\boldsymbol{\alpha_{t}})\max(\boldsymbol{\beta_{t}})\right\}}{\sum_{j=1}^{N} \alpha_t(j)\beta_t(j)/\left\{\max(\boldsymbol{\alpha_{t}})\max(\boldsymbol{\beta_{t}})\right\}}\\ &=\frac{\alpha_{t}(i) \beta_{t}(i)}{\sum_{j=1}^{N} \alpha_{t}(j) \beta_{t}(j)}\\ &=\gamma_{t}(i) \quad i=1,2,\cdots,N \end{array}$

在每一时刻 $\mathrm{t}$ 最有可能的状态 $i_{t}^{*}$ 是:

\begin{array}{l} i_{t}^{*^{'}} & = \arg max_{1 ⩽ i ⩽ N} [γ_{t}^{'} (i)] \\ = \arg max_{1 ⩽ i ⩽ N} [γ_{t} (i)] \\ = i_{t}^{*} t = 1, 2, \dots, T \end{array}

$\begin{array}{l} i_{t}^{*'}&=\arg \max _{1 \leqslant i \leqslant N}\left[\gamma_{t}'(i)\right]\\ &=\arg \max _{1 \leqslant i \leqslant N}\left[\gamma_{t}(i)\right]\\ &=i_{t}^{*}\quad t=1,2, \cdots, T \end{array}$

从而得到状态序列 $I^{*'}$ :

I^{*^{'}} = I^{*} = (i_{1}^{*}, i_{2}^{*}, \dots, i_{T}^{*})

$I^{*'}=I^{*}=\left(i_{1}^{*}, i_{2}^{*}, \cdots, i_{T}^{*}\right)$

得证。

posted @ 2022-05-21 11:21 久漫阅读(172) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· java刷代码随想录

· 旅行商问题的两种经典求解方法

· 基于维特比算法的概率路径

· test1

· 维特比算法

公告

昵称：久漫
园龄： 3年6个月
粉丝： 1
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

久漫

维特比(Viterbi)算法，近似算法序列过长导致出现0概率而使程序运行失败的处理方法

原始Viterbi算法

改进Viterbi算法

证明：

近似算法

前向算法

后向算法

近似算法

前向算法

后向算法

近似算法

证明：

前向算法

后向算法

改进近似算法

公告

最新随笔

随笔分类

随笔档案

阅读排行榜