AIBigKaldi（七）| Kaldi的解码图构造（上）（源码解析）

本文来自公众号“AI大道理”。

上篇训练完了单音子模型。
不管模型好坏先进行解码试试效果。
解码之前首先要构建解码图，即HCLG.fst。

（本篇主要解析kaldi源码实现，详细算法原理请阅读

AI大语音（十二）——WFST解码器（下）（深度解析））

1 解码图构造

4 mkgraph.sh

源码解析：

Usage: utils/mkgraph.sh [options] <lang-dir> <model-dir> <graphdir>

过程之道：

2 LoG = LG

4.1 LoG = LG
L.fst即Lexicon词典构造的WFST。

上面的小词典可以构造出下图：

G.fst即语言模型构造的WFST。
3-gram语言模型

可以构造出下图

LG.fst

LoG = LG是由这几个命令完成的：
fsttablecompos，fstdeterminizestar，fstminimizeencoded，fstpushspecial，fstisstochastic。

4.1.1 fsttablecompose（合成算法）

功能：
将L.fst与G.fst合成LG.fst。
fsttablecompose与fstcompose类似，但是速度更快。
源码解析：

过程之道：

函数解析：
TableCompose（）
真正进行compose操作的函数，因最后一个参数的不同分两种TableCompose（）。

4.1.2 fstdeterminizestar（确定化算法）
功能：
对LG.fst进行去除ε和确定化操作。
stdeterminizestar与fstdeterminize类似，但其中包含空转移去除处理。
源码解析：

过程之道：

函数解析：
DeterminizeStarInLog()
DeterminizeStar()
DeterminizeStarInLog确定log半环中的“fst”，使用DeterminizeStar算法，同时也进行对epsilons的删除。
DeterminizeStarInLog()内部调用了 DeterminizeStar()。
DeterminizeStar()才是真正操作的函数。

4.1.3 fstminimizeencoded（最小化算法）
功能：
对LG.fst进行最小化操作。
在编码后最小化FST[类似于fstminimize，但没有进行权重推移]
源码解析：

过程之道：

函数解析：
MinimizeEncoded(fst, delta)
真正做最小化操作的函数。
编码后最小化；适用于所有FST。它就像从Minimize（）函数中得到的一样，只是它不会推动权重或符号。

4.1.4 fstpushspecial（权重推移）
功能：
权重推移

源码解析：

过程之道：

函数解析：
PushSpecial(fst, delta)
真正进行权重推移的函数。
这个函数在对数半环中进行重量推送，但是以一种特殊的方式，使得任何推后的“剩余权重”都均匀地分布在FST上，并且不会在开始或结束时结束。推送权重使得每个状态的总权重（即弧概率加上最终概率之和）对于所有状态都是相同的。

4.1.5 fstisstochastic（随机性检测）
stochastic性质：
一个WFST从任意状态出发的跳转的权重之⨁ 运算为1。
在符合stochastic性质的WFST上解码，解码效率较高。

功能：

检查FST是否是随机的，如果是，则成功退出。打印出最大误差（以日志单位为单位）

源码解析：

过程之道：

函数解析：
IsStochasticFstInLog(*fst, delta, &min, &max)内部经过一些处理之后调用了
IsStochasticFst(*fst, delta, &min, &max)。
检验热带FST在对数半环上是否是随机的。（强制转换并执行检查。）此函数处理通用的fst。

3 LGoC = CLG

4.2 LGoC = CLG
LG.fst

C.fst即context dependent，上下文相关三音子构造的FST，没有权重，只有映射。