steps/align_si.sh

usage: steps/align_si.sh <data-dir> <lang-dir> <src-dir> <align-dir>

e.g.: steps/align_si.sh data/train data/lang exp/tri1 exp/tri1_ali

   

对特征进行若干变换

调整模型的静音音素权重

根据词-词标识符映射表(words.txt),将标注转换为词标识符的序列:

tra="ark:utils/sym2int.pl --map-oov $oov -f 2- $lang/words.txt $sdata/JOB/text|";

   

构建训练图(transition model,转移模型)

H:$dir/final.mdl的转移模型部分;

C:$dir/tree;

L:$lang/L.fst;

G:"$tra";

训练图的输入是GMM的标识符序列,输出是词的标识符序列。

   

GMM-HMMfinal.mdl包含转移模型与状态模型(其概率密度函数为混合高斯模型)。

   

强制对齐(Force Align

HCLG+GMM中对特征进行维特比搜索,得到最优结果,即Alignment(对齐) $dir/ali.JOB.gz

   

HCLG+GMM的输入是特征序列,输出是词的标识符序列。

posted @ 2018-06-07 20:39  JarvanWang  阅读(1312)  评论(0编辑  收藏  举报