语音识别概述
后验概率最大,即为判别结果
HTK Hvite解码器 Sphinx解码器 TODE解码器,生硬,修改繁琐。
WFST 扩充,简单高效。
有限状态机模型被用于大词汇量连续中文语音识别系统中。
其操作思路是将传统语音识别系统中的数学模型,分别转换成有限状态机模型,再将转换后的模型进行有效地整合及优化,得到搜索空间。
有限状态自动机(Finite-state Automata,FSA)
用点表示状态,带箭头的方向线段表示转移,转移上的字符为输入字元;用加粗圆圈表示初始状态,双线圆圈表示终止状态
节点 (Node) 即状态 (state)
由字元所构成的有限长度词序列成为字串
将两个字串连接在一起的操作称为连接运算例:𝑎 · 𝑏 = 𝑐 表示在字串 a 后面连接上字串 b 形成字串 c
一个字串不包含任何字元,则称为空字串
加权有限状态转换器(WFST)是有限状态机的一种特殊形式
合并前
合并后
隐马尔可夫模型
参考文献:基于WFST的中文语音识别解码器的研究