心胸决定格局，眼界决定境界...

语音识别概述

后验概率最大，即为判别结果

HTK Hvite解码器 Sphinx解码器 TODE解码器，生硬，修改繁琐。

WFST 扩充，简单高效。

有限状态机模型被用于大词汇量连续中文语音识别系统中。

其操作思路是将传统语音识别系统中的数学模型，分别转换成有限状态机模型，再将转换后的模型进行有效地整合及优化，得到搜索空间。

有限状态自动机（Finite-state Automata，FSA）

用点表示状态，带箭头的方向线段表示转移，转移上的字符为输入字元；用加粗圆圈表示初始状态，双线圆圈表示终止状态

节点（Node）即状态（state）

由字元所构成的有限长度词序列成为字串

将两个字串连接在一起的操作称为连接运算例：𝑎 · 𝑏 = 𝑐 表示在字串 a 后面连接上字串 b 形成字串 c

一个字串不包含任何字元，则称为空字串

加权有限状态转换器（WFST）是有限状态机的一种特殊形式

合并前

合并后

　　　　　　　　　　　　隐马尔可夫模型

　　　　　　　　

参考文献：基于WFST的中文语音识别解码器的研究

posted @ 2017-09-07 15:40 WELEN 阅读(2740) 评论(0) 收藏举报

刷新页面返回顶部