随笔 - 997 文章 - 5 评论 - 181 阅读 - 300万

孤立词识别的几种有效方案

（1）采用动态规划（Dynamic Programming）的方法。这是一种运算量较大，但技术上较简单，正识率也较高的方法。其中的失真测度可以用欧氏距离(适于短时谱或倒谱参数)，也可以用对数似然比距离(适于LPC参数)．决策方法可用最近邻域准则．

（2）采用矢量量化（Vector　Quantization）的方法．它既可用于语音通信中的波形或参数的压缩，也可用于语音识别．尤其有限状态矢量量化(FSVQJ）方法，对于语音识别更为有效。决策方法一般用最小平均失真准则。

（3）采用隐马尔柯夫模型(HMM)的方法，该模型的参数既可以用离散概率分布函数，也可以用最新的连续概率密度函数(如：正态高斯密度，高斯自回归密度等）。决策方法则用最大后验概率准则．

（4）采用混合技术的方法。例如：用矢量量化作为第一级识别(作为预处理，从而得出若干候选的识别结果），然后，再用DTW或HMM方法做最后的识别，因此，可有VQ（矢量化）/DTW和VQ/HMM等识别方法．

　　目前,语音识别的匹配主要应用HMM和DTW两种算法。DTW算法由于没有一个有效地用统计方法进行训练的框架,也不容易将低层和顶层的各种知识用到语音识别算法中,因此在解决大词汇量、连续语音、非特定人语音识别问题时较之HMM算法相形见绌。HMM是一种用参数表示的,用于描述随机过程统计特性的概率模型。而对于孤立词识别,HMM算法和DTW算法在相同条件下,识别效果相差不大, 又由于DTW算法本身既简单又有效,但HMM算法要复杂得多。它需要在训练阶段提供大量的语音数据,通过反复计算才能得到参数模型,而DTW算法的训练中几乎不需要额外的计算。鉴于此,DTW更适合本系统的要求。

参考文档：

１　https://baike.baidu.com/item/dtw/3219286?fr=aladdin