摘要: 本文主要对基于GMM/HMMs的传统语音识别系统做一个整体介绍。 Outline: 1. 识别原理 2. 统计学模型 3. 系统框架 首先需要说明本文讨论的对象是 连续语音识别 (Continuous Speech Recognition, CSR),意味着基于 DTW (动态时间规整)的 孤立词识 阅读全文
posted @ 2017-05-06 20:26 vikyao 阅读(3427) 评论(0) 推荐(0) 编辑
摘要: 本文记录在传统的语音识别中,训练GMM-HMMs声学模型过程中的公式推导过程。OutlineGMM - 混合高斯模型HMM – 隐马尔科夫模型Forward-Backward Algorithm – 前向后向算法首先假设这里的训练数据,都做好了音素层面标记的(Label),即utt... 阅读全文
posted @ 2017-04-23 20:04 vikyao 阅读(2463) 评论(0) 推荐(0) 编辑
摘要: 本文主要描述基于GMM-HMMs传统语音识别的解码过程。Outline:Viterbi decodingCross-word decodingBeam search1.Viterbi decoding语音识别就是一个解码/搜索的过程。即由X=xT1=x1x2,⋯,xt,⋯,xt,找... 阅读全文
posted @ 2017-04-23 10:11 vikyao 阅读(1478) 评论(0) 推荐(0) 编辑
摘要: 本文会讨论关于context-dependent model的优化——基于决策树的状态绑定(Tree-based state tying)。Outline:Context-dependent modelTree-based state tying1. Context-depende... 阅读全文
posted @ 2017-04-21 10:05 vikyao 阅读(1181) 评论(0) 推荐(0) 编辑
摘要: 在《GMM-HMMs语音识别系统-训练篇》中,默认的训练数据都是进行了手工音素标记的。然而手工分段的数据非常昂贵,400倍于数据时间 (1小时的语音,需要400小时的标记时间),同时手工标记时很难找准音素边界。实际上,语音识别系统在训练每个phone HMM时,是嵌入到整个句子(对... 阅读全文
posted @ 2017-04-19 13:16 vikyao 阅读(529) 评论(0) 推荐(0) 编辑
摘要: 本文主要总结了我在笔记本电脑上安装cuda8.0的过程和经验。配置清单硬件:惠普笔记本(GTX1050 ti)系统:Ubuntu1 16.04.01 64位常见安装方法: .run包(本地)、.deb包(本地)、deb(在线)、集群(本地)。 建议:采用第一种方式。.run包里已经... 阅读全文
posted @ 2017-04-10 20:34 vikyao 阅读(505) 评论(0) 推荐(0) 编辑