vikyao

2017年5月6日

摘要：本文主要对基于GMM/HMMs的传统语音识别系统做一个整体介绍。 Outline: 1. 识别原理 2. 统计学模型 3. 系统框架首先需要说明本文讨论的对象是连续语音识别（Continuous Speech Recognition, CSR），意味着基于 DTW （动态时间规整）的孤立词识阅读全文

posted @ 2017-05-06 20:26 vikyao 阅读(3677) 评论(0) 推荐(0)

2017年4月23日

2-GMM-HMMs语音识别系统-训练篇

摘要：本文记录在传统的语音识别中，训练GMM-HMMs声学模型过程中的公式推导过程。OutlineGMM - 混合高斯模型HMM – 隐马尔科夫模型Forward-Backward Algorithm – 前向后向算法首先假设这里的训练数据，都做好了音素层面标记的（Label），即utt... 阅读全文

posted @ 2017-04-23 20:04 vikyao 阅读(2568) 评论(0) 推荐(0)

3-GMM-HMMs语音识别系统-解码篇

摘要：本文主要描述基于GMM-HMMs传统语音识别的解码过程。Outline：Viterbi decodingCross-word decodingBeam search1.Viterbi decoding语音识别就是一个解码/搜索的过程。即由X=xT1=x1x2,⋯,xt,⋯,xt，找... 阅读全文

posted @ 2017-04-23 10:11 vikyao 阅读(1548) 评论(0) 推荐(0)

2017年4月21日

5-基于决策树的状态绑定

摘要：本文会讨论关于context-dependent model的优化——基于决策树的状态绑定（Tree-based state tying）。Outline：Context-dependent modelTree-based state tying1. Context-depende... 阅读全文

posted @ 2017-04-21 10:05 vikyao 阅读(1224) 评论(0) 推荐(0)

2017年4月19日

4-Embedded Training

摘要：在《GMM-HMMs语音识别系统-训练篇》中，默认的训练数据都是进行了手工音素标记的。然而手工分段的数据非常昂贵，400倍于数据时间（1小时的语音，需要400小时的标记时间），同时手工标记时很难找准音素边界。实际上，语音识别系统在训练每个phone HMM时，是嵌入到整个句子（对... 阅读全文

posted @ 2017-04-19 13:16 vikyao 阅读(551) 评论(0) 推荐(0)

2017年4月10日

GTX1050 Ti(notebooks)+Ubuntu16.04上安装Cuda8.0

摘要：本文主要总结了我在笔记本电脑上安装cuda8.0的过程和经验。配置清单硬件：惠普笔记本（GTX1050 ti）系统：Ubuntu1 16.04.01 64位常见安装方法： .run包（本地）、.deb包（本地）、deb（在线）、集群（本地）。建议：采用第一种方式。.run包里已经... 阅读全文

posted @ 2017-04-10 20:34 vikyao 阅读(556) 评论(0) 推荐(0)

公告