Sphinx语音识别学习记录（一）-基本运行测试

CMUSphinx系列目录

http://www.cnblogs.com/yin52133/archive/2012/06/21/2557219.html - （一）基本运行测试

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587282.html - （二）自然语言处理原理研究

http://www.cnblogs.com/yin52133/archive/2012/07/12/2587419.html - （三）小范围语音英文识别

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588201.html - （四）小范围语音中文识别

http://www.cnblogs.com/yin52133/archive/2012/06/22/2558806.html - （五）错误调试

http://www.cnblogs.com/yin52133/archive/2012/07/12/2588418.html - （六）我的目标和几个想像的方案（闲置中）

这一阵子因为个人的某个需求开始研究语音识别

找了一阵子之后决定选择研究下cmusphinx

下面是官方的介绍

http://cmusphinx.sourceforge.net/wiki/

现在网上相关资料基本只有官方的帮助文档和下面的Sphinx武林秘籍了

http://www.cnblogs.com/huanghuang/archive/2011/07/14/2106579.html

运行版本为

pocketsphinx 0.7

sphinxbase 0.7

先可以尝试跟上面的武林秘籍里的一样，跑起样例项目pocketsphinx_continuous

这个有助于抓住基本使用方式和脉路

pocketsphinx_continuous 跟武林秘籍一样输入两套参数的话我这里会报错、会表示我没指定声学模型

我是添加了这个参数、使用自带的模型算法

-hmm

hub4wsj_sc_8k

然后就是几个参数的意义

hmm Hidden Markov Model隐马尔可夫模型模型训练算法
lm language model
dict 字典、这几种东西以前没搞过语音识别、完全不懂、从头开始查资料学习的

command.txt

stop
music
computer
dump
close

用这个文本使用lmtool创建了语言模型和字典

7721.lm 7721.dic

pocketsphinx_continuous -hmm hub4wsj_sc_8k -lm 7721.lm -dict 7721.dic

中间运行到这

Allocating 32 buffers of 2500 samples each
READY....

Listening...

这里你就用麦克风说话、他就帮你识别是什么。。。空白时间间隔在1s时会停止录音

下面这种是识别出来的结果

000000000: STOP (-6531224)

我使用的自带的 hub4wsj_sc_8k 这个模型、不知道是口音问题还是基础的模型问题、句子稍长点就老多识别出来好几个dump

（该问题后面已找到问题并解决）

posted @ 2012-06-21 10:27 某yin 阅读(7073) 评论(2) 编辑收藏举报

刷新页面返回顶部

Sphinx语音识别学习记录 （一）-基本运行测试

公告

Sphinx语音识别学习记录（一）-基本运行测试