问题总结:
1、录音,HSLab程序特别容易死机,且每次只能连录两个文件,第三个就开始覆盖了,程序貌似有bug
2、声学分析时候,产生mfcc
其中config文件写的不规范,导致一些错误,后来成功产生了20个mfcc文件
3、初始化,HInit –A –D –T 1 –S trainlist_yes.txt –M model/hmm0 –H model/proto/hmm_yes.hmm不能少)(修改很多)
4、命令中大小写有很大影响
5、在创建字典时候:
YES [yes] yes
NO [no] no
START_SIL [sil] sil
END_SIL [sil] sil
6、初始化时候:
HInit -A -D –T 1 -S trainlist.txt -M model/hmm0 \
-H model/proto/hmmfile –l(要大些L,否则有错误,后来小写也行,还是小写吧)label -L label_dir nameofhmm
注:中间要有空格,结尾要空格,最后一行要回车
7、算出的三个vFloors文件里面内容完全一样,故只算一个即可
8、vFloors
要自己在文件的头加上下面的代码:
问题自己解决了,呵呵
vFloors文件要符合HMM的格式,所以在vFloors文件的开头要自己添加
~o
<VECSIZE> 39
<MFCC_0_D_A>
...
方可编译成功
实验结果:识别的都是yes,不知道哪地方出现问题了,
猜想1:标注错误,应该要连续
且后来发现,lab文件里的内容有问题
连续录音导致的
教训,每搞一次,quit一次,检查lab文件一次
问题解决,猜想正确,就是这个原因!!!
结果:识别率100%
至此,其实已经对孤立词识别搭建了一个完整的平台!!!