应用HTK搭建语音拨号系统4: 识别器评估
选自:http://maotong.blog.hexun.com/6261890_d.html
苏统华
哈尔滨工业大学人工智能研究室
2006年10月30日
声明:版权所有,转载请注明作者和来源
该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。
4. 识别器评估
[step 11]验证测试结果
用Viterbi算法进行识别已经在前文又多处涉及,这里轻松了,执行如下命令:
HVite -C .\config\config2 -H .\hmms\hmm15\macros -H .\hmms\hmm15\hmmdefs -S test.scp -l * -i .\results\recout_step11.mlf -w wdnet -p 0.0 -s 5.0 .\dict\dict4 .\lists\tiedlist
其中的config2(前文已经提到过)在config基础上加入FORCECXTEXP=T,ALLOWXWRDEXP=F。进行识别验证:
HResults -I .\labels\testwords.mlf .\lists\tiedlist .\results\recout_step11.mlf
所得结果如下:
====================== HTK Results Analysis ======================= Date: Tue Oct 31 10:06:53 2006 Ref : .\labels\testwords.mlf Rec : .\results\recout_step11.mlf ------------------------ Overall Results -------------------------- SENT: %Correct=93.33 [H=14, S=1, N=15] WORD: %Corr=100.00, Acc=98.53 [H=68, D=0, S=0, I=1, N=68] ============================================================== |