答辩前新增毕业设计日志
2010/5/4 开始尝试最后一次中文训练,录音转成了mono,ownR文件夹是新训练出来的model。明天尝试用用这个model行不行。
2010/5/8 在Mandarin工程中成功运用了训练的中文模型,但是5和8的发音识别率太低了,应该再增加训练语音库试试。备份Mandarin到Mandarin100508,然后开始看怎样把application转到applet。然后再增加训练语音库,下次记得产生jar包的时候,从干净的Sphinx包生成。要不然产生的jar包会包含所有的历史记录。
那个每次新获取数据时,导致程序crush的异常是由第二次执行到targetDataLine.open(audioFormat);抛出,我把capture里面的主体代码(包含以上代码),放到程序初始化的时候执行一遍,不会第二次执行以上程序,问题回避了。目前看上去程序没有什么问题。
忘了以前记录的sphinx对语音的要求是什么了,希望没有问题。
现在还需加入结果的反馈label。
然后把好的applet和gae连起来,然后弄成中文。
然后给applet数字签名调试。
2010/5/9 00:24
结果的反馈label搞定,local的applet和gae连了起来。Applet0508备份到Applet0508backup0509.rar。
睡觉。起床后把中文加入(Mandarin和GAEWave0123的合并),然后给applet数字签名传到网站上,然后再采样更多的语音进行训练,增强系统的强壮性。
有个奇怪的问题,我看文档上说Sphinx4认BigEndian的数据,为什么我Microphone设的是SmallEndian的数据也可以呢?
成功连接GAEWave0509和Applet0508,接下来就是applet进行数字签名放到GAE包中。和增加训练语音。
GAEWave0509工程成功。备份
2010/5/12 申请了http://speechcloud.appspot.com/,准备最后deploy到这个域名上。
2010/5/15 重新弄了一遍语音,增加了我和静静的各三套1-10的语音,但竟然训练出来呢的模型不能识别8
从speechcloud.appspot.com下载下来的applet总是在很短的时间就timeout, 但相同的applet代码,从eclipse中启动,连到sppechcloud就能等待直到结果返回,查询URLConnection类发现只要readTimeout时间为0就是无限制的等待直到服务器端返回结果。我的applet中是0。后来我尝试了了setReadTimeout为30000毫秒,试试看会不会有变动。从理论上讲是没什么不一样的。如果还不行,尝试把setReadTimeout的命令往前提一点执行。现在网络有问题,我eclipse中的工程不能deploy到speechcloud上。再试一下,不行就明天再试了。
一切OK。