摘要:
变调和变速原理自然语音的产生可以简化为图2-1模型,激励源出来的声门波信号与声道模型进行卷积,最后通过嘴唇辐射模型产生语音。其中,激励源决定说话人的基频的大小,即音调的高低。声道模型反映“润色”的频谱信息,具体的讲,共振峰决定了语义信息,谐波分布决定了音色,单位时间的音节数决定了语速。图2-1 语音... 阅读全文
摘要:
TIMIT语音库有着准确的音素标注,因此可以应用于语音分割性能评价,同时该数据库又含有几百个说话人语音,所以也是评价说话人识别常用的权威语音库,但该语音库的商业用途是要花钱买的。下面的资源来自与MIT教学实验使用,大概有430多M。下载地址:http://web.mit.edu/course/6/6... 阅读全文
摘要:
选自:http://my.oschina.net/jamesju/blog/1161511前言最近一直在研究HTK语音识别工具包,前几天完成了工具包的安装编译和测试,这几天又按耐不住好奇,决定自己动手搞一搞,尝试一下用这个工具包,进行简单的孤立词识别,看了几天的文档,做了各种尝试,总算跌跌撞撞的实现... 阅读全文
摘要:
http://pan.baidu.com/s/1o6BdE5c 阅读全文
摘要:
http://pan.baidu.com/s/1o6BdE5c 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6267266_d.html压缩包包括全部的配置文件,脚本文件,必备的模型文件和实验手册。全部实验材料的下载链接:1http://su.tonghua.googlepages.com/voicedialsystem.zip2http:... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6261890_d.html苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6261873_d.html苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6204849_d.html苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6204849_d.html应用HTK搭建语音拨号系统--数据准备苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word... 阅读全文
摘要:
选自:http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html 这个是重点,呵呵,本部分会讨论到如下内容: 1. 建立语音材料库,确定识别基本元,比如一个单词 yes no ok等,或者 声母 b p m f 韵母 d t... 阅读全文
摘要:
选自:http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html HTK(HMM Toolkit)一款基于hmm模型的语音处理工具,早就听说它了,一直因为用MATLAB中的工具箱在学习,或自己写代码在做HMM方面的试验,所以... 阅读全文