摘要:
WebRTC,名称源自网页实时通信(Web Real-Time Communication)的缩写,是一个支持网页浏览器进行实时语音对话或视频对话的技术,是谷歌2010年以6820万美元收购Global IP Solutions公司而获得的一项技术。WebRTC实现了基于网页的视频会议,标准是WHA... 阅读全文
摘要:
很久以前的发在研学论坛的帖子了,再重新整理了一下,希望对新手有用。完整版链接:http://yun.baidu.com/s/1hapcE第一步 创建语音文件 录音命令:HSLab any_name.sig第二步:声学分析抽取yes和no的mfcc特征参数。保存在data/train/lab与data... 阅读全文
摘要:
//调用neroAacEnc.exe STARTUPINFO si={0}; PROCESS_INFORMATION pi={0};//隐藏窗口 si.cb=sizeof(si); si.dwFlags= STARTF_USESHOWWINDOW| STARTF_USESTDHANDLES;... 阅读全文
摘要:
音轨 多声道 立体声 虚拟多声道 耳机1.一个影音文件一般包含多个音轨,每个音轨又可以包含多个声道。2.音轨,顾名思义,就是一条声音轨迹,是一个独立的声音单元,一般播放其中的一种音轨。应用场景:语言(国语、粤语、英语)。3.多音轨录制:卡拉ok(双音轨:伴奏和清唱,演唱者在伴奏下跟随节奏多次清唱,直... 阅读全文
摘要:
最近看到淘宝店提供各种随身播放器磨机服务,说的是天花乱坠,给你更换零件,甚至更改电路,搭载上去,是如何如何的好,整个播放器就上升了几个等次,收费还不低,至少是好几百,我实在是忍不住吐槽了,你们这些人,你们有资格磨机吗?1.你们有播放器的电路设计图纸吗? 如果你们连最基本的图纸,整个电路的设计图都没有... 阅读全文
摘要:
为什么会谈起这个话题。原因在于最近我在网上很兴奋地找到了一些原始wav、APE、FLAC无损格式的音频,本以为可以享受一把,结果表现很一般,这让我大失所望。细细的想了一把,无损甚至是原始的pcm,wav格式音频,都有可能质量不高。我们回顾一下整个音频采集、压缩编码、信道传输、解码、播放的整体流程,如... 阅读全文
摘要:
最近在倒弄HIFI音乐播放器footbar2000的配置时,发现了2011年的一个神贴,最牛逼的是,这个神贴到现在还屹立不倒,还有很多无知的人在下面膜拜,我真的想问:你这么优秀,都能逆天反转音质,你妈知道吗。首先,我们再来看一看这个神贴:foobar2000使用ASIO插件.驱动大幅提升音质图文教程... 阅读全文
摘要:
从毕业到现在已经有一年多的时间了,在这一年里,谈不上成功,更多的是学习和适应,打好基础。1.职业选择13年毕业那会,整个通信行业开始走下坡路,中兴巨亏大面积裁员,华为也将重点转向了终端和互联网。最后在互联网视频公司PPS和语音识别公司Nuance之间,我拥抱了前者。互联网对我来说是个全新的开始,这让... 阅读全文
摘要:
变调和变速原理自然语音的产生可以简化为图2-1模型,激励源出来的声门波信号与声道模型进行卷积,最后通过嘴唇辐射模型产生语音。其中,激励源决定说话人的基频的大小,即音调的高低。声道模型反映“润色”的频谱信息,具体的讲,共振峰决定了语义信息,谐波分布决定了音色,单位时间的音节数决定了语速。图2-1 语音... 阅读全文
摘要:
TIMIT语音库有着准确的音素标注,因此可以应用于语音分割性能评价,同时该数据库又含有几百个说话人语音,所以也是评价说话人识别常用的权威语音库,但该语音库的商业用途是要花钱买的。下面的资源来自与MIT教学实验使用,大概有430多M。下载地址:http://web.mit.edu/course/6/6... 阅读全文
摘要:
选自:http://my.oschina.net/jamesju/blog/1161511前言最近一直在研究HTK语音识别工具包,前几天完成了工具包的安装编译和测试,这几天又按耐不住好奇,决定自己动手搞一搞,尝试一下用这个工具包,进行简单的孤立词识别,看了几天的文档,做了各种尝试,总算跌跌撞撞的实现... 阅读全文
摘要:
http://pan.baidu.com/s/1o6BdE5c 阅读全文
摘要:
http://pan.baidu.com/s/1o6BdE5c 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6267266_d.html压缩包包括全部的配置文件,脚本文件,必备的模型文件和实验手册。全部实验材料的下载链接:1http://su.tonghua.googlepages.com/voicedialsystem.zip2http:... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6261890_d.html苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6261873_d.html苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6204849_d.html苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性... 阅读全文
摘要:
选自:http://maotong.blog.hexun.com/6204849_d.html应用HTK搭建语音拨号系统--数据准备苏统华哈尔滨工业大学人工智能研究室2006年10月30日声明:版权所有,转载请注明作者和来源该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word... 阅读全文
摘要:
选自:http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html 这个是重点,呵呵,本部分会讨论到如下内容: 1. 建立语音材料库,确定识别基本元,比如一个单词 yes no ok等,或者 声母 b p m f 韵母 d t... 阅读全文
摘要:
选自:http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html HTK(HMM Toolkit)一款基于hmm模型的语音处理工具,早就听说它了,一直因为用MATLAB中的工具箱在学习,或自己写代码在做HMM方面的试验,所以... 阅读全文