WELEN

2014年6月28日

摘要： WebRTC，名称源自网页实时通信（Web Real-Time Communication）的缩写，是一个支持网页浏览器进行实时语音对话或视频对话的技术，是谷歌2010年以6820万美元收购Global IP Solutions公司而获得的一项技术。WebRTC实现了基于网页的视频会议，标准是WHA... 阅读全文

posted @ 2014-06-28 10:01 WELEN 阅读(1489) 评论(0) 推荐(1) 编辑

2014年6月24日

亲自动手用HTK实现YES NO孤立词识别

摘要：很久以前的发在研学论坛的帖子了，再重新整理了一下，希望对新手有用。完整版链接：http://yun.baidu.com/s/1hapcE第一步创建语音文件录音命令：HSLab any_name.sig第二步：声学分析抽取yes和no的mfcc特征参数。保存在data/train/lab与data... 阅读全文

posted @ 2014-06-24 11:44 WELEN 阅读(1471) 评论(0) 推荐(0) 编辑

2014年6月19日

wav转aac

摘要： //调用neroAacEnc.exe STARTUPINFO si={0}; PROCESS_INFORMATION pi={0};//隐藏窗口 si.cb=sizeof(si); si.dwFlags= STARTF_USESHOWWINDOW| STARTF_USESTDHANDLES;... 阅读全文

posted @ 2014-06-19 10:18 WELEN 阅读(1061) 评论(0) 推荐(0) 编辑

2014年6月18日

音轨多声道立体声虚拟多声道耳机

摘要：音轨多声道立体声虚拟多声道耳机1.一个影音文件一般包含多个音轨，每个音轨又可以包含多个声道。2.音轨，顾名思义，就是一条声音轨迹，是一个独立的声音单元，一般播放其中的一种音轨。应用场景：语言(国语、粤语、英语)。3.多音轨录制：卡拉ok(双音轨：伴奏和清唱，演唱者在伴奏下跟随节奏多次清唱，直... 阅读全文

posted @ 2014-06-18 09:43 WELEN 阅读(3873) 评论(1) 推荐(2) 编辑

2014年6月17日

HIFI播放器--磨机吐槽篇

摘要：最近看到淘宝店提供各种随身播放器磨机服务，说的是天花乱坠，给你更换零件，甚至更改电路，搭载上去，是如何如何的好，整个播放器就上升了几个等次，收费还不低，至少是好几百，我实在是忍不住吐槽了，你们这些人，你们有资格磨机吗？1.你们有播放器的电路设计图纸吗？如果你们连最基本的图纸，整个电路的设计图都没有... 阅读全文

posted @ 2014-06-17 13:59 WELEN 阅读(5202) 评论(1) 推荐(4) 编辑

2014年6月15日

无损音频==高音质？

摘要：为什么会谈起这个话题。原因在于最近我在网上很兴奋地找到了一些原始wav、APE、FLAC无损格式的音频，本以为可以享受一把，结果表现很一般，这让我大失所望。细细的想了一把，无损甚至是原始的pcm，wav格式音频，都有可能质量不高。我们回顾一下整个音频采集、压缩编码、信道传输、解码、播放的整体流程，如... 阅读全文

posted @ 2014-06-15 21:27 WELEN 阅读(3798) 评论(10) 推荐(4) 编辑

ASIO插件真的能提升音质？(听音乐者必看)

摘要：最近在倒弄HIFI音乐播放器footbar2000的配置时，发现了2011年的一个神贴，最牛逼的是，这个神贴到现在还屹立不倒，还有很多无知的人在下面膜拜，我真的想问：你这么优秀，都能逆天反转音质，你妈知道吗。首先，我们再来看一看这个神贴：foobar2000使用ASIO插件.驱动大幅提升音质图文教程... 阅读全文

posted @ 2014-06-15 11:19 WELEN 阅读(16572) 评论(6) 推荐(2) 编辑

2014年6月12日

我在互联网的第一年

摘要：从毕业到现在已经有一年多的时间了，在这一年里，谈不上成功，更多的是学习和适应，打好基础。1.职业选择13年毕业那会，整个通信行业开始走下坡路，中兴巨亏大面积裁员，华为也将重点转向了终端和互联网。最后在互联网视频公司PPS和语音识别公司Nuance之间，我拥抱了前者。互联网对我来说是个全新的开始，这让... 阅读全文

posted @ 2014-06-12 11:06 WELEN 阅读(3452) 评论(9) 推荐(7) 编辑

2014年6月11日

变速变调原理与方法总结

摘要：变调和变速原理自然语音的产生可以简化为图2-1模型，激励源出来的声门波信号与声道模型进行卷积，最后通过嘴唇辐射模型产生语音。其中，激励源决定说话人的基频的大小，即音调的高低。声道模型反映“润色”的频谱信息，具体的讲，共振峰决定了语义信息，谐波分布决定了音色，单位时间的音节数决定了语速。图2-1 语音... 阅读全文

posted @ 2014-06-11 22:31 WELEN 阅读(24730) 评论(11) 推荐(8) 编辑

TIMIT语音库

摘要： TIMIT语音库有着准确的音素标注，因此可以应用于语音分割性能评价，同时该数据库又含有几百个说话人语音，所以也是评价说话人识别常用的权威语音库，但该语音库的商业用途是要花钱买的。下面的资源来自与MIT教学实验使用，大概有430多M。下载地址：http://web.mit.edu/course/6/6... 阅读全文

posted @ 2014-06-11 21:43 WELEN 阅读(10215) 评论(0) 推荐(0) 编辑

基于HTK语音工具包进行孤立词识别的使用教程

摘要：选自：http://my.oschina.net/jamesju/blog/1161511前言最近一直在研究HTK语音识别工具包，前几天完成了工具包的安装编译和测试，这几天又按耐不住好奇，决定自己动手搞一搞，尝试一下用这个工具包，进行简单的孤立词识别，看了几天的文档，做了各种尝试，总算跌跌撞撞的实现... 阅读全文

posted @ 2014-06-11 15:54 WELEN 阅读(647) 评论(0) 推荐(0) 编辑

Praat 音频分析人工标注

摘要： http://pan.baidu.com/s/1o6BdE5c 阅读全文

posted @ 2014-06-11 14:45 WELEN 阅读(755) 评论(0) 推荐(1) 编辑

HTK源码学习总结

摘要： http://pan.baidu.com/s/1o6BdE5c 阅读全文

posted @ 2014-06-11 14:43 WELEN 阅读(731) 评论(0) 推荐(0) 编辑

HTK搭建语音拨号系统实验材料下载

摘要：选自：http://maotong.blog.hexun.com/6267266_d.html压缩包包括全部的配置文件，脚本文件，必备的模型文件和实验手册。全部实验材料的下载链接：1http://su.tonghua.googlepages.com/voicedialsystem.zip2http:... 阅读全文

posted @ 2014-06-11 14:28 WELEN 阅读(531) 评论(0) 推荐(0) 编辑

应用HTK搭建语音拨号系统4：识别器评估

posted @ 2014-06-11 14:27 WELEN 阅读(448) 评论(0) 推荐(0) 编辑

应用HTK搭建语音拨号系统3：创建绑定状态的三音素HMM模型

posted @ 2014-06-11 14:25 WELEN 阅读(1579) 评论(0) 推荐(0) 编辑

应用HTK搭建语音拨号系统2：创建单音素HMM模型

posted @ 2014-06-11 14:23 WELEN 阅读(1000) 评论(0) 推荐(0) 编辑

应用HTK搭建语音拨号系统1:数据准备

posted @ 2014-06-11 14:21 WELEN 阅读(1005) 评论(0) 推荐(0) 编辑

HTK学习2：工具使用

摘要：选自：http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html 这个是重点，呵呵，本部分会讨论到如下内容： 1. 建立语音材料库，确定识别基本元，比如一个单词 yes no ok等，或者声母 b p m f 韵母 d t... 阅读全文

posted @ 2014-06-11 14:05 WELEN 阅读(1583) 评论(0) 推荐(0) 编辑

HTK学习1：安装编译

摘要：选自：http://www.cnblogs.com/mingzhao810/archive/2012/08/03/2617674.html HTK（HMM Toolkit）一款基于hmm模型的语音处理工具，早就听说它了，一直因为用MATLAB中的工具箱在学习，或自己写代码在做HMM方面的试验，所以... 阅读全文

posted @ 2014-06-11 14:04 WELEN 阅读(983) 评论(0) 推荐(0) 编辑

公告