摘要: PCM文件:模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。 将音频数字化,其实就是将声音数字化。最常见的方式是透过脉冲编码调制PCM(Pulse... 阅读全文
posted @ 2015-10-15 20:57 maxandhchen 阅读(1601) 评论(0) 推荐(0) 编辑
摘要: 语音特征参数MFCC的提取及识别 (2012-09-07 20:24:03)转载▼耳蜗实质上相当于一个滤波器组,耳蜗的滤波作用是在对数频率尺度上进行的,在1000HZ下,人耳的感知能力与频率成线性关系;而在1000HZ以上,人耳的感知能力与频率不构成线性关系,而更偏向于对数关系,这就使得人耳对低频信... 阅读全文
posted @ 2015-10-15 20:34 maxandhchen 阅读(905) 评论(0) 推荐(0) 编辑
摘要: 一、MFCC概述 在语音识别(Speech Recognition)和话者识别(Speaker Recognition)方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scale Frequency Cepstral Coefficients,简称MFCC)。根据人耳听觉机理的研究发现... 阅读全文
posted @ 2015-10-15 20:30 maxandhchen 阅读(4665) 评论(0) 推荐(0) 编辑
摘要: 所谓的语音信号分析就是提取表征语音特征的信息,以进行后续的处理:语音识别、说话人识别等。语音特征信息及特征参数的提取。由于语音信号具有短时平稳特性,及在短时内特征参数稳定不变,一般时长为10~30ms,故通常将语音分帧处理,以获得稳定的特征参数。综上,对于一段语音信号,分析时通常表示为由每一帧特征参... 阅读全文
posted @ 2015-10-15 19:35 maxandhchen 阅读(637) 评论(0) 推荐(0) 编辑
摘要: K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。 聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签y... 阅读全文
posted @ 2015-10-15 15:35 maxandhchen 阅读(196) 评论(0) 推荐(0) 编辑
摘要: 1基本解释:extern可以置于变量或者函数前,以标示变量或者函数的定义在别的文件中,提示编译器遇到此变量和函数时在其他模块中寻找其定义。此外extern也可用来进行链接指定。 也就是说extern有两个作用,第一个,当它与"C"一起连用时,如: extern "C" void fun(int a,... 阅读全文
posted @ 2015-10-13 21:15 maxandhchen 阅读(364) 评论(0) 推荐(0) 编辑
摘要: http://blog.csdn.net/tianditongxing/article/details/41038695vs项目配置属性详解:http://tinggo.iteye.com/blog/1185551vs2010使用方案管理项目,一个解决方案下可包含多个项目。默认情况下,项目属性的设置... 阅读全文
posted @ 2015-10-13 20:00 maxandhchen 阅读(6996) 评论(0) 推荐(0) 编辑
摘要: 转于http://blog.csdn.net/fly_yr/article/details/39964035C++中 #ifdef 和#endif的作用一般情况下,源程序中所有的行都参加编译。但是有时希望对其中一部分内容只在满足一定条件才进行编译,也就是对一部分内容指定编译的条件,这就是“条件编译”... 阅读全文
posted @ 2015-10-13 17:32 maxandhchen 阅读(7694) 评论(0) 推荐(0) 编辑
摘要: VS2012变化的快捷键:http://blog.sina.com.cn/s/blog_659449460102e23u.html注释::VS2010是(Ctrl+E,C),VS2012是(Ctrl+K, Ctrl+C),实际操作,按住Ctrl键不放,先按K键,再按C键。相当于Ctrl+K加 Ctr... 阅读全文
posted @ 2015-10-12 21:36 maxandhchen 阅读(466) 评论(0) 推荐(0) 编辑