文章分类 - 语音处理技术
我的毕设是基于HMM的语音参数分析
摘要:六、波形显示控件CWaveDisplay语音分析平台中非常重要的一点就是直观的显示语音数据的各种参数。 1 ////////////////////////////////////////////////////////////////////////// 2 // class CWaveDisplay 3 // 4 // 功能: 实现数据的在GUI上的显示 5 // 创建人:...
阅读全文
摘要:五、HMM模型:HMM是在马尔可夫模型的基础上发展起来的。由于实际问题比Markov链模型所描述的更为复杂,观察到的事件并不是与状态一一对应的,而是通过一组概率分布相联系的,这样的模型成为隐马尔可夫模型(HMM)。它是一个双重的随机过程,其中之一是Markov链,这是基本随机过程,它描述状态的转移概率。另一个随机过程描述状态和观察值之间的统计对应关系。这样站在观察者的角度,只能看到观察值,不像Ma...
阅读全文
摘要:四、矢量量化:这里讨论的是K-means聚类,取码本的容量为4。1、CVQ类的功能:1)进行K-means聚类2)计算两个码本的欧式距离2、CVQ类的设计 1 ////////////////////////////////////////////////////////////////////////// 2 // 采用改进LBG算法,实现输入序列的矢量量化 3 // 4 // 创建人: ...
阅读全文
摘要:三、语音信号的时域特征参数。这部分内容还包括了语音信号预处理的分帧和加窗的内容,因为这两部操作都是对语音信号的时域波形处理的结果,因此索性写进CSpeech类中。1、CSpeech类的功能1)实现裸音频数据的加窗2)实现了裸音频数据的分帧4)获取短时能量:采用hamming窗5)获取短时平均振幅:采用hamming窗6)获取短时平均过零率:采用hamming窗7)实现基于“滑动”法的端点检测和裸音...
阅读全文
摘要:二、数字信号转换:在语音处理中,往往需要对输入的原始语音信号进行信号处理。包括对输入语音信号的8~16位转换,截取,抽样以及相关的FFT变换。在进行FFT变换部分,采用了osalp的开源fft库,在其基础上实现了短时FFT。osalp的源代码和说明可以从http://osalp.sourceforge.net 得到。本文中所涉及的德数字信号变换由CWaveConvertor类负责,1、CWaveC...
阅读全文
摘要:CWaveFile类的设计和实现
阅读全文
摘要:wave文件的格式说明
阅读全文