语音信号简论
语音/音频信号编码有两种方式:一种是波形编码的方式,另一种是参数编码的方式。
波形编码的方式就是通过取样量化的方式将模拟信号转换成数字信号,采用某种压
缩方法利用尽可能少的比特来表示波形,这类编码有mpeg,wma,aac等等,这
类编码有个特点就是码率较高,带宽比较大。这种方法最大限度的保留了原始信号的
波形,常用在对音频质量要求较高的场所。
参数编码就是把语音信号看成是某个模型在一定的激励作用下产生的输出。因此在该
方式下,激励源以及模型参数便是编码后需要传送的内容。在解码端通过根据收到的
模型参数和激励源来重构原始语音信号。当然这种方式解码出来的信号波形就与原信号
有较大的差别了。但这种方式的好处就是码率较低,所占带宽较窄,适用于对带宽比较
苛刻的场合。这种编码标准有g7xx系列,amrnb,amrwb等等。这种编码标准常用于
通信领域。
波形编码主要应用的技术有以下几个部分:huffman编解码,MDCT/IMDCT,窗函数
overlap。当然除了这些还有心理声学模型,联合增强等技术。
参数编码主要应用的技术有:线性预测,以及lsp,码矢搜索(含固定码本与自适应码本)。
以上就是音频/语音编解码的一个概括。目前主要工作内容是波形编码,我会努力尝试着
将其中涉及到的一些技术来进行分析,平时的工作中常会涉及到对这些模块进行优化,
但是真正对这些模块详细的分析它的原理以及作用,倒是没有认真的进行过。前段时间的
一些经历确实触动我,需要对这些东西有个更深入的了解才能做好我以后的工作。