关于HE-AAC中 QMF的设计以及对时频分析的思考
众所周知,HE-AAC是由AAC和SBR组合而成,MP3Pro是MP3和SBR组合而成。SBR的目的是实现从低频到高频的预测与复制。而SBR模块中,QMF是核心内容。
那么QMF是如何设计出来的,作为一个时频分析模块,MDCT才是比较好的应用在音频编解码器里的时频分析系统【1】【2】,那为什么使用QMF呢?他和MP3里的PQF有什么区别?QMF又如何设计?
一. 为什么使用QMF
由【1】,戴善荣的《数据压缩》第三章有提到DCT是接近KLT的时频变换(其他书也有提到)。而由【2】微软首席科学家Henrique S. Malvar(也是WMA的发明人之一)的关于MLT和LOT论文,可以得到MDCT是最适合音频分析的时频变换。另外从时频变换在音频编解码的应用中看,从早期的早期的DTS,MP2,ATRAC的PQF/QMF时频分析到新一代的AAC,AC3,ATRAC3中使用MDCT作为时频分析内核,为什么还在更先进的HE-AAC中使用QMF作为时频分析的模块呢?
原因是,在音频编码初期,音频编码是从波形编码(时域)发展而来,又为了结合掩蔽效应,巴克谱,就使用了结合时域和频域的PQF分析,而新一代(相对早期)音频编码器为了提高频率分辨率。解决PQF的混叠问题,使用了MDCT分析。而不同于为了结合掩蔽效应,巴克谱,和高频率分辨率。SBR的原理是使用低频到高频的预测。并且挖掘频域和时域二维的相关性,不追求高频率分辨率。所以使用了QMF,而不同于PQF,QMF的虚部实现去混叠。这是使用QMF的原因。当然在LP-SBR(Low Power SBR)里面,没有了虚部,他就是一种PQF/QMF。
详细内容还有关于SBR的论文。
二。如何设计QMF
这部分内容请见,《多抽样率数字信号处理理论及其应用》相关章节,就知道如何设计类似的QMF滤波器。