在Jean-Marc Valin(Speex作者)的论文中体会正弦信号参数提取方法(1)
Jean-Marc Valin为了开发Ghost Codec技术,在研究正弦信号提取的方法。
Ghost Codec技术是面向低码率的音频编解码技术,早期的普通熵编码+感知模型已经无法满足现阶段低码率的需要。总体说来,HE-AAC系列编码器是正弦模型和传统感知模型的混合版,是对之前感知模型的补充。
建立正弦模型的关键是正弦分析和正弦参数的提取。
他在论文"An Iterative Linearised Solution to the Solution to the Sinusoidal Parameter Estimation Problem"里面对正弦参数提取给出了一些总结并提出了自己的观点.
这篇博客主要陈述J,M Valin对正弦参数提取技术的总结:
正弦参数提取方法有如下几种
1.FFT+rectangular windows
缺点:矩形窗会导致频率旁瓣(sidelobe)泄漏和糟糕的频率分辨率。
2.Over-Complete dictionary
缺点:是一种贪婪算法,算法复杂度在O(N^4),
(可以通过不使用矩形窗减少旁瓣问题)
相关论文:
S.Mallat and Z.Zhang “Matching Pursuits with time-frequency dictionaries.”
K.Vos, R. Vafin, R. Heusdens, and W. B.Kleijn. "High-quality consitent analysis-synthesis in sinusioidal coding"
3.Time-frequency reassignment
缺点:不适合噪声信号环境。
论文:
F. Auger and P. Flandrin.
4.Harmonic Signals estimation
缺点:只适用于谐波信号。
5.(J.M. Valin Method)