Chapter 9:Noise-Estimation Algorithms

作者：桂。

时间：2017-06-14 12:08:57

链接：http://www.cnblogs.com/xingshansi/p/6956556.html

主要是《Speech enhancement: theory and practice》的读书笔记，全部内容可以点击这里。

书中代码：http://pan.baidu.com/s/1hsj4Wlu，提取密码：9dmi

前言

主要梳理单通道噪声估计的一般方法，内容为自己的学习记录，如果有不准确/错误的地方，还希望帮忙指出来。

一、算法原理

本文不打算作综述类描述，只介绍几种常用的噪声估计算法，首先介绍一下噪声估计的一般思路，噪声估计主要基于以下三个现象：

现象一：在音频信号中，闭塞因闭合段频谱能量趋于零或接近噪声水平，除此之外还会注意到：

静默（silent）段出现在清摩擦音的低频段，特别是2kHz以下的频段;
静默段(silent)出现在元音或一般的浊音（半元音、鼻音）期间的高频段，通常是4kHz以上，如图所示：

由于该特性，噪声在频谱上非均匀分布，不同频带具有不同的SNR，例如car噪声则具有低频特性，高频部分受影响较小，从而高频部分提取的带噪谱可以更有效地估计和更新噪声谱。更一般地，对于任意类型噪声，只要该频带无语音的概率很高或者SNR很低，则可以估计/更新该频带的噪声谱，这类思想是递归平均噪声估计算法(the recursive-averaging type of noise-estimation algorithms)的支撑点。

现象二：即使在语音活动的区域，带噪语音信号在单个频带的功率通常会衰减到噪声的功率水平，我们因此可以追踪在短时窗内（0.4~1s）带噪语音谱每个频带的最小值，实现各个频带噪声的估计。该现象是最小值跟踪算法（the minima-tracking algorithms）的支撑点。

现象三：每个频带能量的直方图揭示了一个理论：出现频次最高的值对应频带的噪声水平。有时谱能量直方图有两种模式：1）低能量对应无声段、语音的低能量段;2）高能量模式对应（noisy）语音的浊音段。低能量成分大于高能量成分：

但这个现象并不是一成不变，作者进行实验验证得出了结论：通常低频具有双峰分布，中频-高频为单峰。以上现象，频带能量直方图最大值对应频带的噪声水平，这是直方图噪声估计算法（histogram-based noise-estimation algorithms）的支撑点。

总结一下，以上三个现象引出了三类噪声估计算法：

递归平均噪声算法
最小值跟踪算法
直方图噪声估计算法

二、递归平均噪声算法

这类方法有利用信噪比相关、加权谱平均、基于信号存在概率等方法，这里只介绍基于信号存在概率的递归平均噪声估计算法，因为常用的MCRA及其变种就属于该范畴。

先说基本框架

从而实现噪声谱估计

剩下的就是一些常规的思路了。

　　A-似然比方法

两个基本要点：1）利用ML准则估计概率;2）利用近似表达。

这样一来，噪声估计为

其实这就是平滑的思路，只不过平滑因子对应这里的存在概率

按照之前的分析，在DFT系数复高斯模型下，可以实现参数估计

这样一来就完成了参数估计，噪声实现估计，细节上还有很多修缮的地方，这里就不提了。

　　B-MCRA算法(Minima-Controlled Recursive-Averaging Algorithms)

1-MCRA基本框架

先说说MCRA的基本框架

噪声谱估计

2-算法实现

　　写到这里，想到作者去世已经近五年，心里非常非常难过。写一本好书要花费多少的心血啊，而把研究做到如此细致、深入对后来人的帮助又是多么巨大。古人将修路造桥定义为大善之事，这些科研人员在科学道路上给后来人铺平了道路，他们又何尝不是修路人呢？今天读着他们的著作，感受着他们的思想，却连当面说些感谢话的机会也不再有！

步骤一：