Saliency Detection: A Spectral Residual Approach
原文链接:显著性检测 Saliency Detection: A Spectral Residual Approach
图像显著性检测 Saliency Detection A Spectral Residual Approach
原理:原理:我们一般把图像分为目标和背景,传统的显著性模型是提取目标的特定特征,这样的方法就决定了目标种类的特定性,也就导致了这种方法的局限性。一般认为视觉注意机制分为两个阶段:一个是并行快速简单的预注意阶段,然后是单行缓慢但是复杂的注意阶段。人类倾向于关注那些有显著变化的区域,而对大部分的相似的区域不予关注。因此,在图像中将平淡的背景剔除掉,剩下的就是显著区域。
Spectral Residual Model(谱残差模型)
从信息论的角度来看,对于一副图片所含的信息可以分为两部分,一部分是新颖的、有用的知识,另一部分是一些先验知识,公式可见下图:
前者往往是我们想关注的,可以理解为显著性的东西或者前景,后者是我们不想关注的东西,可以称为背景。这也是这篇论文的一个思想来源所在吧,即如果我们能找到一种方法或者规律能够把背景给剔除,那剩下的就是显著性的东西了。作者针对这个问题提出在图像频谱的对数域上表示来寻找规律。前人了实验发现了以下规律:
即大量自然图像在某个频率的幅度的平均值和该频率成反比。进一步还有以下规律:当频率和平均幅频响应都在log-log坐标下时是近似线性的,同时当只有幅频响应取对数坐标时,所有的图像的幅频响应曲线是类似的。
算法步骤:
1、为了便于做傅里叶变换,首先将原图通过尺度变换变到64*64的尺度上。
2、对原图做傅里叶变换,得到幅频响应,记为L(f)。
3、用一个3*3的局部平均滤波器和原图做卷积,用来模拟平均的幅频响应,记为A(f)。
4、得到谱残差R(f)的表达式为:R(f) =L(f) - A(f)。
5、对R(f)进行傅里叶逆变换,得到空间域的显著性图,如果想得到更好的视觉效果,可以对显著性图做一次标准差为8的高斯模糊。