视觉显著性优秀硕士论文总结

基于区域对比度的视觉显著性检测算法研究

需要解决的问题:

Cheng的方法主要是基于颜色的统计,我们实验结果发现对于其他的特征,基于区域对比度的方法依然取得了不错的检测效果。这个特征亮度,纹理,边缘,频率等都适用。

本文的目标:构造面向应用的视觉显著性检测方法

(创新点)过分割:基于区域对比度的显著性检测方法正是合理有效地利用图像自身的属性。与基于块的显著性检测方法不同,基于区域对比度的方法首先对图像进行过分割[33][34],然后通过检测过分割生成的区域间的对比度来计算视觉的显著性。过分割方法的合理性在于:第一,区域内的颜色差异很小,区域间的颜色差异较大,在检测的过程中只需关注区域间的差异,这也更符合人眼观察世界的方式;第二,区域的界限很好地保留了输入图像物体的轮廓特征。对于过分割的结果,可以合理假设为,属于同一分割区域的像素点,必然属于输入图像中同一物体。图3–8,边缘检测的结果3–8(b)将魔方的颜色块分离开来,过分割的结果3–8(c)都能保持边缘的特征。图3–8(c)中,以区域的平均颜色代替区域内的所有颜色,仍旧保持了输入图像的整体特征。

 

显著性的应用:

显著性引导的应用自动分割、自适应无缝融合、风格化和视觉特殊效果(视觉伪装)四个方面的应用。

显著性保持最为典型的应用时图像灰度化和智能剪裁

 

 

基于注意力机制的图像显著区域提取算法分析与比较

提出了一中SMG方法,是从ITTI方法延伸出来的。

本文概括:

  1. 对图像的特征进行了大致的分类与介绍:颜色,纹理,轮廓,形状,空间,语义
  2. 对人类视觉感知系统进行一个分析,并对视觉注意机制和模型进行简单分类,视觉注意机制:自顶向下,自底向上;视觉注意模型:基于空间,特征,对象模型
  3. 本文的ITTI的方法介绍很详细,可以参考,本文提出的SMG方法就是从ITTI的方法延伸出来的,ITTI是不同尺度的图像的中央周边差,而SMG方法是同一尺度内的中央周边差,其他都类似。
  4. 本文对ITTI,HC,RC,FT方法都有个简介
  5. 4.3以后的章节未细看,可等写论文时研究,关于软件系统和显著性评测。显著性提取采用的方法是基于一个固定阈值的方法提取。这里提供了一个MSRA的显著图像对象库,衡量显著图的提取效果。该图像库由5000幅图像组成,每幅图像中都至少存在一个显著对象,同时每幅图像由9名志愿者用矩形框手工标注出显著区域的位置。我们用这个数据集来测试基于显著图和分割图融合的显著区域提取算法的有效性。需要指出的是,由于显著区域的提取具有较大的主观性,不同的用户可能会选择不同的显著区域,因此如何评价显著区域的提取性能一直没有一个较好的评价标准。而MSRA提供了这样一个图像库用于评测显著区域的提取效果。

http://research.microsoft.com/en-us/um/people/jiansun/SalientObject/salient_object.htm

 

基于视觉注意的显著区域检测算法研究

产生新方法的依据:由 Hou 和 Zhang 提出的频域谱残余方法 (SR 方法)是其中最具代表性的方法。SR 方法通过对图像幅度谱进行局部均值滤波达到压制冗余信息的目的,因此该方法在压制图像非显著性信息的同时也压制了显著性信息,导致显著图对比度较差,同时也抑制了一些显著细节。可见,当前的频谱域方法仍有许多不足之处。

新方法:——本章节通过研究图像傅里叶频谱与显著性的关系,提出了一种基于相位谱和调谐幅度谱的显著性检测方法 简称 PTA 方法。PTA 方法抑制了非显著区域的频谱同时尽量增强显著区域频谱,可以有效提取显著区域

——本文试图找到此类频谱域方法的生物学依据(之前生物学的依据不是很明显)

方法细节:

  1. 图像的傅里叶频谱可以分解为幅度谱和相位谱和的形式 。而相位谱包含图像的纹理结构信息,而幅度谱包含图像的明暗对比信息。所以相位谱比幅度谱在保留图像完整性方面更重要。因而应完整保留图像相位谱进行显著图重构,而幅度谱是亮度信息,可用于调谐。
  2. 对SR方法的改善:SR 方法由于采用局部均值滤波,实现了近似归一化的处理,原高幅值的幅度谱和低幅值幅度谱都进行了强烈抑制,得到的残余谱幅值很小,这种方法在去除非显著性信息的同时也抑制了显著性信息的频谱值,导致最终结果的显著信息不明显,而且出现了附生毛刺。——本文提出利用阈值的方法,通过设定合适的阈值,确定显著性特征幅值和非显著性特征幅值的边界,大于阈值的幅度谱进行自适应抑制,小于阈值的幅度谱进行自适应增强。最终突出显著性特征
  3. 介绍了生物学的侧抑制机制,本文提出的图像傅里叶幅度谱进行自适应调谐的方法与人类视觉的侧抑制机制极其相似。这也是域方法的生物学依据。
  4. SR方法介绍:残余谱方法(SR)[23]是最具代表性的基于频域的显著性区域检测方法。SR 方法基于信息论的观点,通过处理图像幅度谱得到残余谱,再利用傅里叶逆变换得到空域显著图。
  5. 本文方法:人类视觉的侧抑制机制要求对冗余特征进行抑制,对稀有特征进行增强。在频域内,就是对幅度谱较大的特征进行削弱,对幅度谱较小的特征进行增强。采用多项式形式的分段函数对幅度谱进行非线性调谐效果最好。可见小于阈值点的幅值被显著增强而大于阈值点的幅值被抑制近似为 0。符合幅度谱调谐的要求。
  6. 先对图像进行傅里叶变化,提取相位普和幅度谱。
  7. 调谐:由于图像的相位谱反应的是图像的纹理信息,所以要保留图像的相位普,对图像的幅度谱进行处理。对幅度调谐,得到一个合适的阈值,从而使显著性区域幅值加强,非显著性区域削弱(即亮度的变化)
  8. 傅里叶逆变换得到显著性图
  9. 得到显著性图后,需要对目标进行提取:1:,二值化图像,由于得到的显著性图是显著性区域亮度强,非显著性区域亮度弱,所以合理的二值化分割保留高亮度区域。通过冗余提取,可以部分提取团块目标的部分形状。

方法总结:

 

posted on 2015-03-26 11:16  夕拾  阅读(856)  评论(0编辑  收藏  举报