图像检索:图像相似性度量
本文摘选自《基于半监督和主动学习相结合的图像的检索研究》。讲述了图像相似度度量的方法。
图像检索的性能不仅依赖于所抽取的图像特征,在颜色、纹理和形状等图像特征被提取出并建立起索引后,图像检索的关键就在于所采用的相似度量(或距离度量)函数。它直接关系到图像检索的结果和检索效率。
基于文本的检索方法采用的是文本的精确匹配,而基于内容的图像检索系统是一种非精确的匹配,通过计算查询示例图像和候选图像之间视觉特征的相似度来完成。在颜色、纹理和形状等图像特征被提取出来后,形成特征向量,就可以用这个特征向量来表征对应的图像。在图像检索中,判断图像之间是否相似是通过比较这些特征向量是否相似来进行的。即把图像特征向量之间的比较就看成是图像相似度比较。显然,一个好的特征向量比较算法对图像检索结果影响很大的。
理想的相似性度量方法应该满足人的视觉特性,也就是说视觉上相似的图像间应具有较小的距离,而视觉上不相似的图像间应具有较大的距离。常用的图像相似度度量方法都是基于向量空间的模型,即将图像特征看作是向量空间中的点,通过计算两个点之间的距离接近程度来衡量图像特征间的相似性。
特征的相似度匹配算法是跟特征值提取方法紧密相关的,颜色、纹理、形状的特征提取都有相对比较合适的相似度量算法。
2.2.1. 基于颜色特征的相似度量
常见的基于颜色特征的相似度量计算方法主要有绝对值距离、欧式距离、直方图相交法、x2距离、参考颜色表、中心矩等。
先设 a, b是两幅图像对应的特征向量,ai,bi分别代表特征分量。
2.2.1.1. Minkowsky 距离
Minkowsky 距离是基于Lp 范数定义的:
a) 如果 p=l,称为城区距离(city-block),也就是绝对值距离:
b) 如果 p=2,称为欧式距离(Euclideandistance):
c) 如果 p →∞,称为切比雪夫距离(Chebyshevdistance):
2.2.1.2. 直方图相交法
直方图相交法(histogram intersection)是由 Swain 等人于 1991 年首次提出的,直方图相交法计算简单快速并且能较好地抑制背景的影响,其数学描述为:
上式可以进一步进行归一化处理:
(其他方法还没看)
2.2.2. 基于纹理特征的相似度量
常见的基于纹理特征的相似度量计算方法主要有欧式距离和马氏距离等。其中欧式距离与颜色特征检索的欧式距离度量方法相同,可参见 Minkowsky 距离 p 取值 2。
2.2.2.1. 马氏距离
如果特征向量的各个分量间具有相关性或者具有不同的权重,可以采用马氏距离(Mahalanobis distance)来计算特征之间的相似度。马氏距离的数学表达为: