随笔分类 - 02-ImageRetrieval
CV
摘要:在前面实现的检索中,根据图像编码后向量(VLAD)的相似性,从图像库中检索出,与查询图像VLAD向量最相似的图像。由于实际场景图像的复杂性,仅仅利用VLAD向量的相似并不能取得很好的精度,通常先利用VLAD向量从图像库中快速的检索出最相似的$K$幅图像,然后再进一步筛选。 在实际场景中进行图像检索,
阅读全文
摘要:图像检索中,对一幅图像编码后的向量的维度是很高。以VLAD为例,基于SIFT特征点,设视觉词汇表的大小为256,那么一幅图像编码后的VLAD向量的长度为$128 \times 256 = 32768 $。通常要对编码后的VLAD向量进行降维,降维后的向量长度应该根据图像库中图像量的大小来,如果只是几
阅读全文
摘要:本文对前面的几篇文章进行个总结,实现一个小型的图像检索应用。 一个小型的图像检索应用可以分为两部分: train,构建图像集的特征数据库。 retrieval,检索,给定图像,从图像库中返回最类似的图像 构建图像数据库的过程如下: 生成图像集的视觉词汇表(Vocabulary) 提取图像集所有图像的
阅读全文
摘要:TF IDF RootSift VLAD TF IDF TF IDF是一种用于信息检索的常用加权技术,在文本检索中,用以评估词语对于一个文件数据库中的其中一份文件的重要程度。词语的重要性随着它在文件中出现的频率成正比增加,但同时会随着它在文件数据库中出现的频率成反比下降。像‘的’,‘我们’,‘地’等
阅读全文
摘要: 在上一篇文章中 "图像检索(2):均值聚类 构建BoF" :均值聚类 构建BoF")中,简略的介绍了基于sift特征点的BoW模型的构建,以及基于轻量级开源库vlfeat的一个简单实现。 本文重新梳理了一下BoW模型,并给出不同的实现。 基于OpenCV的BoW实现 BoWTrainer的使用
阅读全文
摘要:在图像检索时,通常首先提取图像的局部特征,这些局部特征通常有很高的维度(例如,sift是128维),有很多的冗余信息,直接利用局部特征进行检索,效率和准确度上都不是很好。这就需要重新对提取到的局部特征进行编码,以便于匹配检索。 常用的局部特征编码方法有三种: BoF VLAD FV 本文主要介绍基于
阅读全文
摘要:概述 基于内容的图像检索技术是采用某种算法来提取图像中的特征,并将特征存储起来,组成图像特征数据库。当需要检索图像时,采用相同的特征提取技术提取出待检索图像的特征,并根据某种相似性准则计算得到特征数据库中图像与待检索图像的相关度,最后通过由大到小排序,得到与待检索图像最相关的图像,实现图像检索。图像
阅读全文