Abstract摘要
本文提出了一种从图像中提取特征不变性的方法,该方法可用于在对象或场景的不同视图之间进行可靠的匹配(适用场景和任务)。这些特征对图像的尺度和旋转不变性,并且在很大范围的仿射失真、3d视点的变化、噪声的增加和光照的变化中提供了鲁棒的匹配。从某种意义上说,一个单一的特征可以与来自许多图像的特征的大型数据库进行高概率的正确匹配。本文还介绍了一种利用这些特征进行目标识别的方法。识别的过程是使用快速最近邻算法将单个特征与来自已知对象的特征数据库相匹配,然后进行hough变换以识别属于单个对象的簇,最后通过一致姿态参数的最小二乘解进行验证。这种识别方法在保证近实时性的同时,能够在杂波和遮挡中稳健地识别出目标。
1 Introduction简介
图像匹配是计算机视觉中问题的一个基础方面,包括物体或场景识别,SFM,追踪等。本文描述了具有很多属性的图像特征,能够适应一个物体或场景的不同图像上的匹配。这些特征对图像的缩放和旋转具有不变性,对光照和三维摄像机视点的变化具有部分不变性。它们在空间域和频率域都具有很好的定位,减少了被遮挡、杂波或噪声破坏的可能。利用有效的算法可以从典型图像中提取大量特征。此外,这些特征具有很强的区分性,使得单个特征能够以很高的概率与一个庞大的特征数据库进行正确匹配,为目标和场景识别提供了基础。
通过采用级联滤波方法,将提取这些特征的成本降到最低,在这种方法中,更昂贵的操作仅应用于通过初始测试的位置。以下是用于生成图像特征集的主要计算阶段:
(1)尺度-空间极值检测:计算的第一阶段搜索所有尺度和图像位置。利用高斯函数差分来识别对尺度和方向不变的潜在兴趣点,有效地实现了该算法。
(2)关键点定位:在每一个候选位置,选择一个详细的模型用来确定位置和尺度。关键点是根据它们的稳定性来选择的。
(3)方向指定:基于局部图像梯度方向,为每个关键点位置指定一个或多个方向。所有未来的操作都是对已经相对于每个特征的指定方向、比例和位置进行变换的图像数据执行的,从而为这些变换提供不变性。
(4)关键点描述子:在每个关键点周围的区域中,以选定的比例测量局部图像梯度。它们被转换成一种表示形式,允许显著程度的局部形状失真和照明变化。
这种方法被称为尺度不变特征变换(sift),因为它将图像数据转换为相对于局部特征的尺度不变坐标。
这种方法的一个重要方面是,它生成了大量的特征,这些特征在整个尺度和位置范围内密集地覆盖了图像。一个500x500像素大小的典型图像将产生大约2000个稳定的特征(尽管这个数字取决于图像内容和各种参数的选择)。特征的数量对于目标识别尤为重要,因为在杂乱的背景中检测小目标的能力要求每个目标至少有3个特征被正确匹配,以便可靠地识别。
为了进行图像匹配和识别,首先从一组参考图像中提取sift特征并存储在数据库中。通过将新图像中的每个特征与之前的数据库进行单独比较,并根据特征向量的欧几里德距离寻找候选匹配特征,来匹配新图像。本文将讨论快速近邻算法,该算法可以对大型数据库快速执行此计算。
关键点描述符非常独特,它允许单个特征在一个大的特征数据库中以很高的概率找到其正确匹配。然而,在一个杂乱的图像中,来自背景的许多特征在数据库中没有任何正确的匹配,除了正确的匹配之外,还会导致许多错误的匹配。通过识别与对象及其在新图像中的位置、比例和方向一致的关键点子集,可以从完整的匹配集中筛选正确的匹配。多个特征偶然同意这些参数的概率远低于任何单个特征匹配出错的概率。利用广义hough变换的高效哈希表实现,可以快速确定这些一致的簇。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
2015-10-15 Android基础