论文笔记:Deep Attentive Tracking via Reciprocative Learning
Deep Attentive Tracking via Reciprocative Learning
NIPS18_tracking
Type:Tracking-By-Detection
本篇论文地主要创新是在将注意机制引入到目标跟踪
摘要:源自认知神经科学地视觉注意促进人类对相关的内容的感知。近些年大量工作将注意机制引入到计算机视觉系统中。对于视觉跟踪来说,面临的最大问题在于目标外表的大尺度变化。自注图通过选择性关注临时的鲁棒特征提升视觉跟踪的性能。当前的一些检测跟踪算法主要使用额外的自注模型来生成特征权重,然而分类器并没有采用自注机制。在本文章=中,我们提出一种 reciprocative learning algorithm 算法在训练深度分类器时探索视觉自注机制。该算法由前馈与反馈操作两部分来产生自注图,该图作为正则项与分类LOSS一起训练。该深度分类器习得关注目标区域特征。相关的实验结果证实了该算法达到了极佳的跟踪效果。
引言
近年来。针对不同的视觉应用由此发展出各种各样的跟踪算法,其中视觉注意在视频中目标跟踪起了很大的作用。例如基于DCF的跟踪算法用一张高斯响应特征图表示输入的特征。很多人采用经验空间权重抑制由傅里叶变换过程中的边界效应。从视觉注意角度来说,空间权重也是自注图的一种表现形式。当目标由大尺度变化时,这种空间权重自注图就无法过多的注意边界的响应,从而错误的目标定位。
另一方面,two-stage tracking-by-detection 方法首先采集大量样本,对每一样本进行分类判断前景还是背景。视觉注意在这一方面有很大的潜能。现存的深度跟踪算法大多利用额外的注意模型来生成特征权重。自注机制需要经常以便可以学习到目标的最新特征,可以更好的将目标与背景区分。在本文中,作者直接训练一个自注分类器,整个训练过程包括前馈和反馈两步。在前馈这一步中,将图片输入网络,得到分类score;在反馈这一步中,将第一层网络的导数作为自注图(attention map),将自注图作为一个正则项作为LOSS函数中的一员进行训练。网络参数采用传统的反向传播进行更新。因此该深度分类器可以有效的学习目标相关区域的特征,同时有效地减少了背景的干扰。在测试的过程本网络的权重不进行更新,仅仅输出分类的score。
本文的主要贡献:
- 提出一个用于视觉自注的学习算法
- 将自注图作为loss函数的一项进行训练,使其关注目标的特征
- 通过与其他算法在相关数据集上的对比,我们的算法在性能上取得不错的结果
本文提出的跟踪算法训练过程