摘要: Introduction 本文主要设计了一个自学习的区域对称Reid框架,解决提取的特征区域不对齐的问题。 Our Approach 假设图片集合为,模型采用了三元组损失。 (1)区域对齐表征: 区域映射检测器采用的是一个卷积层。该网络输出K个区域特征,最终concat得到:。该网络效果如下: (2 阅读全文
posted @ 2020-06-21 18:05 橙同学的学习笔记 阅读(432) 评论(0) 推荐(0) 编辑
摘要: Introduction 作者认为之前提出的网络忽视了不同阶段的特征差异,新提出了一个同时考虑时间、语义信息的网络框架。在时间维度采用了注意力机制,之前的方法都是将每一帧看成独立的个体提取注意力得分,但作者考虑了帧与帧之间的关系信息;在语义维度采用了CNN多层特征融合的策略 Methods (1)概 阅读全文
posted @ 2020-06-21 17:48 橙同学的学习笔记 阅读(788) 评论(1) 推荐(0) 编辑
摘要: Introduction 本文主要提出了高效且容易实现的STA框架(Spatial-Temporal Attention)来解决大规模video Reid问题。框架中融合了一些创新元素:帧选取、判别力局部挖掘、不带参特征融合、视频内正则化项。 Proposed Method (1)总体思路: 先通过 阅读全文
posted @ 2020-06-21 17:12 橙同学的学习笔记 阅读(1194) 评论(0) 推荐(0) 编辑
摘要: Introduction (1)Motivation: 当前的行人重识别方法存在如下两个问题: ① 随着网络的深入,行人的细节特征难以捕捉,例如鞋子、墨镜; ② 硬性分割行人区域存在语义的不对齐。 (2)Contribution: 针对问题①,作者提出了Multi-Scale Context-Awa 阅读全文
posted @ 2020-06-21 16:49 橙同学的学习笔记 阅读(575) 评论(0) 推荐(0) 编辑
摘要: Introduction 作者提出了两个问题: ①行人重识别性能的提高需要结合很多复杂的模型吗(如关键点提取等)? ②使用局部检测框是提取局部特征的最好方法吗? 针对第一个问题,作者采用了Inception-V3作为骨干网络,采用交叉熵损失,简单的方法也取得了最佳的效果。针对第二个问题,作者采用了语 阅读全文
posted @ 2020-06-21 16:21 橙同学的学习笔记 阅读(634) 评论(1) 推荐(1) 编辑
摘要: Introduction (1)Motivation: 在匹配过程中,存在行人的不同图片语义信息不对齐、局部遮挡等现象,如下图: (2)Contribution: ① 提出了Spindle Net,包含了多阶段ROI池化框架用于提取不同部位的特征,再通过特征融合网络对不同部位的特征进行融合; ② 设 阅读全文
posted @ 2020-06-21 16:00 橙同学的学习笔记 阅读(922) 评论(0) 推荐(0) 编辑
摘要: Introduction (1)Motivation: 当前的reid存在语义不对齐的问题,如下图: 图(a)显示了不同图片的相同位置对应了行人的不同身体部位;图(b)显示了不同图片呈现的部位不一样,有些是正面有些是背面等。 (2)Contribution: 提出了一个语义对齐网络(Semantic 阅读全文
posted @ 2020-06-21 15:04 橙同学的学习笔记 阅读(953) 评论(0) 推荐(0) 编辑
摘要: Introduction 本文设计了Frame-Guided Region-Aligned model(FGRA)。模型结构包含两个分支:全局分支和局部分支。全局分支用来提取全局的特征,局部分支再细分为区域对齐机制和特征聚合策略。FGRA可以对视频的每一帧的区域进行对齐,在遇到类似下图的姿态、尺寸失 阅读全文
posted @ 2020-06-21 11:53 橙同学的学习笔记 阅读(654) 评论(0) 推荐(0) 编辑