上一页 1 2 3 4 5 6 7 8 ··· 13 下一页
摘要: 针对行人视频中存在部分帧的局部遮挡,本文提出了Spatio-Temporal Completion netwrok(STCnet)网络,利用其它帧来填补遮挡部位,与Reid模块整合为VRSTC框架。 STCnet的网络如下图。STCnet包含了三个部分:① 空间结构生成器的输入为清除遮挡区域的行人图 阅读全文
posted @ 2020-07-09 16:45 橙同学的学习笔记 阅读(607) 评论(0) 推荐(0) 编辑
摘要: Non-local neural networks(CVPR2018) 传统的卷积神经网络的感受野相对较小,比如3*3、5*5,但对于注意力机制而言,需要更大的感受野来获取全局的注意力得分,Nonlocal的目的就是计算全局感受野的注意力。Nonlocal的计算由相似度计算函数 f 和映射函数 g 阅读全文
posted @ 2020-07-03 14:42 橙同学的学习笔记 阅读(908) 评论(0) 推荐(0) 编辑
摘要: Relation-Aware Global Attention for Person Re-identification(CVPR2020) 本文主要提出了一个Relation-Aware Global Attention(RGA)模块,该模块可以提取空间上不同区域之间的关系向量,从而每个区域的特征能 阅读全文
posted @ 2020-06-22 22:26 橙同学的学习笔记 阅读(1653) 评论(1) 推荐(0) 编辑
摘要: Introduction 本文主要设计了一个自学习的区域对称Reid框架,解决提取的特征区域不对齐的问题。 Our Approach 假设图片集合为,模型采用了三元组损失。 (1)区域对齐表征: 区域映射检测器采用的是一个卷积层。该网络输出K个区域特征,最终concat得到:。该网络效果如下: (2 阅读全文
posted @ 2020-06-21 18:05 橙同学的学习笔记 阅读(430) 评论(0) 推荐(0) 编辑
摘要: Introduction 作者认为之前提出的网络忽视了不同阶段的特征差异,新提出了一个同时考虑时间、语义信息的网络框架。在时间维度采用了注意力机制,之前的方法都是将每一帧看成独立的个体提取注意力得分,但作者考虑了帧与帧之间的关系信息;在语义维度采用了CNN多层特征融合的策略 Methods (1)概 阅读全文
posted @ 2020-06-21 17:48 橙同学的学习笔记 阅读(758) 评论(1) 推荐(0) 编辑
摘要: Introduction 本文主要提出了高效且容易实现的STA框架(Spatial-Temporal Attention)来解决大规模video Reid问题。框架中融合了一些创新元素:帧选取、判别力局部挖掘、不带参特征融合、视频内正则化项。 Proposed Method (1)总体思路: 先通过 阅读全文
posted @ 2020-06-21 17:12 橙同学的学习笔记 阅读(1108) 评论(0) 推荐(0) 编辑
摘要: Introduction (1)Motivation: 当前的行人重识别方法存在如下两个问题: ① 随着网络的深入,行人的细节特征难以捕捉,例如鞋子、墨镜; ② 硬性分割行人区域存在语义的不对齐。 (2)Contribution: 针对问题①,作者提出了Multi-Scale Context-Awa 阅读全文
posted @ 2020-06-21 16:49 橙同学的学习笔记 阅读(558) 评论(0) 推荐(0) 编辑
摘要: Introduction 作者提出了两个问题: ①行人重识别性能的提高需要结合很多复杂的模型吗(如关键点提取等)? ②使用局部检测框是提取局部特征的最好方法吗? 针对第一个问题,作者采用了Inception-V3作为骨干网络,采用交叉熵损失,简单的方法也取得了最佳的效果。针对第二个问题,作者采用了语 阅读全文
posted @ 2020-06-21 16:21 橙同学的学习笔记 阅读(614) 评论(1) 推荐(1) 编辑
摘要: Introduction (1)Motivation: 在匹配过程中,存在行人的不同图片语义信息不对齐、局部遮挡等现象,如下图: (2)Contribution: ① 提出了Spindle Net,包含了多阶段ROI池化框架用于提取不同部位的特征,再通过特征融合网络对不同部位的特征进行融合; ② 设 阅读全文
posted @ 2020-06-21 16:00 橙同学的学习笔记 阅读(887) 评论(0) 推荐(0) 编辑
摘要: Introduction (1)Motivation: 当前的reid存在语义不对齐的问题,如下图: 图(a)显示了不同图片的相同位置对应了行人的不同身体部位;图(b)显示了不同图片呈现的部位不一样,有些是正面有些是背面等。 (2)Contribution: 提出了一个语义对齐网络(Semantic 阅读全文
posted @ 2020-06-21 15:04 橙同学的学习笔记 阅读(935) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 13 下一页