摘要: Introduction 本文提出了一种基于文本的行人定位并检索的系统,即:给定一个包含多个行人的大场景图像,以及一个行人的对应描述,需要在图像中对描述的行人进行定位以及检索。 Prposed Method 1) 视觉特征: 作者采用Faster R-CNN进行行人检测,检测出的行人候选区域调整为 阅读全文
posted @ 2021-07-02 17:08 橙同学的学习笔记 阅读(327) 评论(0) 推荐(0) 编辑
摘要: Introduction 作者认为,大部分现有方法都将图文特征平等地投影到相同的特征空间,但现实中图文信息并不完全等价。比如,图像中包含的光照条件、图像分辨率、视角、背景等信息很少会被文字描述到,如下图所示。 此外,两个相似行人之间的一些关键差异信息很容易被干扰因素影响,如下图所示,(a)中视觉特征 阅读全文
posted @ 2021-06-25 09:47 橙同学的学习笔记 阅读(612) 评论(1) 推荐(0) 编辑
摘要: Introduction Person search任务的目的是:定位并识别目标行人。其包含了两个子任务:行人检测和行人重识别。现有方法主要分为两类:二步检索框架和一步二阶段检索框架。前者先通过目标检测算法定位行人位置,再裁切出行人进行重识别,这类方法比较耗时;后者实现了两种任务的端到端学习,通过R 阅读全文
posted @ 2021-06-04 20:35 橙同学的学习笔记 阅读(880) 评论(0) 推荐(0) 编辑
摘要: Introduction 当下众多方法采用双流网络结构来解决RGB-IR跨模态问题。作者通过研究发现,BN层在学习模态分布中发挥着至关重要的作用。对于每一个BN都要设置是否为分离。ResNet包含了53个BN层,因此存在2^53种可能性。作者为此设计了CM-NAS网络来自动搜索最佳的组合。 Meth 阅读全文
posted @ 2021-05-31 17:32 橙同学的学习笔记 阅读(810) 评论(0) 推荐(0) 编辑
摘要: Introduction 当前ReID方法在检索时速度受到gallery规模和特征编码长度影响:相比之下,计数排序的时间复杂度比快速排序更小;汉明距离的时间复杂度比欧氏距离更小。现有一些快速ReID的方法采用了哈希的思想,采用二进制特征编码,而不是实数编码。而汉明距离对应计算的为二进制特征编码。然而 阅读全文
posted @ 2021-05-27 16:51 橙同学的学习笔记 阅读(581) 评论(0) 推荐(0) 编辑
摘要: Introduction 对HA-CNN的改进版。 Methods (1) 训练策略: ① Weighted triplet loss with Soft margin: 最初的triplet loss为: Batch-hard triplet loss选择了难样本对进行损失计算: batch-ha 阅读全文
posted @ 2021-05-24 14:57 橙同学的学习笔记 阅读(547) 评论(0) 推荐(0) 编辑
摘要: Introduction 本文是一个轻量级的reid网络框架,贡献具体如下: 1) 作者设计了多粒度注意力选择(Multi-granularity attention selection)和特征表示(feature representation)的联合学习框架; 2) 提出了一个Harmouious 阅读全文
posted @ 2021-05-21 16:16 橙同学的学习笔记 阅读(501) 评论(0) 推荐(0) 编辑
摘要: Introduction 现有主流方法采用了复杂的骨干网络,参数量大,处理速度慢。因此本文的目标是构建一个计算效率更高、更适合ReID的轻量级网络。 Neural Architecture Search(NAS)被利用来搜索轻量高效的网络,但一般需要非常高昂的计算资源,Differentiable 阅读全文
posted @ 2021-05-13 16:55 橙同学的学习笔记 阅读(1407) 评论(0) 推荐(0) 编辑
摘要: Introduction 在空间维度上,现有video reid方法局限于把所有帧在相同分辨率下进行特征提取,造成了特征冗余,如图(a)。 在时间维度上,现有方法要么采用long-term要么采用short-term,也有一些方法同时考虑了两者,却赋予两者相同的权重来融合。但如图(b)所示,当存在遮 阅读全文
posted @ 2021-05-13 09:28 橙同学的学习笔记 阅读(1248) 评论(0) 推荐(0) 编辑
摘要: 1. Pose-Guided Multi-Granularity Attention Network for Text-Based Person Search【AAAI2020】 (1) 视觉特征提取: 作者认为人体姿态信息可以引导局部特征的匹配,因此引入了2017年提出的PAF模型进行姿态估计,提 阅读全文
posted @ 2021-04-11 21:02 橙同学的学习笔记 阅读(948) 评论(0) 推荐(0) 编辑