论文阅读笔记（四十九）【CVPR2020】：Hi-CMD: Hierarchical Cross-Modality Disentanglement for Visible-Infrared Person Re-Identiﬁcation

Introduction

本文主要解决RGB-IR跨模态匹配问题。贡献主要有三部分组成：

① 提出了 Hierarchical Cross-Modality Disentanglement（Hi-CMD）方法，该模块的目的是排除姿态、光照这些冗余特征（ID-excluded）的影响，提取出更加有判别力的体态、衣着等信息（ID-discriminative）。

② 该方法包含了两个核心模块：ID-PIG 网络和 HFL 模块。ID-preserving Person Image Generation（ID-PIG）网络，在保证行人ID不变的条件下，改变它的姿态、光照属性。Hierarchical Feature learning（HFL）模块用于确保编码器能够提取具有判别力的特征，对姿态、光照变化具有鲁棒性。

Method

网络的结构图如下。

（1）ID-PIG网络：

ID-PIG 网络采用二阶层次化。第一层次采用原型编码器和属性编码器，原型编码器对图像中行人的体态等外貌特征进行编码，属性编码器对衣服风格、姿态、光照这类可变属性进行编码。第二层次属性编码划分成三类，具体为：风格属性编码、光照属性编码、姿态属性编码。这三种编码分别表示：风格属性是对行人的衣服结构进行编码；光照属性编码对应模态之间的差异，把不同RGB、IR摄像头的视觉差异定义为光照属性；姿态属性对应模态内的差异，理解为同一个模态内行人的多种姿态。