论文阅读笔记(七)【TIP2018】:Video-Based Person Re-Identification by Simultaneously Learning Intra-Video and Inter-Video Distance Metrics
是由一篇 IJCAI2016 扩的期刊.
该篇会议论文的阅读笔记【传送门】
期刊扩充的部分:P-SI2DL
1、问题描述:
在会议论文中介绍的SI2DL方法采用了视频三元组作为视频关系(是否匹配)的逻辑结构,即:<i, j, p> 满足 xi 和 xj 的距离小于 xi 和 xp 的距离. 但这个忽视了部分特殊情况,如下图:
上图演示了SI2DL通过距离矩阵将三元组之间的距离关系展现出来,(a)中只有 <i, j, p> 满足了三元组要求(即存在一个样本闯入了相匹配的视频样本距离领域之间). 矩阵变换后,xi 和 xj 的距离小于 xi 和 xp 的距离,但实际并没有很高的区分度.
2、改进方法:pair separation based SI2DL (P-SI2DL)
目标函数:
其中聚合项 (f) 没有变化,但区分度项进行了优化:
其中:
3、优化算法:
(1)优化公式的展开:
其中 M1、...、M6 分别为:
.
(2)合并项:
(3)引入A、B优化(why?):