论文阅读笔记(六十六)【ICCV2019】:Adversarial Representation Learning for Text-to-Image Matching

Methodology

作者提出TIMAM (Text-Image Modality Adversarial Matching)方法,比较简洁明了,具体包含三个部分:

(1)特征提取器:

文本采用BERT提取词向量,再输入LSTM提取文本特征;

图像采用ResNet101提取特征。

(2)采用ID损失(CMPC换了名)和跨模态投影损失(CMPM),来拉近相同ID的特征的分布。

(3)采用对抗损失来学习自适应模态的特征表示。

 

Experiments

posted @ 2021-03-14 15:27  橙同学的学习笔记  阅读(576)  评论(0编辑  收藏  举报