摘要: Introduction 作者认为现有方法没有考虑跨模态之间局部与全局的关系,比如下图的一些情况。 为此作者提出了Multi-granularity Image-text Alignment (MIA) 方法实现global-global、global-local、local-local三种层面的对 阅读全文
posted @ 2021-01-23 20:15 橙同学的学习笔记 阅读(394) 评论(0) 推荐(0) 编辑