摘要: See, Hear and Read: Deep Aligned Representations 本paper提出了可以在三种自然模态(视觉,声音,语言)下进行学习的深度判断特征表达,使用Deep Conv Network来进行对齐式的表达学习。 本paper使用的dataset: Cross-Mo 阅读全文
posted @ 2017-11-15 11:27 zhang--yd 阅读(628) 评论(0) 推荐(0) 编辑