摘要: 1. Abstarct目前大多数的image caption的模型都严重地依赖成对的图片—语句数据集,但获得他们代价较高,因此在本篇论文中,作者第一次尝试了无监督模型。该模型需要一个图像集、一个语料库和一个视觉检测器。同时,因为现有的语料库大多用于语言研究,与图片相关性不大,因此作者爬取了一个范围大 阅读全文
posted @ 2022-03-27 10:35 EkkoMay 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 当前方法存在的问题 首先,注意模型大多是单词级的局部注意,缺乏对图像整体的掌控。其次,模型在训练和测试之间存在“暴露偏差”。最后,存在训练损失和评估指标不匹配的问题。模型在训练时通常使用交叉熵损失,而在测试时一般使用BLEU、METEOR、ROUGE-L、CLDEr这样的指标来评估生成语句的质量。 阅读全文
posted @ 2022-03-27 10:23 EkkoMay 阅读(92) 评论(0) 推荐(0) 编辑