随笔分类 -  ImageCaptioning

摘要:coco中image_caption的数据格式,对应的文件captions_train2014.json和captions_val2014.json 1.使用json加载文件 对应的解析代码如下: import json if __name__=='__main__': base_path = r' 阅读全文
posted @ 2019-12-25 21:17 suwenyuan 阅读(3701) 评论(0) 推荐(0) 编辑
摘要:1. SemStyle: Learning to Generate Stylised Image Captions using Unaligned Text(2018 CVPR) 主要研究方向:本论文主要是做语言风格,就是对同一张图片有多种描述。 2. Neural Baby Talk(2018 c 阅读全文
posted @ 2019-12-22 16:24 suwenyuan 阅读(461) 评论(0) 推荐(0) 编辑
摘要:1. SCA-CNN: Spatial and Channel-wise Attention in Convolutional Networks for Image Captioning(2017 CVPR) 主要研究方向:大多数现有的基于注意力的图像字幕模型只考虑了空间特征,本文是对同一层的fea 阅读全文
posted @ 2019-12-22 16:19 suwenyuan 阅读(199) 评论(0) 推荐(0) 编辑
摘要:1.Show and Tell: A Neural Image Caption Generator Google团队的成果 整体处理流程: 1)通过CNN提取到图片的特征,简称feature。 2)而后将feature输入到LSTM中,生成第一个词S0 3)而后每个词Si的生成只需要上一个生成的词S 阅读全文
posted @ 2019-12-09 17:16 suwenyuan 阅读(199) 评论(0) 推荐(0) 编辑
摘要:1.MSCap: Multi-Style Image Captioning with Unpaired Stylized Text 生成多种风格的caption 当前的image captioning systems的问题:生成的caption是很相对很中性,不能体现人类语言风格的多种多样 面临的困 阅读全文
posted @ 2019-12-04 14:54 suwenyuan 阅读(761) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示