会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Limbo's Blog
博客园
首页
新随笔
联系
订阅
管理
2020年7月17日
Structured Multimodal Attentions for TextVQA
摘要: 原文链接:https://arxiv.org/pdf/2006.00753 Motivation 对于TextVQA任务,作者提出了一种基于结构化的文本-物体图的模型。图中文本和物体作为节点,节点之间的联系作为边。 Pipeline TextVQA任务需要三个步骤:reading,reasoning
阅读全文
posted @ 2020-07-17 01:53 -Limbo-
阅读(527)
评论(0)
推荐(0)
编辑
公告