2020 年 7月 17 日随笔档案 - -Limbo-

2020年7月17日

Structured Multimodal Attentions for TextVQA

摘要：原文链接：https://arxiv.org/pdf/2006.00753 Motivation 对于TextVQA任务，作者提出了一种基于结构化的文本-物体图的模型。图中文本和物体作为节点，节点之间的联系作为边。 Pipeline TextVQA任务需要三个步骤：reading，reasoning 阅读全文

posted @ 2020-07-17 01:53 -Limbo- 阅读(527) 评论(0) 推荐(0) 编辑

Limbo's Blog

公告