摘要: GINet: Graph Interaction Network for Scene Parsing 本文探讨了如何通过提出图形交互单元(GI unit)和语义上下文丢失(SC-loss)来整合语言知识,以促进图像区域的上下文推理。 一、Introduction ​ 场景解析是一项基础性和挑战性的任 阅读全文
posted @ 2020-10-29 21:09 lixinaa 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 在本文中,研究了轻量级但有效的注意力机制,并提出了 Triplet Attention,一种通过使用三支结构捕获跨维交互来计算权重。 对于输入张量,Triplet Attention通过旋转操作和残差变换建立维度间的依赖关系,并以可忽略的计算开销对通道和空间信息进行编码。该方法既简单又有效,并且可以 阅读全文
posted @ 2020-10-29 18:08 lixinaa 阅读(1093) 评论(0) 推荐(0) 编辑