MultimodalSum学习笔记

自监督的多模态观点摘要

Self-Supervised Multimodal Opinion Summarization

韩国一家游戏公司的工作，ncsoft

2021.5，ACL

多模态：文本、图像、表格，分别建立模型

问题定义

\[h_{text} = BART_{enc}(D_{-�j}), d_{j} = BART_{dec}(h_{text}), \]

\[h_{img} = ResNet101(I)W_{img}, \]

\[f_{k} =ReLU([n_{k};v_{k}]W_{f} +b_{f}), h_{table} = F W_{table}, \]

posted on 2021-06-03 15:47 宋岳庭阅读(188) 评论(0) 编辑收藏举报