摘要:
NLP 领域首次将 attention 机制应用到 CNN 中,CNN 擅长提取输入的鲁棒和抽象特征。这项工作提出了一个基于注意力的卷积神经网络ABCNN,该网络可以通过考虑两个句子之间的相互依赖性来建模一个句子对。 另外,ABCNN 是一种通用体系结构,可以处理各种各样的句子对建模任务。 1. B 阅读全文
摘要:
Abstract 本文提出的 multiway attention networks 在 matching-aggregation 框架下使用了多个 attention 函数匹配句子对。聚合每个 attention 函数的匹配信息形成最终的表示用于预测。实验结果表明该方法提高了 Quora Ques 阅读全文