【NLP-2019-SA】解读-Exploiting BERT for End-to-End Aspect-based Sentiment Analysis


  1. 研究背景
  2. 论文思路
  3. 实现方式细节
  4. 实验结果
  5. 附件


1.1 涉及领域,前人工作等




1.2 中心思想

本文依然采用预训练和微调方式进行。目的是优化下游任务效果,不是创新网络结构。本文受到【13】 Li et al. (2019a)对E2E-ABSA的研究启发,它使用一个序列标记器来预测方面的边界和方面的情感,本文为序列标记问题建立了一系列简单但有洞察力的神经基线,并使用微调处理下有任务,整体表现最优。【文中未提到如何提升的】


2.1 框架图和重要部分


主要组成构建有:输入,bertE2E ABSA层(融合下游业务,输出标记的y)

1)这个任务可以表述为一个序列标记问题。 首先给定输入标记序列:



2.2 论文技术特点(对比文献)


对比:Chen et al., 2018; Liu, 2019,处理不稳定行,增加了LN;

对比:Jozefowicz et al. (2015),用GRU替换成LSTM;

对比:Cheng et al., 2016;Lin et al., 2017。吸收self-Attention,引入SAN网络的两种变体:一种是结合残差网络(He et al., 2016),一种是结合transformer层(和bert内的transformer encoder层有相同的结构),文中称为:SAN/TFM

对比:Huang et al., 2015;Lample et al., 2016; Ma and Hovy, 2016,吸收CRF结构,融入BERT结构。


3.1 使用BERT作为嵌入词表示


3.2 下游模型设计

在获得BERT表示后,我们设计了一个神经层,称为E2E-ABSA层如图1,在BERT embedded layer的顶层,用于求解E2E-ABSA的任务。我们研究了E2E-ABSA层的几种不同设计,即线性层、递归神经网络、自我注意网络和条件随机场层




我们添加了额外的层标准化 (Ba et al., 2016),记为LN,计算gate的时候。然后,通过引入一个softmax层,得到了预测结果

Self-Attention Network

其中:SLF-ATT与 Self-Attention 和 Attention的点乘是相同的【12】 (Vaswani et al.,2017)。

另一种变体是transformer层(称为TFM),它和bert内的transformer encoder层有相同的结构。TFM的计算过程如下

其中FFN 指的是 the point-wise feed-forward networks 【12】(Vaswani et al., 2017)。






对比之前的方法(很多是2019年的),性能有了很大提升。具体来说,将探索BERT嵌入组件和不同的神经模模型融合,并在两个基准数据集上进行了大量的实验。实验结果表明BERT-based 模型捕捉基于方面的情绪和它们对过度拟合的健壮性方面有很好表现。


5.1 本文被引用条目:Xin Li, Lidong Bing, Wenxuan Zhang, Wai Lam:Exploiting BERT for End-to-End Aspect-based Sentiment Analysis. W-NUT@EMNLP 2019: 34-41

5.2 论文下载地址:https://arxiv.org/abs/1910.00883v1

5.3 论文的github地址:https://github.com/search?q=Exploiting+BERT+for+End-to-End+Aspect-based+Sentiment+Analysis


