Loading

A Joint Neural Model for Information Extraction with Global Features

image.png

摘要

本文提出基于全局特征的信息联合抽取框架ONEIE,实现端到端的信息抽取主要包括以下四步:

  1. 对于给定的句子进行单词嵌入表示
  2. 识别出entity mentionevent trigger并作为节点
  3. 计算出所有节点和边的标签得分
  4. 利用束解码器搜索全局优化图,主要关注跨子任务和跨实例的全局特征

问题

传统信息联合抽取仅仅使用多个独立分类器,并没有考虑全局约束,因此会导致错误出现
image.png

创新

本文主要创新点在于把entitytrigger作为节点,relationrole作为边构图,之后根据手工设计的全局特征对构图过程进行约束,同时利用束搜索保证可行的时间复杂度,最终获得可行解

模型

image.png

Encoding

使用BERT编码器,如果一个单词分成多个词片,对多个词片求平均作为单词表示(本文使用BERT的倒数第三层输出)

Identification

识别句子中的entity mentionsevent triggers作为图中的节点,识别过程采用FFN+CRF分别实现对entity mentionsevent triggers的序列标注解码

Classification

利用FFN对任意两个节点计算标签得分

Global Features

Cross-subtask interactions

主要考虑entities, relations和events之间的约束关系

Cross-instance Interactions

主要考虑多个event和relation实例之间的约束关系

image.png
通过手动构建特征,得到以下特征模板,再具体化到不同的实例
image.png
计算得到特征向量image.png,进一步计算出特征得分

Decoding

迭代进行以下过程:选择节点,选择边
image.png

实验

image.png

结论

本文是一篇值得follow的工作,可以考虑如何减少手动构建特征,以及是否可以把关系构建成节点(实现多元关系抽取)

posted @ 2020-11-18 16:49  金砖丶  阅读(612)  评论(0)    收藏  举报