A Joint Neural Model for Information Extraction with Global Features
摘要
本文提出基于全局特征的信息联合抽取框架ONEIE,实现端到端的信息抽取主要包括以下四步:
- 对于给定的句子进行单词嵌入表示
- 识别出entity mention和event trigger并作为节点
- 计算出所有节点和边的标签得分
- 利用束解码器搜索全局优化图,主要关注跨子任务和跨实例的全局特征
问题
传统信息联合抽取仅仅使用多个独立分类器,并没有考虑全局约束,因此会导致错误出现
创新
本文主要创新点在于把entity和trigger作为节点,relation和role作为边构图,之后根据手工设计的全局特征对构图过程进行约束,同时利用束搜索保证可行的时间复杂度,最终获得可行解
模型
Encoding
使用BERT编码器,如果一个单词分成多个词片,对多个词片求平均作为单词表示(本文使用BERT的倒数第三层输出)
Identification
识别句子中的entity mentions和event triggers作为图中的节点,识别过程采用FFN+CRF分别实现对entity mentions和event triggers的序列标注解码
Classification
利用FFN对任意两个节点计算标签得分
Global Features
Cross-subtask interactions
主要考虑entities, relations和events之间的约束关系
Cross-instance Interactions
主要考虑多个event和relation实例之间的约束关系
通过手动构建特征,得到以下特征模板,再具体化到不同的实例
计算得到特征向量,进一步计算出特征得分
Decoding
迭代进行以下过程:选择节点,选择边
实验
结论
本文是一篇值得follow的工作,可以考虑如何减少手动构建特征,以及是否可以把关系构建成节点(实现多元关系抽取)