开放领域关系抽取文献综述
关系抽取分类:
(一)限定域关系抽取
- pipeline方式,先做实体识别再接关系分类任务
- 实体识别+关系分类联合模型
- 远程监督关系抽取(利用图谱三元组回标语料)
(二)开放领域关系抽取
1.基于语法规则+依存句法分析树
A Syntax-based System for Chinese Open Relation Extraction
Chinese Open Relation Extraction and Knowledge Base Establishment,
2.半监督bootstrap迭代式抽取
Open Language Learning for Information Extraction
3.基于序列标注神经网络模型
Supervised Open Information extraction
Hybrid Neural Tagging Model for Open Relation Extraction
这里重点介绍基于序列标注的模型
Supervised Open Information extraction
- 将开放关系抽取视为一个序列标注任务
- 从QA-SRL问答语义角色标注任务中构建出训练集
数据格式:
模型结构:
输入融合了谓词的特征
预测结果累乘积作为三元组的置信度
Hybrid Neural Tagging Model for Open Relation Extraction
- 将OIE当成序列标注任务,提出一种自动构建训练数据的方法(多个已有的开源OIE系统的抽取结果,取置信度较高的结果)
- 提出一种混合的神经网络模型来进行实体及关系的抽取
- 实现双重感知机制(局部的Attention和全局的卷积)
可重叠的标注体系(同一个词可以有不同标签)
模型结构:
Local-aware Attention
三年程序员,专注语音文本分析、大数据挖掘、预训练模型及知识图谱相关技术的探索