Chap03知识抽取与挖掘(1)
大纲
1.知识抽取任务定义和相关比赛
2.面向结构化数据的知识抽取
3.面向半结构化数据的知识抽取
4.实践展示:基于百科数据的知识抽取
竞赛:MUC ACE KBP SemEval
实体识别与链接
关系抽取:从文本中抽取两个或两个以上实体的语义关系
监督学习——深度学习方法
Pipeline JointModel
面向结构化数据的知识抽取
R2RML Triples Maps 数据库表映射 视图映射
半结构化数据的知识抽取
百科类知识抽取(维基百科)
WEB网页数据抽取:包装器的生成
WEB TABLE:标注为RDF三元组,实体链接将表格中个单元的字符串映射到给定知识库的实体上
实践:基于百科数据的知识抽取——佛学知识图谱
抽取框架 主语融合 宾语融合 对infobox属性进行补全 在线接口
属性-值抽取 实体清理