Chap03知识抽取与挖掘(1)

 

大纲

1.知识抽取任务定义和相关比赛

2.面向结构化数据的知识抽取

3.面向半结构化数据的知识抽取

4.实践展示:基于百科数据的知识抽取

竞赛:MUC ACE KBP SemEval 

 

 

 实体识别与链接

关系抽取:从文本中抽取两个或两个以上实体的语义关系

监督学习——深度学习方法

Pipeline  JointModel

 

 

面向结构化数据的知识抽取

 R2RML  Triples Maps 数据库表映射 视图映射

半结构化数据的知识抽取

百科类知识抽取(维基百科)

WEB网页数据抽取:包装器的生成

 

WEB TABLE:标注为RDF三元组,实体链接将表格中个单元的字符串映射到给定知识库的实体上

实践:基于百科数据的知识抽取——佛学知识图谱

抽取框架 主语融合 宾语融合 对infobox属性进行补全 在线接口

 属性-值抽取    实体清理

 

posted @ 2018-07-24 23:45  投石问路a  Views(487)  Comments(0Edit  收藏  举报