Atitti 知识图谱构建方法attilax 总结

Atitti 知识图谱构建方法attilax 总结

 

1.1. 知识图谱schema构建(体系化)1

1.2. 纵向垂直拓展(向上抽象,向下属性拓展)2

1.3. 横向拓展2

1.4. 网拓展2

1.5. a) 推理2

1.6. c) 相关实体挖掘 2

2. other3

2.1. 面向站点的包装器(Site-specificWrapper3

2.2. 5. 知识图谱的更新和维护3

 

a) 实体对齐  实体对齐(Object Alignment

 

各大搜索引擎公司普遍采用的方法是聚类。聚类的关键在于定义合适的相似度度量。这些相似度度量遵循如下观察

 

1.1. 知识图谱schema构建(体系化)

在之前的技术点介绍中,大部分篇幅均在介绍知识图谱中数据层(Data Level)的构建,而没有过多涉及模式层(Schema Level)

c) 不一致性的解决

 

 

 

 

1.2. 纵向垂直拓展(向上抽象,向下属性拓展)

1.3. 横向拓展

1.4. 网拓展

 

1.5. a) 推理

推理(Reasoning或Inference)被广泛用于发现隐含知识。推理功能一般通过可扩展的规则引擎来完成。知识图谱上的规则一般涉及两大类。一类是针对属性的,即通过数值计算来获取其属性值。例如:知识图谱中包含某人的出生年月,我们可以通过当前日期减去其出生年月获取其年龄。这类规则对于那些属性值随时间或其他因素发生改变的情况特别有用。另一类是针对关系的,即通过(链式)规则发现实体间的隐含关系。例如,我们可以定义规定:岳父是妻子的父亲。利用这条规则,当已知姚明的妻子(叶莉)和叶莉的父亲(叶发)时,可以推出姚明的岳父是叶发

1.6. c) 相关实体挖掘

 

2. other

2.1. 面向站点的包装器(Site-specificWrapper

 

能通过信息框获得AVP的实体非常稀少,大量属性-值对隐含在一些列表或表格中,一个切实可行的做法是构建面向站点的包装器(Site-specificWrapper)。这

 

b) 结构化站点包装器的维护

站点的更新常常会导致原有模式失效。搜索引擎会定期检查站点是否存在更新。当检测到现有页面(原先已爬取)发生了变化,搜索引擎会检查这些页面的变化量,同时使用最新的站点包装器进行AVP抽取。如果变化量超过事先设定的阈值且抽取结果与原先标注的答案差别较大,则表明现有的站点包装器失效了。在这种情况下,需要对最新的页面进行重新标注并学习新的模式,从而构建更新的包装器

 

2.2. 5. 知识图谱的更新和维护

知识图谱技术原理介绍 _ 36大数据.html

 

 

作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 

汉字名:艾提拉(艾龙)   EMAIL:1466519819@qq.com

转载请注明来源: http://www.cnblogs.com/attilax/

Atiend

 

posted @ 2016-10-25 20:39  attilaxAti  阅读(650)  评论(0编辑  收藏  举报