知识图谱导论复习提纲
KG
1.知识图谱的定义以及知识图谱的特点?
定义
知识图谱就是一种用于表示知识的图结构模型,其中节点表示实体,边表示实体之间的关系,它以图的形式将知识组织起来,通过节点和边的连接,形成一个结构化的知识表示系统。
特点
- 结构化表示:知识图谱将知识以三元组的形式进行结构化表示,使得知识的存储和查询变得高效;
- 语义丰富:知识图谱不仅包含实体及其属性,也可以包括属性、类别等丰富的语义信息;
- 可扩展性:知识图谱可以不断拓展,新增的知识可以很容易地融入现有知识图谱;
- 可推理性:知识图谱支持各种推理操作,如演绎推理、归纳推理、类比推理等,以发现隐含的知识和关系。
2.知识图谱的表示方式,以及每种表示方式的特点和应用场景?
符号表示
- 属性图:表达方式灵活,便于表示多元关系;但不支持符号逻辑推理。适用于查询计算方面。
- RDF图:多个三元组头尾相连形成,便于表达关于客观世界的逻辑描述或客观事实。适用于处理语义推理和逻辑推理问题。
- OWL本体语言:有更多的语义表达构件。适用于三元组无法满足语义表示需要时。
向量表示
通过向量化表示方法将尸体和关系映射到连续向量空间中,并利用向量、矩阵或张量之间的计算,实现高效的推理计算。
适用于需要处理大规模数据和复杂模式识别的场景。
3.知识图谱的存储方式有哪些?
- 基于关系数据库的知识图谱存储
- 基于三元组表的图谱存储:利用关系数据库,建立一张包含(Subject, Predicate, Object)三列的表,然后把所有三元组存入其中。
- 基于属性表的图谱存储:以实体类型为中心,把属于同一个实体类型的属性组织为一个表。
- 基于垂直划分表的图谱存储:对三元组按属性分组,并为每个属性在关系数据库中建立一个包含(Subject, Object)两列的表。
- 基于全索引结构的知识图谱存储:建立增加多个方面优化手段的三元组列表。
- 基于原生图数据库的知识图谱存储:基于节点存储文件和关系边存储文件对图进行遍历,同时对属性数据进行检索。
4.知识抽取的相关定义,如何进行知识抽取?知识抽取的关键步骤有哪些?在知识图谱构建中起到了哪些作用?
定义
知识抽取是从自然语言文本、结构化数据或多模态数据中自动识别和提取知识单元的过程。
关键步骤
- 实体识别:识别文本中具有特定意义的实体,将其分类为预定义的类别
- 关系抽取:识别实体之间的关系,将其表示为三元组
- 属性补全:从文本中识别和提取实体的属性信息,一般分为抽取式和生成式
- 概念抽取:识别文本中的概念和分类信息,并构建概念层次结构
- 事件抽取:识别和抽取文本中描述的事件及其要素
作用
-
实体识别:是实现关系抽取、事件抽取等更复杂知识结构抽取的前提条件
-
关系抽取:从文本中获取知识图谱三元组的重要手段,常用于知识图谱的补全
-
属性补全:对实体拥有的属性及属性值进行补全
-
概念抽取:可以帮助自然语言理解,帮助理解搜索意图
-
事件抽取:可以构建知识图谱,也可以利用这些结构化事件知识进行下游应用
5.知识推理有哪些主要的类型?每种类型的主要应用是哪些?
- 演绎推理:基于明确的规则和逻辑进行推理,从已知的事实和规则中推导出新的事实。应用:利用本体公理和规则进行推理,如通过OWL的规则推断新类别;基于规则语言如Datalog进行推理,如通过定义规则集完成复杂逻辑推理任务
- 归纳推理:通过对大量数据进行分析,发现模式和规律,从而进行推理和预测。应用:统计学习的PRA算法,利用图结构中的路径信息进行关系预测;规则学习的AMIE,通过分析大规模知识图谱中的事实性知识,自动学习出规则并推理
- 溯因推理:从观察到的现象出发,结合已有的规则和知识推测可能出现的原因。应用:在医学、故障诊断领域通过观察症状推测病因或故障原因;在事件检测和预测中利用溯因推理预测未来可能发生的事
- 类比推理:通过比较两个对象的相似性,从一个对象的属性推测另一个对象的属性。应用:在推荐系统中,通过类比推理为用户推荐相似的商品;在少样本学习中通过类比推理识别新类别。
6.知识融合的定义是什么?知识融合有哪些主要类型?
定义
是通过映射的方式建立异构的实例或本题之间关联,进而实现不同知识图谱之间的互联互通促进数据操作性的知识图谱预处理步骤
类型
-
概念层融合——本体匹配
本体是领域知识规范的抽象和描述,是表达、共享、重用知识的方法。本体匹配旨在发现源本体和目标本体之间的映射单元的几何。
基于术语匹配的本体层融合、基于结构特征的本体层融合、基于知识分块的大规模本体匹配
-
实例层融合——实体对齐
侧重于发现指代知识图谱中相同对象的不同实例。解决了实例层面的异构性问题,确保不同数据源中给的相同实体能够正确匹配和融合。
基于等价关系推理、基于相似度计算、基于表示学习的实体对齐
7.知识问答的定义是什么?特点有哪些?有哪些主要途径?每一种途径有哪些实现方式?
定义
知识问答是以结构化的知识库为问答语料,能够以来知识图谱中的实体关联关系提供并扩展精准答案的问答场景
特点
答案更精准、易拓展、可以处理复杂的查询
途径
基于问句模板的知识图谱问答(模板生成——构建查询子图——对齐——排序)
基于语义解析的知识图谱问答(短语检测——实体链接——概念匹配——关系抽取与分类——逻辑表达式生成)
基于检索排序的知识图谱问答(定位实体——消歧——排序)
基于深度学习的知识图谱问答(利用深度学习对某个模块进行改进、基于深度学习的端到端模型)