知识图谱的学习-1-datawhale
第一次学习主要学习的是概念和基础,这回的学习爱目标主要是知识图谱的基本概念和知识图谱的可视化图数据库的存储。
1. 什么是知识图谱
知识图谱是由节点和边组成的语义网络,其中每个节点表示一个实体,即现实世界中的事物比如人、地名、概念、药物、公司等。其中边用来表示不同实体间的某种联系,比如a是b的朋友,等等。
2. 知识图谱的构建过程
其中主要涉及如下几种NLP技术,即:
- 实体命名识别(Name Entity Recognition):即从文本中提取实体,将文本映射到实体,并做分类/打标签
- 关系抽取(Relation Extraction):从文本中抽取实体间的关系
- 实体统一(Entity Resolution):将同意实体的不同名称统一起来
- 指代消解(Coreference Resolution):将每一个代词映射到相应的实体
3. 知识图谱的存储
主要分为两种方式,即:
- 基于RDF的存储:基于三元组的方式来存储数据,但是不能包含属性信息,即实体的补充信息
- 基于图数据库的存储:允许存储实体、关系间的属性信息