知识图谱
知识图谱定义:
百度词条:
即可视化的描述实体之间的相互联系
维基百科:知识图谱是Google为了提高其搜索引擎的能力而提出的一个知识库。
本质上,知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。
知识图谱表达方式
三元组是一种知识图谱的通用表达方式,即G=(E,R,S)。其中 E 是知识库中的实体集合。R 是知识库中的关系合集。而S如下,S的元素是一个由两个实体和一个关系组成的三元组。
知识图谱体系结构
知识图谱关键技术
知识抽取技术,可以从一些公开的半结构化、非结构化的数据中提取出实体、关系、属性等知识要素。
知识融合,可消除实体、关系、属性等指称项与事实对象之间的歧义,形成高质量的知识库。
知识推理则是在已有的知识库基础上进一步挖掘隐含的知识,从而丰富、扩展知识库。
知识表示形成的综合向量对知识库的构建、推理、融合以及应用均具有重要的意义。
知识图谱应用
智能搜索:用户的查询输入后,搜索引擎不仅仅去寻找关键词,而是首先进行语义的理解。比如,对查询分词之后,对查询的描述进行归一化,从而能够与知识库进行匹配。查询的返回结果,是搜索引擎在知识库中检索相应的实体之后,给出的完整知识体系。
深度问答:问答系统是信息检索系统的一种高级形式,能够以准确简洁的自然语言为用户提供问题的解答。多数问答系统更倾向于将给定的问题分解为多个小的问题,然后逐一去知识库中抽取匹配的答案,并自动检测其在时间与空间上的吻合度等,最后将答案进行合并,以直观的方式展现给用户。
苹果的智能语音助手 Siri 能够为用户提供回答、介绍等服务,就是引入了知识图谱的结果。知识图谱使得机器与人的交互,看起来更智能。还有聊天机器人等等
https://blog.csdn.net/u010159842/article/details/82190316?utm_source=blogxgwz1
社交网络
Facebook 于 2013 年推出了 Graph Search 产品,其核心技术就是通过知识图谱将人、
地点、事情等联系在一起,并以直观的方式支持精确的自然语言查询,例如输入查询式:“我朋友喜欢的餐厅”“住在纽约并且喜欢篮球和中国电影的朋友”等,知识图谱会帮助用户在庞大的社交网络中
找到与自己最具相关性的人、照片、地点和兴趣等。Graph Search 提供的上述服务贴近个人的生活,满足了用户发现知识以及寻找最具相关性的人的需求。
大规模知识库(知识图谱应用)
开放链接知识库:
在这个领域中,四个大规模知识库处于绝对的核心地位:
1) Freebase
2) Wikidata
3) DBpedia
4) YAGO
垂直行业知识库:
描述特定行业的知识库,有特定行业的数据构建而成,如豆瓣,IMDB,MusicBrainz。其中还有一个开源知识库:ConceptNet:其包含大量计算机可了解的世界的信息,用来使计算机更好的理解人类的意图。
关于知识图谱的几个问题
1、图数据库是必须的么?
不是,如果对知识图谱不是很理解,可以尝试使用图数据库,但是缺点是容易被框架束缚
2.知识图谱人工的占比是?
自动化的图谱能力不足,人工占比达到了80%。
3.知识图谱实体来源?
实体的来源首先是靠业务定义,其次很大部分是靠爬虫
4.搞一个知识图谱大概要多少人?
至少有一个后台开发,一个好的前端,一个懂知识图谱的产品设计后台和数据架构,运营是必须的,但是人不能太多,太多人一些细节的地方会协调困难,2~5个人。一个爬虫厉害的,然后一个到两个可以搞搞算法,算下来10个人左右。
5.知识图谱最大的问题是什么?
成本是最大的问题,google知识图谱的成本是一条三元组0.8美分(真实性未知)
References
1.知乎文章:什么是知识图谱?
2.电子科技大学学报,徐增林等,知识图谱技术综述
3.清华知识图谱报告:人工智能之知识图谱
4.知乎文章:为什么需要知识图谱?什么是知识图谱?——KG的前世今生
5.知乎文章:知识图谱-从入门到跑路
6.知识图谱是什么?