知识图谱的构建思路
最近需要构建一个粮食的知识图谱,刚开始接这个任务的时候也不知道知识图谱是什么东西,后来慢慢去了解学习,逐渐有了一些思路。
想必点进来的人都知道了知识图谱是什么东西,我再简单叙述一下:知识图谱是用图的结构将很多个知识通过他们的联系连接起来,在此基础上可以做信息挖掘、问答系统等。
但是构建了一个图谱后有什么直接的用处呢?那就是让人们清楚的看到事物之间的联系,某个事物与之直接相关的东西有什么。但是数据库中的关系图谱怎么才能让别人直观地看到呢?那就需要做成一个网站,想了解粮食领域的人在这个网站上就可以看到粮食事物之间的关系了。
所以我们的思路是:将粮食领域的知识做成一个图谱,存放到Neo4j图数据库中,然后做一个可视化网站实现图谱的可视化。图谱的数据来源是粮食大辞典,图谱中知识的关系通过deepdive工具提取;图谱用Neo4j图数据库进行存储;网站通过D3.js的force图实现关系可视化。
涉及到的东西:
知识图谱的概念
NLP文本处理(python脚本、shell脚本)
Deepdive工具使用
网站搭建
D3.js前端库的使用
Neo4j图数据库使用
可能会用到:
Docker
以后会逐步将图谱构建的整个过程写下来与大家一起学习。