Python系列:python在线爬取数据导入Neo4j创建知识图谱




python在线爬取数据导入Neo4j创建知识图谱

近期学习Neo4j,以豆瓣top250数据为研究对象,实现python在线爬取数据写入Neo4j创建知识图谱,下文详细介绍步骤。

1、知识图谱设计

通过分析网页,爬取网页可以得到movie、country、type、time、director、actor、score等信息,此处我将movie、country、type、time、director、actor作为节点,而score作为movie的属性,网上有很多地方讲到只将movie、director、actor作为节点,其余均作为movie的属性,这个我之前也做过,但最后的效果并不是我想要的,至于什么效果,后文会提到。节点和关系设计如下图。
在这里插入图片描述
在这里插入图片描述

posted @ 2024-09-06 14:02  坦笑&&life  阅读(46)  评论(0编辑  收藏  举报  来源