Neo4j 导入CSV工具导入
第 2 步:打开数据导入器
在 Web 浏览器窗口中,打开Neo4j 数据导入器
你应该看到这个:
自本课程发布以来,Neo4j 数据导入器可能会发生变化。您将在 UI 中看到细微差别。
如果您在 Graph Model 窗格中看到节点和关系,您应该选择所有这些并删除它们,以便您可以从新映射开始。
第 3 步:将 CSV 文件加载到数据导入器中
在左侧文件面板中,添加您在步骤 1中解压缩的五个 CSV 文件。
添加它们后,您应该会看到:
加载它们后,请花几分钟时间查看用于每个文件的标题。
第 4 步:定义人员节点映射
-
单击图形模型窗格中的添加节点图标。
-
在右侧的映射详细信息窗格中:
-
输入Person作为标签。
-
选择persons.csv文件。
-
在属性下,单击从文件添加。
-
全选。
-
点击确认。
-
-
请注意,某些属性名称与图形数据模型不匹配。修改它们如下:
-
person_tmdbId -→ tmdbId
-
person_imdbId -→ imdbId
-
person_poster -→ 海报
-
person_url -→ 网址
-
-
选择tmdbId作为将用于这些 Person 节点的唯一 ID。
-
您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:
第 5 步:定义电影节点映射
-
单击图形模型窗格中的添加节点图标。
-
在右侧的映射详细信息窗格中:
-
输入电影作为标签。
-
选择movies.csv文件。
-
在属性下,单击从文件添加。
-
全选。
-
点击确认。
-
-
请注意,某些属性名称与图形数据模型不匹配。修改它们如下:
-
movie_tmdbId -→ tmdbId
-
movie_imdbId -→ imdbId
-
movie_poster -→ 海报
-
电影网址 -→ 网址
-
-
另请注意,某些属性类型与我们的数据模型定义的不匹配。修改属性类型如下:
-
预算 -→ 整数
-
imdbRating -→ 浮动
-
imdbVotes -→ 整数
-
收入 -→ 整数
-
运行时 -→ 整数
-
年份 -→ 整数
-
-
选择movieId作为将用于这些电影节点的唯一 ID。请注意,我们选择了 movieID 作为唯一 ID,因为在我们定义与电影的关系时,它会在其他文件中使用。
-
您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:
第 6 步:定义用户节点映射
-
单击图形模型窗格中的添加节点图标。
-
在右侧的映射详细信息窗格中:
-
输入用户作为标签。
-
选择rating.csv文件。
-
在属性下,单击从文件添加。
-
仅选择userId和name属性。稍后将使用其他值来定义关系。
-
点击确认。
-
-
选择userId作为将用于这些 Person 节点的唯一 ID。
-
您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:
第 7 步:定义 DIRECTED 关系映射
-
在 Graph Model 窗格中,将Person节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。
-
在右侧的映射详细信息窗格中:
-
输入DIRECTED作为类型。
-
选择directed.csv文件。
-
在 ID 部分:
-
选择 person_tmdbId 作为人员 ID。
-
选择movieId 作为电影ID。
-
-
角色的directed.csv文件中没有字段,因此您不会从此文件中导入角色属性,因此您已完成。
您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:
步骤 8:定义 ACTED_IN 关系映射
-
在 Graph Model 窗格中,将Person节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。
-
在右侧的映射详细信息窗格中:
-
输入ACTED_IN作为类型。
-
选择acted_in.csv文件。
-
在 ID 部分:
-
选择 person_tmdbId 作为人员 ID。
-
选择movieId 作为电影ID。
-
-
在“属性”部分中,选择角色属性。
-
您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:
第 9 步:定义 RATED 关系映射
请注意,此映射将重用您用于定义用户节点的同一文件。
-
在 Graph Model 窗格中,将User节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。
-
在右侧的映射详细信息窗格中:
-
输入RATED作为类型。
-
选择rating.csv文件。
-
在 ID 部分:
-
选择 userId 作为用户 ID。
-
选择movieId 作为电影ID。
-
-
在“属性”部分中,选择等级 和时间戳属性。
-
请注意,某些属性类型与图形数据模型不匹配。修改它们如下:
-
评级 -→ 整数
-
时间戳 -→ 整数
-
-
您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:
第 10 步:保存映射
如果在导入过程中出现问题,我们建议您保存已映射的内容。
-
点击右上角的...。
-
选择下载模型。名为neo4j_importer_model_yyyy-mm-dd.json的文件将下载到您的系统。
第 11 步:导入 CSV 数据
在导入数据之前,您必须拥有将要导入的 Neo4j 实例的相关信息。主机位置应该是为本课程创建的沙盒的螺栓 URL。您应该已收到包含此信息的电子邮件,但默认情况下,沙盒仅存在三天,并且在您继续课程时会重新创建沙盒。如果邮寄给您的凭据不起作用,或者您没有它们:
-
转到沙盒站点。
-
登录以查看您的空白沙盒实例的详细信息:
-
您可以通过单击沙盒最右侧的下拉菜单来查看空白沙盒详细信息。您将在此处查看连接详细信息:
请按照以下步骤导入数据:
-
单击运行导入按钮。
-
在主机字段中,输入空白沙箱实例中的 Websocket Bolt URL。
-
在用户名字段中,输入neo4j。
-
在密码字段中,输入沙盒实例的密码。
-
单击运行。
-
它应该将数据导入您的空图表。(这将需要几分钟。)