Neo4j 导入CSV工具导入

第 1 步:下载 CSV 文件

将以下文件下载到您的系统:

解压这个文件。你应该有这些文件:

  • 人.csv

  • 电影.csv

  • 收视率.csv

  • 定向.csv

  • acted_in.csv

第 2 步:打开数据导入器

在 Web 浏览器窗口中,打开Neo4j 数据导入器

你应该看到这个:

Neo4j 数据导入器

自本课程发布以来,Neo4j 数据导入器可能会发生变化。您将在 UI 中看到细微差别。

如果您在 Graph Model 窗格中看到节点和关系,您应该选择所有这些并删除它们,以便您可以从新映射开始。

第 3 步:将 CSV 文件加载到数据导入器中

在左侧文件面板中,添加您在步骤 1中解压缩的五个 CSV 文件。

添加它们后,您应该会看到:

添加到数据导入器的文件

加载它们后,请花几分钟时间查看用于每个文件的标题。

第 4 步:定义人员节点映射

  1. 单击图形模型窗格中的添加节点图标。

  2. 在右侧的映射详细信息窗格中:

    1. 输入Person作为标签。

    2. 选择persons.csv文件。

    3. 在属性下,单击从文件添加

      1. 点击确认

    4. 请注意,某些属性名称与图形数据模型不匹配。修改它们如下:

      1. person_tmdbId -→ tmdbId

      2. person_imdbId -→ imdbId

      3. person_poster -→ 海报

      4. person_url -→ 网址

    5. 选择tmdbId作为将用于这些 Person 节点的唯一 ID。

您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

映射的人员属性

第 5 步:定义电影节点映射

  1. 单击图形模型窗格中的添加节点图标。

  2. 在右侧的映射详细信息窗格中:

    1. 输入电影作为标签。

    2. 选择movies.csv文件。

    3. 在属性下,单击从文件添加

      1. 点击确认

    4. 请注意,某些属性名称与图形数据模型不匹配。修改它们如下:

      1. movie_tmdbId -→ tmdbId

      2. movie_imdbId -→ imdbId

      3. movie_poster -→ 海报

      4. 电影网址 -→ 网址

    5. 另请注意,某些属性类型与我们的数据模型定义的不匹配。修改属性类型如下:

      1. 预算 -→ 整数

      2. imdbRating -→ 浮动

      3. imdbVotes -→ 整数

      4. 收入 -→ 整数

      5. 运行时 -→ 整数

      6. 年份 -→ 整数

    6. 选择movieId作为将用于这些电影节点的唯一 ID。请注意,我们选择了 movieID 作为唯一 ID,因为在我们定义与电影的关系时,它会在其他文件中使用。

您无法使用数据导入器将所有字段转换为其目标属性类型。在本课程的下一个模块中,您将对图执行一些导入后重构。

您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

映射的电影节点

第 6 步:定义用户节点映射

  1. 单击图形模型窗格中的添加节点图标。

  2. 在右侧的映射详细信息窗格中:

    1. 输入用户作为标签。

    2. 选择rating.csv文件。

    3. 在属性下,单击从文件添加

      1. 仅选择userIdname属性。稍后将使用其他值来定义关系。

      2. 点击确认

    4. 选择userId作为将用于这些 Person 节点的唯一 ID。

您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

映射的用户节点

第 7 步:定义 DIRECTED 关系映射

  1. 在 Graph Model 窗格中,将Person节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。

  2. 在右侧的映射详细信息窗格中:

    1. 输入DIRECTED作为类型。

    2. 选择directed.csv文件。

    3. 在 ID 部分:

      1. 选择 person_tmdbId 作为人员 ID。

      2. 选择movieId 作为电影ID。

角色的directed.csv文件中没有字段,因此您不会从此文件中导入角色属性,因此您已完成。

您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

映射的定向关系

步骤 8:定义 ACTED_IN 关系映射

  1. 在 Graph Model 窗格中,将Person节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。

  2. 在右侧的映射详细信息窗格中:

    1. 输入ACTED_IN作为类型。

    2. 选择acted_in.csv文件。

    3. 在 ID 部分:

      1. 选择 person_tmdbId 作为人员 ID。

      2. 选择movieId 作为电影ID。

    4. 在“属性”部分中,选择角色属性。

您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

映射的 ACTED_IN 关系

第 9 步:定义 RATED 关系映射

请注意,此映射将重用您用于定义用户节点的同一文件。

  1. 在 Graph Model 窗格中,将User节点的边缘拖到Movie节点上。这将定义图中这些节点之间的关系。

  2. 在右侧的映射详细信息窗格中:

    1. 输入RATED作为类型。

    2. 选择rating.csv文件。

    3. 在 ID 部分:

      1. 选择 userId 作为用户 ID。

      2. 选择movieId 作为电影ID。

    4. 在“属性”部分中,选择等级 和时间戳属性。

    5. 请注意,某些属性类型与图形数据模型不匹配。修改它们如下:

      1. 评级 -→ 整数

      2. 时间戳 -→ 整数

您应该在左侧面板中看到一个绿色指示器,表明所有属性都已映射:

RATED 关系映射

第 10 步:保存映射

如果在导入过程中出现问题,我们建议您保存已映射的内容。

  1. 点击右上角的...。

  2. 选择下载模型名为neo4j_importer_model_yyyy-mm-dd.json的文件将下载到您的系统。

保存模型

第 11 步:导入 CSV 数据

在导入数据之前,您必须拥有将要导入的 Neo4j 实例的相关信息。主机位置应该是为本课程创建的沙盒的螺栓 URL。您应该已收到包含此信息的电子邮件,但默认情况下,沙盒仅存在三天,并且在您继续课程时会重新创建沙盒。如果邮寄给您的凭据不起作用,或者您没有它们:

  1. 转到沙盒站点

  2. 登录以查看您的空白沙盒实例的详细信息:

  3. 您可以通过单击沙盒最右侧的下拉菜单来查看空白沙盒详细信息。您将在此处查看连接详细信息:

空白沙盒凭据

请按照以下步骤导入数据:

  1. 单击运行导入按钮。

  2. 主机字段中,输入空白沙箱实例中的 Websocket Bolt URL。

  3. 用户名字段中,输入neo4j

  4. 密码字段中,输入沙盒实例的密码。

进口凭证
  1. 单击运行

  2. 它应该将数据导入您的空图表。(这将需要几分钟。)

导入完成
posted @ 2022-05-30 16:04  博二爷  阅读(1197)  评论(0编辑  收藏  举报