import - Neo4j导入工具-控制台输出含义

标签 import neo4j console

Neo4j import的控制台输出是什么?工具是什么意思?

示例行:

[输入--------------属性(2)======|作者:W:71。] 3M

[输入------|准备(|关系||] ​​49M

[关系 --> 关系 + 计数--------]282M

当我尝试通过此工具导入大型数据集时,似乎在 248M 时,导入卡在“计算密集节点”步骤中。 “计算密集节点”到底有什么作用?

最佳答案

导入阶段是:

  1. 节点
  2. 准备节点索引
  3. 计算密集节点
  4. 节点 --> 关系稀疏
  5. 关系 --> 关系稀疏
  6. 节点数
  7. 关系很重要

至于解释统计数据,我猜@mattias-persson 写的 in the Neo4J manual 。复制一下,以供记录:

10.1.2.5。输出和统计

当导入运行在不同的阶段时,一些统计数据和数字会打印在控制台中。该输出的一般解释是查看水平线,该水平线分为多个部分,每个部分代表与其他部分并行进行的一种类型的工作。一个部分越宽,相对于其他部分花费的时间就越多,最宽的是瓶颈,也用*标记。如果一个部分有双行,而不是单行,则意味着多个线程正在执行该部分中的工作。最右侧显示的数字表明该阶段已处理了多少实体(节点或关系)。

举个例子:

[*>:20,25 MB/s-----------|PREPARE(3)==========|RELATIONSHIP(2)===========] 16M

将被解释为:

  • > 正在以 20.25 MB/s 的速度读取并可能解析数据,数据正在传递到...​
  • PREPARE 准备数据......
  • RELATIONSHIP 创建实际关系记录以及...​
  • v 将关系写入商店。此步骤在本示例中不可见,因为与其他部分相比,它的成本非常低。

观察部分大小可以提示哪些地方可以改进性能。在上面的示例中,瓶颈是数据读取部分(用 > 标记),这可能表明磁盘速度很慢,或者不能很好地处理同时读取和写入操作(因为最后一部分通常围绕写入磁盘)。

关于import - Neo4j导入工具-控制台输出含义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28555216/

相关文章:

r - 带有 colClasses : scan() expected 'a real' got 'NULL' 的 read.csv 中的错误

Neo4j REST 编码

python - 在控制台中重写多行

database - 如何将数据从 Data Lake Storage Gen 1 导入到 Azure SQL 数据库?

python - 从 Mac .numbers 文件导入表格数据

java - Neo4j 将两个不同的对象视为一个对象,因为它们扩展相同的父对象

Neo4j重复输入id异常

javascript - javascript 控制台调试器命令是否遵循 w3c 建议/规范?

scala - 在 Scala 控制台中使用颜色

python - 关于Python 'import'功能的几个问题