Neo4j import的控制台输出是什么?工具是什么意思?
示例行:
[输入--------------属性(2)======|作者:W:71。] 3M
[输入------|准备(|关系||] 49M
[关系 --> 关系 + 计数--------]282M
当我尝试通过此工具导入大型数据集时,似乎在 248M 时,导入卡在“计算密集节点”步骤中。 “计算密集节点”到底有什么作用?
最佳答案
导入阶段是:
- 节点
- 准备节点索引
- 计算密集节点
- 节点 --> 关系稀疏
- 关系 --> 关系稀疏
- 节点数
- 关系很重要
至于解释统计数据,我猜@mattias-persson 写的 in the Neo4J manual 。复制一下,以供记录:
10.1.2.5。输出和统计
当导入运行在不同的阶段时,一些统计数据和数字会打印在控制台中。该输出的一般解释是查看水平线,该水平线分为多个部分,每个部分代表与其他部分并行进行的一种类型的工作。一个部分越宽,相对于其他部分花费的时间就越多,最宽的是瓶颈,也用*标记。如果一个部分有双行,而不是单行,则意味着多个线程正在执行该部分中的工作。最右侧显示的数字表明该阶段已处理了多少实体(节点或关系)。
举个例子:
[*>:20,25 MB/s-----------|PREPARE(3)==========|RELATIONSHIP(2)===========] 16M
将被解释为:
>
正在以 20.25 MB/s 的速度读取并可能解析数据,数据正在传递到...PREPARE
准备数据......RELATIONSHIP
创建实际关系记录以及...v
将关系写入商店。此步骤在本示例中不可见,因为与其他部分相比,它的成本非常低。
观察部分大小可以提示哪些地方可以改进性能。在上面的示例中,瓶颈是数据读取部分(用 > 标记),这可能表明磁盘速度很慢,或者不能很好地处理同时读取和写入操作(因为最后一部分通常围绕写入磁盘)。
关于import - Neo4j导入工具-控制台输出含义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28555216/