我将有一个巨大的分布式图。系统不知道起始顶点。我需要在此图中找到连接的组件。图可能有多个组件。 我正在用 Java 编写代码。 到目前为止,以下行为我提供了一个组件中的节点
final GremlinPipeline<Vertex,?> pipe = new GremlinPipeline<Vertex,Vertex>(v1).outE("connected").gather().scatter().inV().gather().scatter().inE("connected").gather().scatter().outV().gather().scatter();
但是对于这个查询,我需要给出起始顶点。 有没有其他有效的方法可以使用 Java 获取 Titan 中图的所有组件而不指定起始顶点。另外,我可以并行查找组件的工作吗?
最佳答案
听起来您想使用 Titan-Hadoop 来解决这个问题:
http://s3.thinkaurelius.com/docs/titan/0.5.4/hadoop.html
Titan-Hadoop 允许您抽象 Gremlin 查询背后的 MapReduce 作业,从而允许您在多个并行作业中分析整个图。仅在没有起始索引的情况下在 Titan DB 上使用基本 Gremlin 查询将会变得缓慢且困难。
关于java - 在 Titan Graph 中查找连接组件的有效方法是什么,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29342422/