我的问题是由以下问题引发的。 我有一组网络文档,我从中提取关键字。我想将这些数据存储在Neo4j中以供进一步分析(或多或少的图挖掘包括子图同构问题):每个Web文档都是一个节点;从一个网页文档到另一个网页文档的超链接是一种对应的有向关系;关键字是节点的属性。在此设置中,关键字属性可能归因于多个节点(我希望这是可行的)。
我需要帮助解决以下问题(我发现仅了解 Neo4j 的非常基本的知识就很难回答这些问题):
1) 是否可以选择具有特定属性“keyword1”的所有节点?
2) 如何为 2 个节点“doc1”和“doc2”选择公共(public)(重叠)关键字属性?即 2 个网络文档的共同关键字
3)为关键字属性创建某种字符串键(而不是使用默认的自动递增整数)是否更好?
任何提示/建议/链接将不胜感激。 我在 Windows 上使用 Python 绑定(bind) Neo4j。
最佳答案
全局查找是通过索引来处理的。您可能应该构建一个包含两个关键字的索引,并由 lucene 支持,然后您可以在节点上提出组合查询。
http://docs.neo4j.org/chunked/snapshot/tutorials-java-embedded-index.html
http://docs.neo4j.org/chunked/snapshot/rest-api-indexes.html
关于python - 节点的属性是否可以视为Neo4j中特殊类型的节点?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9947741/