sql - 如何存储稀疏邻接矩阵

我已经阅读了几个主题，但我迷路了。我对此很陌生。我想存储巨大的稀疏矩阵并有几个想法，但可以在它们之间进行选择。这是我的需求:

所以，这是我的想法:

成对(行，列)的巨大表格。非常简单，但顶点枚举至少为 O(log N)，其中 N - 表的大小。我认为这很慢。此外，它必须被索引。每个 RDBMS 都有什么用处。
大量列表:每个顶点一个列表。枚举非常快，但是存储它不会占用很多资源吗？另外，我不确定在这种情况下使用哪个 DBMS:也许是一些 NoSql？
巨大的表格(行 | 列的集合)。以上两者的结合。我不确定是否有任何 RDBMS 支持任意集。你知道任何？也许 NoSql 在这里会有用？
邻接列表的集合。任何 RDBMS 都适用于此，并且在复杂性方面的成本很高，但它们可能会被一个顶点的多个数据库请求所扼杀。
HDF5 - 我认为它会因 I/O 而变慢。
Neo4j - 据我所知，它将数据存储在双链表中，因此它实际上与 №4 相同，对吗？

请帮我选择或提供更好的决定。

如果我在某处估计有误，请纠正我。

最佳答案

混合 neo4j/hbase 方法可能会很好地工作，其中 neo4j 优化图形处理方面，而 hbase 明智地处理繁重的可扩展性 - 例如用于存储大量额外属性。

neo4j 包含节点和关系。明智的可扩展性可能就足够了。我在网络上对独立的非 neo4j 站点的调查声称在一台机器上有多达数十亿个节点/关系，其遍历性能比 RDBMS 好几个数量级。

但是.. 如果需要更大的可扩展性，您可以引入 hbase big iron 来存储非关系/节点标识符的额外属性。然后只需将 hbase rowkey 添加到 neo4j 节点信息中，以便在应用程序需要时进行查找。

关于sql - 如何存储稀疏邻接矩阵，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15003397/