python - 高效查询图结构

我有一个由图表组成的数据库。我需要访问的表如下所示:

Sno    Source    Dest
1       'jack'   'bob'
2       'jack'   'Jill'
3       'bob'    'Jim'

这里Sno是主键。源和目标是两个非唯一的数字，代表我的图中节点之间的边。我的 Source 和 Dest 也可能是字符串，不一定是数字数据类型。我的数据库中有大约 500 万个条目，我使用 Postgresql 和 Psycopg2 for python 构建了它。

查询主键非常简单快捷。但是，我需要经常查询此数据库以获取特定源连接到的所有dest。现在我通过调用查询来实现这一点:

SELECT * FROM name_table WHERE Source = 'jack'

事实证明，这效率相当低(每个查询最多 2 秒)，而且我无法将其设为主键，因为它不是唯一的。有什么办法可以根据这些重复值建立索引并快速查询吗？

最佳答案

这应该会使您的查询速度更快。

在 table_name 源上创建索引 table_name_index_source;

但是您可以使用很多选项

PostgreSQL 文档

CREATE [ UNIQUE ] INDEX [ CONCURRENTLY ] [ name ] ON table [ USING method ]
    ( { column | ( expression ) } [ COLLATE collation ] [ opclass ] [ ASC | DESC ] [ NULLS { FIRST | LAST } ] [, ...] )
    [ WITH ( storage_parameter = value [, ... ] ) ]
    [ TABLESPACE tablespace ]
    [ WHERE predicate ]

在其 Documentation 中了解有关使用 PostgreSQL 建立索引的更多信息.

更新

如果您的 table 小，这肯定会有所帮助。但是，如果您的数据集正在增长，您可能应该考虑更改架构以具有可以更有效地建立索引的唯一值。

关于python - 高效查询图结构，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/11568336/

python - 高效查询图结构

上一篇：Mysql 日期和日期时间字段的默认值

下一篇：database - 限制用户只能访问 Oracle SQL Developer 中自己的表