postgresql - 数组搜索不使用索引

标签 postgresql indexing plpgsql postgresql-9.2

我有一个带有下表的 Postgres 9.2 服务器:

A 有一个单列 code 和一个 B 树索引:

db=> \d A
Table "public.A"
Column  |  Type  | Modifiers 
--------+--------+-----------
 code   | bigint | not null

 Indexes:
 "A_pkey" PRIMARY KEY, btree (code)

我有一个简单的 PLPGSQL 函数,如下所示,为了便于理解而进行了简化:

create or replace function list (bigint)
   RETURNS bigint[] AS '
    DECLARE
            arr        bigint[];
            c          ALIAS FOR $1;
    begin
            arr[0] = c * 1;
            arr[1] = c * 2;
            ...
            ...
            arr[10] = c * 1024;
            return arr;
END;
' language plpgsql;

我注意到如果调用该函数则不会使用索引:

db => explain select * from A where code = ANY(list(3234234234));
                           QUERY PLAN                               
------------------------------------------------------------------------
Seq Scan on A (cost=0.00..1440291398.32 rows=10 width=219)
Filter: (code = ANY (list(3234234234::bigint)))

即使我将函数的输出类型转换为 ANY(list(3234234234)::bigint[])

也不走运

当然,如果我手动创建一个列表,它会完美地工作。

db=> explain select * from A where code = ANY( '{21312,13123,1312312,1231312,123213231}' :: bigint[]); 
                                   QUERY PLAN                                       
----------------------------------------------------------------------------------------
Bitmap Heap Scan on A  (cost=538.09..558.17 rows=5 width=219)
Recheck Cond: (code = ANY ('{21312,13123,1312312,1231312,123213231}'::bigint[]))
    ->  Bitmap Index Scan on A_pkey  (cost=0.00..538.09 rows=5 width=0)
        Index Cond: (code = ANY ('{21312,13123,1312312,1231312,123213231}'::bigint[]))

为什么Postgres在使用该函数时会进行顺序扫描?
如何让它使用该函数进行索引扫描?

最佳答案

为什么没有使用索引?

该函数返回 11 个 bigint 数字,但 Postgres 并不知道,因为 PL/pgSQL 函数是查询计划器的黑匣子,并且它是VOLATILE , 也。这告诉 Postgres 期望每次调用都有一个不同的数组。 Postgres 认为用数组中可能大量的元素直接访问表会更便宜。对于只有 5 个元素的固定数量的替代方案,期望值有所不同。

改进的功能

改用这个简单的 IMMUTABLE SQL 函数:

CREATE OR REPLACE function list (c bigint)
  RETURNS bigint[] LANGUAGE sql IMMUTABLE AS
'SELECT array_agg($1 * (2^g)::int) FROM generate_series(0, 10) g';

在几个方面更简单、更快速,而且更允许使用索引。

SQL Fiddle.

Postgres 数组索引默认从 1 开始。如果您确实需要您的数组以索引 0 开头,您可以使用此相关答案中的技术来移动它(但我不希望您需要它):

关于postgresql - 数组搜索不使用索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26823210/

相关文章:

sql - 如何返回由经度和纬度值提供的 Xkm 半径内的 PostgreSQL/PostGIS 表中的所有行?

python - 替换numpy中的子数组

sql - PostgreSQL 中 Informix GLOBAL 修饰符的等价物

postgresql - .sql 文件中的变量声明行因语法错误而失败

sql - 将 PostgreSQL 函数包装在另一个函数中以有条件地组合结果

postgresql - 在 Ubuntu 上移动 postgres 数据文件夹

postgresql - 在两个不同的go应用程序中来自postgres的数据查询不一致

Oracle - 将日期值转换为 TO_CHAR()

python - 如何自定义数据帧索引,同时保持它们自动递增?

sql - 删除所有在 postgres 中共享相同前缀的表