optimization - postgres中的Seq Scan和Bitmap堆扫描有什么区别?

标签 optimization postgresql query-optimization sql-execution-plan

在解释命令的输出中,我发现了两个术语“Seq Scan”和“Bitmap heap Scan”。有人能告诉我这两种扫描有什么区别吗? (我正在使用 PostgreSql)

最佳答案

http://www.postgresql.org/docs/8.2/static/using-explain.html

基本上,顺序扫描会到实际的行,并从第 1 行开始读取,并继续直到满足查询(这可能不是整个表,例如,在 limit 的情况下)

位图堆扫描意味着 PostgreSQL 已经找到一小部分行来获取(例如,从索引中获取),并且将只获取这些行。这当然会有更多的搜索,因此只有当它需要一小部分行时才会更快。

举个例子:

create table test (a int primary key, b int unique, c int);
insert into test values (1,1,1), (2,2,2), (3,3,3), (4,4,4), (5,5,5);

现在,我们可以轻松地进行序列扫描:

explain select * from test where a != 4

                       QUERY PLAN                        
---------------------------------------------------------
 Seq Scan on test  (cost=0.00..34.25 rows=1930 width=12)
   Filter: (a <> 4)

它进行了顺序扫描,因为它估计会占用表的绝大部分;试图这样做(而不是大量、漫无目的的阅读)是愚蠢的。

现在,我们可以使用索引:

explain select * from test where a = 4 ;
                              QUERY PLAN                              
----------------------------------------------------------------------
 Index Scan using test_pkey on test  (cost=0.00..8.27 rows=1 width=4)
   Index Cond: (a = 4)

最后,我们可以得到一些位图操作:

explain select * from test where a = 4 or a = 3;
                                  QUERY PLAN                                  
------------------------------------------------------------------------------
 Bitmap Heap Scan on test  (cost=8.52..13.86 rows=2 width=12)
   Recheck Cond: ((a = 4) OR (a = 3))
   ->  BitmapOr  (cost=8.52..8.52 rows=2 width=0)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 4)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 3)

我们可以这样理解:

  1. 为 a=4 构建我们想要的行的位图。 (位图索引扫描)
  2. 为 a=3 构建我们想要的行的位图。 (位图索引扫描)
  3. 或者两个位图放在一起(BitmapOr)
  4. 在表中查找这些行(位图堆扫描)并检查以确保 a=4 或 a=3(重新检查条件)

[是的,这些查询计划很愚蠢,但那是因为我们没有分析test 如果我们分析它,它们都是顺序扫描,因为有 5 个小行]

关于optimization - postgres中的Seq Scan和Bitmap堆扫描有什么区别?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/410586/

相关文章:

Ruby/PG - 无法连接到 PostgreSQL

sql - postgresql 查询中的问题

Mysql执行计划错误

c++ - gcc 是否会优化对同一变量的重复函数调用,每次调用都具有相同的输出?

python - 优化幻方生成时出现问题

MySQL:如何重组此代码以消除添加和删除中间列

r - 排列 : Speed up, 预测和/或多线程

database - 替代 VBScript 中的 sendkeys

sql - 查询与自身的联合生成不同的计划

mysql - 任何人都可以告诉我为什么我的查询需要永远运行吗?