MySQL 不使用 JOIN、WHERE 和 ORDER 的索引

标签 mysql join indexing sql-order-by materialized-views

我们有两个类似于简单标记记录结构的表,如下所示(实际上它要复杂得多,但这是问题的本质):

tag (A.a) | recordId (A.b)
1         | 1
2         | 1
2         | 2
3         | 2
....

recordId (B.b) | recordData (B.c)
1              | 123
2              | 666
3              | 1246

问题是获取带有特定标签的有序记录。这样做的明显方法是在 (PK)(A.a, A.b), (A.b), (PK)(B.b), (B.b,B.c) 上使用简单的连接和索引:

select A.a, A.b, B.c from A join B on A.b = B.b where a = 44 order by c;

但是,这会产生令人不快的文件排序结果:

+----+-------------+-------+------+---------------+---------+---------+-----------+------+----------------------------------------------+
| id | select_type | table | type | possible_keys | key     | key_len | ref       | rows | Extra                                        |
+----+-------------+-------+------+---------------+---------+---------+-----------+------+----------------------------------------------+
|  1 | SIMPLE      | A     | ref  | PRIMARY,b     | PRIMARY | 4       | const     |   94 | Using index; Using temporary; Using filesort | 
|  1 | SIMPLE      | B     | ref  | PRIMARY,b     | b       | 4       | booli.A.b |    1 | Using index                                  | 
+----+-------------+-------+------+---------------+---------+---------+-----------+------+----------------------------------------------+

使用一个巨大且极其冗余的“物化 View ”,我们可以获得相当不错的性能,但这是以复杂化业务逻辑为代价的,这是我们希望避免的事情,特别是因为 A 和 B 表已经是 MV:s (并且需要其他查询,并且实际上使用 UNION 进行相同的查询)。

create temporary table C engine=innodb as (select A.a, A.b, B.c from A join B on A.b = B.b);
explain select a, b, c from C where a = 44 order by c;

使情况更加复杂的是我们在 B 表上有条件,例如范围过滤器。

select A.a, A.b, B.c from A join B on A.b = B.b where a = 44 AND B.c > 678 order by c;

但我们有信心,如果文件排序问题消失,我们可以解决这个问题。

有谁知道为什么上面代码块 3 中的简单连接不使用索引进行排序,我们是否可以在不创建新 MV 的情况下以某种方式解决这个问题?

下面是我们用于测试的完整 SQL list 。

DROP TABLE IF EXISTS A;
DROP TABLE IF EXISTS B;
DROP TABLE IF EXISTS C;
CREATE TEMPORARY TABLE A (a INT NOT NULL, b INT NOT NULL, PRIMARY KEY(a, b), INDEX idx_A_b (b)) ENGINE=INNODB;
CREATE TEMPORARY TABLE B (b INT NOT NULL, c INT NOT NULL, d VARCHAR(5000) NOT NULL DEFAULT '', PRIMARY KEY(b), INDEX idx_B_c (c), INDEX idx_B_b (b, c)) ENGINE=INNODB;

DELIMITER $$
CREATE PROCEDURE prc_filler(cnt INT)
BEGIN
        DECLARE _cnt INT;
        SET _cnt = 1;
        WHILE _cnt <= cnt DO
                INSERT IGNORE INTO A SELECT RAND()*100, RAND()*10000;
                INSERT IGNORE INTO B SELECT RAND()*10000, RAND()*1000, '';
                SET _cnt = _cnt + 1;
        END WHILE;
END
$$
DELIMITER ;

START TRANSACTION;
CALL prc_filler(100000);
COMMIT;
DROP PROCEDURE prc_filler;

CREATE TEMPORARY TABLE C ENGINE=INNODB AS (SELECT A.a, A.b, B.c FROM A JOIN B ON A.b = B.b);
ALTER TABLE C ADD (PRIMARY KEY(a, b), INDEX idx_C_a_c (a, c));

EXPLAIN EXTENDED SELECT A.a, A.b, B.c FROM A JOIN B ON A.b = B.b WHERE A.a = 44;
EXPLAIN EXTENDED SELECT A.a, A.b, B.c FROM A JOIN B ON A.b = B.b WHERE 1 ORDER BY B.c;
EXPLAIN EXTENDED SELECT A.a, A.b, B.c FROM A JOIN B ON A.b = B.b where A.a = 44 ORDER BY B.c;
EXPLAIN EXTENDED SELECT a, b, c FROM C WHERE a = 44 ORDER BY c;
-- Added after Quassnois comments
EXPLAIN EXTENDED SELECT A.a, A.b, B.c FROM  B FORCE INDEX (idx_B_c) JOIN A ON A.b = B.b WHERE A.a = 44 ORDER BY B.c;
EXPLAIN EXTENDED SELECT A.a, A.b, B.c FROM A JOIN B ON A.b = B.b WHERE A.a = 44 ORDER BY B.c LIMIT 10;
EXPLAIN EXTENDED SELECT A.a, A.b, B.c FROM  B FORCE INDEX (idx_B_c) JOIN A ON A.b = B.b WHERE A.a = 44 ORDER BY B.c LIMIT 10;

最佳答案

当我尝试使用您的脚本重现此查询时:

SELECT  A.a, A.b, B.c
FROM    A
JOIN    B
ON      A.b = B.b
WHERE   a = 44
ORDER BY
        c

,它在 0.0043 秒 内完成(立即),返回 930 行并生成此计划:

1, 'SIMPLE', 'A', 'ref', 'PRIMARY', 'PRIMARY', '4', 'const', 1610, 'Using index; Using temporary; Using filesort'
1, 'SIMPLE', 'B', 'eq_ref', 'PRIMARY', 'PRIMARY', '4', 'test.A.b', 1, ''

这样的查询非常高效。

对于这样的查询,您不能同时使用单个索引进行过滤和排序。

请参阅我博客中的这篇文章以获得更详细的解释:

如果您希望您的查询返回少量记录,您应该使用 A 上的索引进行过滤,然后使用 filesort 进行排序(就像上面的查询一样)。

如果你希望它返回很多记录(并且LIMIT它们),你需要使用索引进行排序然后过滤:

CREATE INDEX ix_a_b ON a (b);
CREATE INDEX ix_b_c ON b (c)

SELECT  *
FROM    B FORCE INDEX (ix_b_c)
JOIN    A
ON      A.b = B.b
ORDER BY
        b.c
LIMIT 10;

1, 'SIMPLE', 'B', 'index', '', 'ix_b_c', '4', '', 2, 'Using index'
1, 'SIMPLE', 'A', 'ref', 'ix_a_b', 'ix_a_b', '4', 'test.B.b', 4, 'Using index'

关于MySQL 不使用 JOIN、WHERE 和 ORDER 的索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1227574/

相关文章:

MySQL:两个 bool 字段的索引

Python 我无法替换我的字符串值

php - 在同一页面上用 php 更新和选择如何

mysql - grails 使用 uuid 作为 id 并映射到二进制列

php - php 和 mysql 的性能

oracle - 在 Oracle 中,散列连接和排序合并连接有什么区别?

indexing - 如何在 AppCode 中设置索引位置?

php - rowCount 返回 0,即使它不应该返回

MySQL order by 不与 join 一起使用

MySQL Left Outer Join 不为 COUNT(*) 返回 NULL 值