当表有其他字段时,Mysql 不使用 DATETIME 索引

标签 mysql optimization indexing innodb

我需要一些帮助来解决这个问题。我试图让 Mysql 在 DATETIME 字段上使用索引。

如果表中有其他(未使用的)字段,Mysql 决定不使用索引。考虑以下两种情况:

一个包含 2 个字段的简单表格可以正常工作:

DROP TABLE IF EXISTS datetime_index_test;
CREATE TABLE  datetime_index_test (
id INT UNSIGNED NOT NULL AUTO_INCREMENT ,
created DATETIME NOT NULL ,
PRIMARY KEY (id) ,
INDEX (created)
) ENGINE = InnoDB ;

INSERT INTO datetime_index_test (created) VALUES
('2011-04-06 00:00:00'),
('2011-04-06 01:00:00'),
('2011-04-06 02:00:00'),
('2011-04-06 03:00:00'),
('2011-04-06 04:00:00'),
('2011-04-06 05:00:00'),
('2011-04-06 06:00:00'),
('2011-04-06 00:00:00');

EXPLAIN SELECT * FROM datetime_index_test
WHERE created <= '2011-04-06 04:00:00';

+----+-------------+---------------------+-------+---------------+---------+---------+------+------+--------------------------+
| id | select_type | table               | type  | possible_keys | key     | key_len | ref  | rows | Extra                    |
+----+-------------+---------------------+-------+---------------+---------+---------+------+------+--------------------------+
|  1 | SIMPLE      | datetime_index_test | range | created       | created | 4       | NULL |    4 | Using where; Using index |
+----+-------------+---------------------+-------+---------------+---------+---------+------+------+--------------------------+

一个包含 3 个字段的简单表格,效果不佳:

DROP TABLE IF EXISTS datetime_index_test;
CREATE TABLE  datetime_index_test (
id INT UNSIGNED NOT NULL AUTO_INCREMENT ,
created DATETIME NOT NULL ,
user int(10) unsigned DEFAULT 0,
PRIMARY KEY (id) ,
INDEX (created)
) ENGINE = InnoDB ;

INSERT INTO datetime_index_test (created) VALUES
('2011-04-06 00:00:00'),
('2011-04-06 01:00:00'),
('2011-04-06 02:00:00'),
('2011-04-06 03:00:00'),
('2011-04-06 04:00:00'),
('2011-04-06 05:00:00'),
('2011-04-06 06:00:00'),
('2011-04-06 00:00:00');

EXPLAIN SELECT * FROM datetime_index_test
WHERE created <= '2011-04-06 04:00:00';

+----+-------------+---------------------+------+---------------+------+---------+------+------+-------------+
| id | select_type | table               | type | possible_keys | key  | key_len | ref  | rows | Extra       |
+----+-------------+---------------------+------+---------------+------+---------+------+------+-------------+
|  1 | SIMPLE      | datetime_index_test | ALL  | created       | NULL | NULL    | NULL |    8 | Using where |
+----+-------------+---------------------+------+---------------+------+---------+------+------+-------------+

最后,我的问题; 谁能给我解释一下为什么Mysql决定不使用索引?

最佳答案

这是因为我称之为基于关键群体(元组基数)的 5% 规则。

如果索引存在不平衡基数的表,MySQL 查询优化器将始终选择阻力最小的路径。

示例:如果表有性别列,则基数为二,M 和 F。

你索引这样一个性别列是什么???您基本上会得到两个巨大的链表。

如果您将 100 万行加载到包含性别列的表中,您可能会得到 50% M 和 50% F。

如果键组合的基数(我所说的键填充)超过总表计数的 5%,则索引在查询优化期间变得无用。

现在,关于您的示例,为什么有两个不同的 EXPLAIN 计划???我的猜测是 MySQL 查询优化器和 InnoDB 作为标记团队。

在第一个 CREATE TABLE 中,表和索引虽然很小但大小大致相同,因此它决定通过索引扫描而不是全表扫描来支持索引。请记住,非唯一索引在其索引条目中携带每一行的内部主键 (RowID),从而使索引几乎与表本身的大小相同。

在第二个 CREATE TABLE 中,由于引入了另一个列 user,您现在让查询优化器看到一个完全不同的场景:现在表比索引大。因此,查询优化器在解释如何使用可用索引时变得更加严格。它达到了我之前提到的 5% 规则。该规则惨遭失败,查询优化器决定支持全表扫描。

关于当表有其他字段时,Mysql 不使用 DATETIME 索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5568933/

相关文章:

php - 从 mysql 选择表时编码错误

python - 优化python中的字符串替换

java - 查找 Map 中的最高 n 个值

使用 FIND_IN_SET 和多表 JOINS 优化 MYSQL 查询

sql - 索引实际上会降低 SELECT 的性能吗?

java - 如何使用 Java 更改数据库连接中的 MySQL 时区?

mysql - 让 mysql 显示带有引用的表

mysql - 无法访问 mysql 表,收到它已崩溃的消息

python - pytorch中的外和等

mysql - 提高查询整体性能