mysql - 如何在没有任何连接的情况下优化大型 MySQL 表中的查询?

标签 mysql sql query-optimization

我如何从一个大型表(约 7500 万行)优化这个单一查询?

SELECT
    log_id
FROM
    score
WHERE
    class_id IN (17,395)
ORDER BY date_reverse
LIMIT 10000;

我为一组特定的类提取了最近的 10k 条记录,以便我可以在更大的导入脚本中快速知道它们是否已经存在。

我想我已经正确地建立了索引,但是这个查询持续了 5-50 秒!

如果您还需要什么,请告诉我。

EXPLAIN
    SELECT
        log_id
    FROM
        score
    WHERE
        class_id IN (17,395)
    ORDER BY date_reverse
    LIMIT 10000;

*** row 1 ***
          table:  score
           type:  range
  possible_keys:  class_id,score_multi_2,class_id_date_reverse,score_multi_5
            key:  class_id_date_reverse
        key_len:  4
            ref:  NULL
           rows:  1287726
          Extra:  Using where; Using index; Using filesort

CREATE TABLE `score` (
  `log_id` bigint(20) NOT NULL,
  `profile_id` bigint(20) DEFAULT NULL,
  `date` datetime DEFAULT NULL,
  `class_id` int(11) NOT NULL,
  `score` float(10,6) DEFAULT NULL,
  `score_date` datetime DEFAULT NULL,
  `process_date` datetime DEFAULT NULL,
  `status_type_id` int(3) NOT NULL DEFAULT '0',
  `date_reverse` int(11) DEFAULT NULL,
  UNIQUE KEY `unique_key` (`log_id`,`class_id`),
  KEY `class_id` (`class_id`),
  KEY `profile_id` (`profile_id`),
  KEY `date` (`date`),
  KEY `score` (`score`),
  KEY `status_type_id` (`status_type_id `),
  KEY `status_type_id_date` (`status_type_id`,`date`),
  KEY `class_status_type_id_date_log_id` (`class_id`,`status_type_id`,`date`,`log_id`),
  KEY `date_reverse` (`date_reverse`),
  KEY `class_id_date_reverse` (`class_id`,`date_reverse`),
  KEY `date` (`date`),
  KEY `class_id_date_reverse_log_id` (`class_id`,`date_reverse`,`log_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

最佳答案

我的猜测是运行此查询的最快方法是咬紧牙关并允许对 20,000 行进行排序。我想到的查询是:

SELECT *
FROM ((SELECT log_id
       FROM score
       WHERE class_id = 17
       ORDER BY date_reverse
       LIMIT 10000
      ) UNION ALL
      (SELECT log_id
       FROM score
       WHERE class_id = 395
       ORDER BY date_reverse
       LIMIT 10000
      )
     ) s
ORDER BY date_reverse
LIMIT 10000;

对于此查询,您需要 score(class_id, date_reverse, log_id) 上的复合索引。每个子查询都应该非常有效地使用这个索引。然而,最终的排序将需要使用文件排序。

关于mysql - 如何在没有任何连接的情况下优化大型 MySQL 表中的查询?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/27515378/

相关文章:

mysql - 优化简单MySQL查询响应时间

mysql - 如何使用ibatis检查更新语句中是否为空?

php - 接收 mysqli_result 中的内容

sql-server - SQL Server索引使用问题

mysql - 嵌套 SELECT 计算两个表的平均值

sql - 日期时间上的 "BETWEEN AND"和 "> AND <="有什么区别?

sql - 简单的删除查询。最好的指标是什么?

php - 对如何从返回一组特定值的查询中获取另一行感到困惑

php - mysql - php blob 字段?

mysql - 如何在 SQL 中获取每组的平均值并找出异常值