MySQL 查询性能 - 子查询与 Join

我不是 SQL 专家，所以我试图理解为什么两个查询的执行时间有很大不同。

common_stats 是一个大型表(300 万行)。我只是想理解为什么性能存在巨大差异。

以下查询大约需要 15 秒:

select distinct cs.basesalary_id
from common_stats AS cs
LEFT JOIN basesalary AS b ON b.id = cs.basesalary_id
WHERE (b.employee_id= 100 AND cs.amount > 0 AND cs.pay_id is null );

此查询大约需要 1 秒:

select distinct basesalary_id from (
    select cs.basesalary_id, cs.pay_id
    from common_stats AS cs
    LEFT JOIN basesalary AS b ON b.id = cs.basesalary_id
    WHERE (b.employee_id= 100 AND cs.amount > 0)
) as temp
where pay_id is null;

最佳答案

一般规则:

如果子查询“缩减”了行数(例如，通过 GROUP BY 或 LIMIT)，则子查询方法会更好。
JOIN 通常会创建比原始表更多的行。 DISTINCT 有时用于减少行数。
如果外部查询有一个GROUP BY，JOIN可能会创建比您想象的更多的行，并“膨胀”任何聚合(SUM、COUNT 等)，从而投票支持子查询。
多个子查询会导致优化效果不佳。 (从而投票支持JOIN。)

所有这些都假设最佳索引。

您的第一个查询可能会受益于

INDEX(pay_id, amount, basesalary_id) -- both "covering" and optimal for `WHERE`

查看 EXPLAIN SELECT ... 这两个查询。可能更快的是从 basesalary 开始，然后是 INDEX(employee_id)，而且这是非常有选择性的。

看到SHOW CREATE TABLE后我可能会有更多评论。

关于MySQL 查询性能 - 子查询与 Join，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32995451/

上一篇：MySql 查询 - 多个 SELECT 语句

下一篇：php - 数据库仅从链接列表中吐出特定 ID 的行数据，而不是数据库中的所有行

asp.net - web.config中system.codedom中多个编译器定义的影响

c - 使用 SSE4 向量化点积计算

java - HQL Select 可以对另一个查询的结果集进行选择吗？

php - PDO => 'PDOException' 消息为 'SQLSTATE[HY093]: Invalid parameter number: parameter was not defined'

javascript - Node js : alert on database update

mysql - 压缩一个mysql分区

php - 当文件存储在 webroot 之外时文件上传和下载？ (PHP)

php - 选择哪种解决方案以获得更好的性能？为什么？

sql - 我需要做一个子查询