mysql - 在庞大的数据集上使用 IN 是个好主意吗?

标签 mysql sql performance indexing query-optimization

假设我有一个表单查询:

SELECT a, b, c, d 
FROM table1 
WHERE a IN (
  SELECT x 
  FROM table2 
  WHERE some_condition);

现在对 IN 的查询可以返回大量记录。 假设 a 是主键,那么使用索引是编写此类查询的最佳方式吗?

或者遍历子查询返回的每条记录更优化?

对我来说很明显,当我执行 where a = X 时,很明显我只是在进行索引(树)遍历。
但我不确定 IN(尤其是在庞大的数据集上)将如何遍历/利用索引。

最佳答案

MySQL 优化器还没有真正准备好 (jet) 来正确处理这个问题,你应该将这种查询重写为 iNNER JOIN 并正确索引这将是假设 t1.a 和 t2.x 是唯一的禁食方法

是这样的。

SELECT 
a
, b
, c
, d
FROM 
  table1 as t1
INNER JOIN
  table2 as t2
ON t1.a = t2.x
WHERE 
 t1.some_condition .... 

并确保 t1.a 和 t2.x 具有 PRIMARY 或 UNIQUE 索引

关于mysql - 在庞大的数据集上使用 IN 是个好主意吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/18166265/

相关文章:

sql-server - 添加大量记录后 SQL Server FTS 性能

r - 为什么 PLM 会创建大量对象并且无法打开它们

ruby - 为什么 RuboCop 建议用 Array.new 替换 .times.map?

mysql - 我如何在 Maven 中启动 MySQL 数据库以用于我们的 JUnit 测试?

mysql - MySQL 中的 count(predicate) 是做什么的?

mysql - SQL如何选择本周内其id在右表中出现次数少于5次的左表?

sql - 按 MySQL 困惑分组

python - PyMySQL 不会安装到树莓派上

mysql - 如何找到多个时间段的交集时间?

sql - 为什么这个 if 语句总是返回 true