mysql - 在庞大的数据集上使用 IN 是个好主意吗？

假设我有一个表单查询:

SELECT a, b, c, d 
FROM table1 
WHERE a IN (
  SELECT x 
  FROM table2 
  WHERE some_condition);

现在对 IN 的查询可以返回大量记录。假设 a 是主键，那么使用索引是编写此类查询的最佳方式吗？

或者遍历子查询返回的每条记录更优化？

对我来说很明显，当我执行 where a = X 时，很明显我只是在进行索引(树)遍历。
但我不确定 IN(尤其是在庞大的数据集上)将如何遍历/利用索引。

最佳答案

MySQL 优化器还没有真正准备好 (jet) 来正确处理这个问题，你应该将这种查询重写为 iNNER JOIN 并正确索引这将是假设 t1.a 和 t2.x 是唯一的禁食方法

是这样的。

SELECT 
a
, b
, c
, d
FROM 
  table1 as t1
INNER JOIN
  table2 as t2
ON t1.a = t2.x
WHERE 
 t1.some_condition ....

并确保 t1.a 和 t2.x 具有 PRIMARY 或 UNIQUE 索引

关于mysql - 在庞大的数据集上使用 IN 是个好主意吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/18166265/

相关文章：

sql-server - 添加大量记录后 SQL Server FTS 性能