我有一个小型应用程序,我需要每天使用另一个包含 40000 行的表来更新包含 40000 行的表。此操作合并来自不同(外部)数据源的数据,以便在我工作的公司中生成报告,这是我目前唯一可用的方法:(
现在我使用的查询格式如下
UPDATE table1, table2 SET table1.column1=table2.column1 WHERE table1.column2=table2.column2
并且需要大量时间才能完成。这是将 40k 与 40k 进行比较,因此需要完成大约 1600000 次比较。如果可能的话,我可以创建一个查询来指示 SQL 在匹配时从作业中删除行吗?因此,每次匹配/更新时,40k 行都会减少一行。
我可以通过将原始表复制到临时表并在更新结果表后删除具有相同键的行来重现这一点,但也许有一种更优雅和/或更快的方法来做到这一点:)
感谢您的见解!
/edit - 正确 - 它应该是“更新”而不是“选择”:)
最佳答案
要从表中删除行,需要 DELETE 语句;这会让事情变得更慢,而不是更快。
为了提高 UPDATE 的性能,请考虑添加适当的索引。可能最好的候选者是覆盖索引:
... ON table2 (column2, column1)
这将使“匹配”(查找第 2 列的值)变得更快。利用索引中可用的column1 值,可以直接从索引返回该值,而不需要在基础表的页面中再次查找该行。
关于减少需要完成的比较操作的数量,您的想法是正确的。这就是指数存在的理由;它们显着减少了需要执行的比较次数,从而使比较操作变得更快。该指数的组织方式消除了绝大多数比较;我们不需要比较每一行中的每个值,索引以一种数据库可以快速确定不需要检查整行行的方式组织值,因为数据库知道不可能对任何行进行检查。该 strip 中的行以匹配其查找的值。
<小时/>我希望您的意思是您正在运行 UPDATE
语句,而不是 SELECT
。
关于MYSQL 在匹配时删除 UPDATE 中的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23568019/