我们的数据库中有一个存储过程,它通过使用 where 条件连接 30 列上的 2 个表来更新表。 SQL 的一般格式为:
UPDATE Target
SET col1 = Source.col1
INNER JOIN Source
on
ISNULL(Target.Col2, '') = ISNULL(Source.Col2, '') and
ISNULL(Target.Col3, '') = ISNULL(Source.Col3, '') and
.
.
.
ISNULL(Target.Col31, '') = ISNULL(Source.Col31, '') and
这是查询计划。将其保存到您的 PC 并重新打开,以便更好地扩展。
源表有 65M 条记录,目标表有 165M 条记录。以前它曾经在几分钟内运行。考虑到查询是多么丑陋和潜在的低效,我觉得这令人惊讶。这个月它运行了 1.5 小时,使用了 100% 的处理器,我们不得不杀死它。
任何建议如何即兴编写以下查询并使其按时运行..?
我们在 30-col 连接条件中使用的一些列上有单列索引。
我知道 ISNULL 函数和 30 列上的连接很疯狂,这是一个糟糕的设计。别怪我,我继承了这个经济。
不幸的是,没有时间重新设计。有什么建议?
最佳答案
INNER HASH JOIN
)。一旦我们有了确切的计划,我们就可以说更多。 (A1 = A2 OR (A1 IS NULL AND A2 IS NULL))
. SQL Server 实际上识别了这种模式,并在内部将其转换为“没有愚蠢的空语义的完全等于”。即使使用空值,您也可以通过这种方式查找索引。 如果这没有帮助,请务必执行步骤 (3) 并在 col2-col31 上创建一个覆盖索引,包括 col1。这将为您提供一个合并连接,这是在这种情况下最有效的计划。它真的很快。警告:这将使表的磁盘大小加倍并减慢更新速度。
关于sql - 带有 many-ISNULL 的多列 UPDATE-JOIN 需要很长时间?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10422221/