SQL:有效地将增量数字附加到字符串,避免重复

标签 sql sql-server performance

我有一组记录(表 [#tmp_origin])在字符串字段([Names])中包含重复条目。我想将 [#tmp_origin] 的全部内容插入到目标表 [#tmp_destination] 中,该表不允许重复并且可能已经包含项目。

如果源表中的字符串在目标表中不存在,则 in 只是按原样插入到目标表中。
如果目标表中的条目已经存在,其值与原始表中的条目相同,则必须在字符串中附加一个字符串化的增量编号,然后才能将其插入目标表。

以这种方式移动数据的过程已经用游标实现了,在这个示例脚本中:

-- 创建初始情况(源表和目标表,均包含项目)- 开始

创建表 [#tmp_origin] ([名称] VARCHAR(10))
创建表 [#tmp_destination] ([名称] VARCHAR(10))
创建唯一索引 [IX_UniqueName] ON [#tmp_destination]([Names] ASC)

INSERT INTO [#tmp_origin]([Names]) VALUES ('a')
INSERT INTO [#tmp_origin]([Names]) VALUES ('a')
INSERT INTO [#tmp_origin]([Names]) VALUES ('b')
INSERT INTO [#tmp_origin]([Names]) VALUES ('c')

INSERT INTO [#tmp_destination]([Names]) VALUES ('a')
INSERT INTO [#tmp_destination]([Names]) VALUES ('a_1')
INSERT INTO [#tmp_destination]([Names]) VALUES ('b')

-- 创建初始状态 - 结束

声明@Name VARCHAR(10)

DECLARE NamesCursor CURSOR LOCAL FORWARD_ONLY FAST_FORWARD READ_ONLY FOR
选择 [姓名]
从 [#tmp_origin];
OPEN NamesCursor;
FETCH NEXT FROM NamesCursor INTO @Name;

而@@FETCH_STATUS = 0
开始
声明@finalName VARCHAR(10)
SET @finalName = @Name
声明@counter INT
设置@计数器 = 1

当(1=1)
开始
如果不存在(SELECT * FROM [#tmp_destination] WHERE [Names] = @finalName)
休息;

SET @finalName = @Name + '_' + CAST(@counter AS VARCHAR)
SET @counter = @counter + 1
结尾
插入 [#tmp_destination] ([名称]) (
选择@finalName
)

FETCH NEXT FROM NamesCursor INTO @Name;
结尾

CLOSE NamesCursor;
DEALLOCATE NamesCursor;


选择 *
从 [#tmp_destination]

/*
预期结果:
一种
a_1
a2
a_3

b_1
C
*/

删除表 [#tmp_origin]
删除表 [#tmp_destination]


这可以正常工作,但是当要插入的项目数量增加时,其性能会大大降低。

有什么想法可以加快速度吗?

谢谢

最佳答案

使用窗口函数允许对重复项进行编号。您还可以从目标表中获取计数(需要 where 条件来去除您添加的后缀):

select orig.names,
       row_number() over (partition by orig.names order by orig.names) as rowNo,
       dest.count
from ##tmp_origin orig
  cross apply (select count(1) from #tmp_destination where names = orig.names) as dest

insert可以从上面构建(如果大于零,新后缀是 rowNo + dest.count -1)。

建议您重构目标临时表以将名称和后缀包含为单独的列——这可能意味着有一个新的中间阶段——因为这将使匹配逻辑更加简单。

关于SQL:有效地将增量数字附加到字符串,避免重复,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49233373/

相关文章:

sql - 在 SQL Server 上将堆索引转换为聚集索引会产生什么后果?

c# - 如何选择 Distinct char 数据类型并通过使用 sql 强制转换为 int

javascript - 我的 js slider 导致 CLS 分数较低 : How to change the way my slider loads?

sql - 更新和删除查询在 Azure 托管实例中运行需要更长的时间

sql - 截断后更新缓慢

mysql - 用于从列中了解流行主题标签的 SQL 查询,该列具有存储为数组的主题标签列表

mysql - 如何删除左连接找到的记录

c# - Entity Framework 创建了一个我不想要的表

sql - MS SQL 更新具有多个条件的表

c++ - 在 C++ 中更快地浏览 csv 文件的方法