我有一组记录(表 [#tmp_origin])在字符串字段([Names])中包含重复条目。我想将 [#tmp_origin] 的全部内容插入到目标表 [#tmp_destination] 中,该表不允许重复并且可能已经包含项目。
如果源表中的字符串在目标表中不存在,则 in 只是按原样插入到目标表中。
如果目标表中的条目已经存在,其值与原始表中的条目相同,则必须在字符串中附加一个字符串化的增量编号,然后才能将其插入目标表。
以这种方式移动数据的过程已经用游标实现了,在这个示例脚本中:
-- 创建初始情况(源表和目标表,均包含项目)- 开始
创建表 [#tmp_origin] ([名称] VARCHAR(10))
创建表 [#tmp_destination] ([名称] VARCHAR(10))
创建唯一索引 [IX_UniqueName] ON [#tmp_destination]([Names] ASC)
INSERT INTO [#tmp_origin]([Names]) VALUES ('a')
INSERT INTO [#tmp_origin]([Names]) VALUES ('a')
INSERT INTO [#tmp_origin]([Names]) VALUES ('b')
INSERT INTO [#tmp_origin]([Names]) VALUES ('c')
INSERT INTO [#tmp_destination]([Names]) VALUES ('a')
INSERT INTO [#tmp_destination]([Names]) VALUES ('a_1')
INSERT INTO [#tmp_destination]([Names]) VALUES ('b')
-- 创建初始状态 - 结束
声明@Name VARCHAR(10)
DECLARE NamesCursor CURSOR LOCAL FORWARD_ONLY FAST_FORWARD READ_ONLY FOR
选择 [姓名]
从 [#tmp_origin];
OPEN NamesCursor;
FETCH NEXT FROM NamesCursor INTO @Name;
而@@FETCH_STATUS = 0
开始
声明@finalName VARCHAR(10)
SET @finalName = @Name
声明@counter INT
设置@计数器 = 1
当(1=1)
开始
如果不存在(SELECT * FROM [#tmp_destination] WHERE [Names] = @finalName)
休息;
SET @finalName = @Name + '_' + CAST(@counter AS VARCHAR)
SET @counter = @counter + 1
结尾
插入 [#tmp_destination] ([名称]) (
选择@finalName
)
FETCH NEXT FROM NamesCursor INTO @Name;
结尾
CLOSE NamesCursor;
DEALLOCATE NamesCursor;
选择 *
从 [#tmp_destination]
/*
预期结果:
一种
a_1
a2
a_3
乙
b_1
C
*/
删除表 [#tmp_origin]
删除表 [#tmp_destination]
这可以正常工作,但是当要插入的项目数量增加时,其性能会大大降低。
有什么想法可以加快速度吗?
谢谢
最佳答案
使用窗口函数允许对重复项进行编号。您还可以从目标表中获取计数(需要 where 条件来去除您添加的后缀):
select orig.names,
row_number() over (partition by orig.names order by orig.names) as rowNo,
dest.count
from ##tmp_origin orig
cross apply (select count(1) from #tmp_destination where names = orig.names) as dest
安
insert
可以从上面构建(如果大于零,新后缀是 rowNo + dest.count -1
)。建议您重构目标临时表以将名称和后缀包含为单独的列——这可能意味着有一个新的中间阶段——因为这将使匹配逻辑更加简单。
关于SQL:有效地将增量数字附加到字符串,避免重复,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49233373/