我有一个遗留数据库: 名字、姓氏、地址 1、地址 2、地址 3、地址 4、邮政编码 数据分散在不同的列之间,不一致,例如,实际的邮政编码可能在任何列中,并且有很多拼写错误。
有没有一种方法可以在 SP 中使用诸如 SOUNDEX/DIFFERENCE 之类的东西来遍历所有内容并返回可能重复的有序列表? [不需要很快]
最佳答案
如果您使用的是 SQl server 2005 或更高版本,您可以使用 SSIS 中的模糊匹配来完成此任务。我发现这样做比查找 soundex 匹配项或编写我自己的 sql scode 来查找接近匹配项的结果要好得多。
关于sql-server - T-SQL Soundex/Difference 查找重复行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1875282/