我有多个具有不同客户名称的表。我试图找出表中同名的次数。这里的挑战是有人可能输入了“John Smith”或“Smith, John”这样的名字。
每个表中有 40,000 行和 40 多个不同的表。我试图在不知道名字的情况下以某种方式查询,但仍然返回类似的名字。
基本上我需要在不使用如下语句的情况下对相似的名称进行分组:
WHERE cust_name LIKE '%john%'
当数据格式可能不同时,如何使用其他表列的内容查询多个表列?您如何最好地“清理”数据以删除逗号、空格等?
最佳答案
好吧,您可以在 SSIS 中使用模糊逻辑。我已经成功地使用模糊分组找到了重复项——尽管你会希望匹配的不仅仅是名字,因为有很多人共享相同的名字。我已经使用姓名、地址、电话和电子邮件进行了匹配。模糊分组允许您使用多个字段进行匹配。
关于sql - 在多个表中查找相似的名称,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3141636/