mysql - SQL根据表B数据组合(删除重复)表A?

标签 mysql sql postgresql sqlite

如何将 SQL(SQLite3、postgres 或 MySQL)写入 根据表 B 数据合并(删除重复)表 A?

给定具有电话号码(表格:电话)的人(表格:联系人), 我想使用电话号码删除重复的联系人。

在这个例子中,公司是为了澄清, 真实数据可能没有列出同一家公司,即使 根据电话号码,人是相同的。

请注意,在此示例中,有两个不同的贝蒂,但 两个 Charles 是同一个人,应该合并。

此外,Ashok 和 Dale 有一个共同的电话号码,因为他们 在同一家公司工作,但不是同一个人。

Table: contacts
===============
id      name      company
1       Ashok     Alpha Co.
2       Betty     Beta Inc.
3       Charles   Cain LLC.          <---|
4       Betty     Delta Corp.            |-- same person
5       Charles   Cain LLC.          <---|
6       Dale      Alpha Co.

Table: phones
============
id      phone_number    contact_id
1       (111) 123-1111  1
2       (111) 123-2222  1
3       (111) 123-3333  1
4       (111) 123-4444  1
5       (222) 456-1111  2
6       (222) 456-2222  2
7       (333) 789-1111  3
8       (333) 789-2222  3
9       (333) 789-3333  3
10      (333) 789-4444  3
11      (444) 456-7777  4
12      (444) 456-8888  4
13      (555) 789-5555  5
14      (333) 789-2222  5
15      (111) 123-3333  6

加入表格给出:

SELECT      c.id, c.name, c.company, p.phone_number, p.contact_id
FROM        contacts as c
INNER JOIN  phones as p
ON          c.id = p.contact_id

c.id    c.name      c.company       p.phone         p.contact_id
1       Ashok       Alpha Co.       (111) 123-1111  1
1       Ashok       Alpha Co.       (111) 123-2222  1
1       Ashok       Alpha Co.       (111) 123-3333  1
1       Ashok       Alpha Co.       (111) 123-4444  1
2       Betty       Beta Inc.       (222) 456-1111  2
2       Betty       Beta Inc.       (222) 456-2222  2
3       Charles     Cain LLC.       (333) 789-1111  3
3       Charles     Cain LLC.       (333) 789-2222  3
3       Charles     Cain LLC.       (333) 789-3333  3
3       Charles     Cain LLC.       (333) 789-4444  3
4       Betty       Delta Corp.     (444) 456-7777  4
4       Betty       Delta Corp.     (444) 456-8888  4
5       Charles     Cain LLC.       (555) 789-5555  5
5       Charles     Cain LLC.       (333) 789-2222  5
6       Dale        Alpha Co.       (111) 123-3333  6

所以我想的是我想遍历所有 在不同的电话号码中,获取每个电话号码的所有联系人 在这些数字中,检查名称是否相同,如果 他们正在删除重复的联系人并更改 contact_ids 在电话号码上。

所以结果看起来像:

Table: contacts
===============
id      name      company
1       Ashok     Alpha Co.
2       Betty     Beta Inc.
3       Charles   Cain LLC.
4       Betty     Delta Corp.       <-- Note the duplicate Charles (5) is removed
6       Dale      Alpha Co.

Table: phones
============
id      phone_number    contact_id
1       (111) 123-1111  1
2       (111) 123-2222  1
3       (111) 123-3333  1
4       (111) 123-4444  1
5       (222) 456-1111  2
6       (222) 456-2222  2
7       (333) 789-1111  3
8       (333) 789-2222  3
9       (333) 789-3333  3
10      (333) 789-4444  3
11      (444) 456-7777  4
12      (444) 456-8888  4
13      (555) 789-5555  3         <-- Note the contact_id is updated
15      (111) 123-3333  6         <-- Note the duplicate phone number (14) is removed

c.id    c.name      c.company       p.phone         p.contact_id
1       Ashok       Alpha Co.       (111) 123-1111  1
1       Ashok       Alpha Co.       (111) 123-2222  1
1       Ashok       Alpha Co.       (111) 123-3333  1
1       Ashok       Alpha Co.       (111) 123-4444  1
2       Betty       Beta Inc.       (222) 456-1111  2
2       Betty       Beta Inc.       (222) 456-2222  2
3       Charles     Cain LLC.       (333) 789-1111  3
3       Charles     Cain LLC.       (333) 789-2222  3
3       Charles     Cain LLC.       (333) 789-3333  3
3       Charles     Cain LLC.       (333) 789-4444  3
4       Betty       Delta Corp.     (444) 456-7777  4
4       Betty       Delta Corp.     (444) 456-8888  4
3       Charles     Cain LLC.       (555) 789-5555  3
6       Dale        Alpha Co.       (111) 123-3333  6

最佳答案

以下假设您的问题如您所说的那样简单。换句话说,它只是在寻找相同的接触对,而不是遍历可能复杂得多的图。

如果您说任何两个具有相同电话号码(无论他们有多少)和相同姓名的联系人都是相同的,那么您可以使用以下方法找到他们:

with cp as (
      select c.*, p.phone_number
      from contacts c join
           phones p
           on c.id = p.contact_id
     )
select distinct cp.id as id1, cp2.id as id2
from cp join
     cp cp2
     on cp.phone_number = cp2.phone_number and cp.name = cp2.name and
        cp.id <> cp2.id;

据推测,您想保留第一个联系人。因此,让我们改用聚合。在这个

select min(cp.id) as id1, cp2.id as id2
from cp join
     cp cp2
     on cp.phone_number = cp2.phone_number and cp.name = cp2.name and
         cp.id < cp2.id
group by cp2.id;

这会产生成对的联系人 ID。我们想保留第一个并删除第二个。

现在,如果我们假设重复只有一个深度,那么我们可以将其合并到 delete 中:

with cp as (
      select c.*, p.phone_number
      from contacts c join
           phones p
           on c.id = p.contact_id
     )
delete from contacts
    where id in (select cp2.id
                 from cp join
                      cp cp2
                      on cp.phone_number = cp2.phone_number and cp.name = cp2.name and
                         cp.id < cp2.id
                );

(group by 实际上对于 in 是不必要的。)

注意:这在 MySQL 中不起作用,在 MySQL 中需要使用 JOIN 表达等效逻辑,并且不支持 CTE。

关于mysql - SQL根据表B数据组合(删除重复)表A?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49955036/

相关文章:

mysql - opencart无法保存长信息页面描述

mysql - 将 CSV 导入到 MySQL 中的临时表

sql - SQL 中的无表达式 CASE 中的多个 WHEN?

sql - SQL SUM() 函数可以将表达式作为参数吗?

sql - PostgreSQL:全部存在于数组中

php - 在 PHP 中创建产品的 GridView

.net - 是否可以在 TransactionScope 中执行 SQL 命令并发送 MSMQ 消息?

sql - 找到两列之间的最大值并在 postgres 中相应地更新

sql - Postgres 中的 GROUP BY - JSON 数据类型不相等?

java - 从java在mysql中创建一个数据库