sql - PostgreSQL - 根据从另一个表中选择插入行，并用新插入的行更新该表中的 FK

我正在两个表之间进行数据迁移(拆分出一个相关表)。现有表是 reminders , 它有一个 start列和一个新添加的 dateset_id指向新 dateset 的列表，其中还有一个 start柱子。对于 reminders 中的每一行, 我要 INSERT dateset 中的新行与 start复制过来的值，和UPDATE reminders中的对应行与新插入的 dateset身份证。

这是我试过的 SQL:

WITH inserted_datesets AS (
  INSERT INTO dateset (start)
  SELECT start FROM reminder
  RETURNING reminder.id AS reminder_id, id AS dateset_id
)
UPDATE reminder
SET dateset_id = ids.dateset_id
FROM inserted_datesets AS ids
WHERE reminder.id = ids.reminder_id

我得到一个错误 missing FROM-clause entry for table "reminder" ，因为我包括了 reminder.id RETURNING 中的列子句，但实际上并没有为插入选择它。这是有道理的，但我不知道如何修改查询来做我需要的。我是否缺少一种完全不同的方法？

最佳答案

有几种方法可以解决这个问题。

<强>1。临时加一列

正如其他人提到的，直接的方法是临时将列 reminder_id 添加到 dateset。用 reminder 表中的原始 ID 填充它。使用它将 reminder 与 dateset 表连接起来。删除临时列。

<强>2。当开始是唯一的

如果 start 列的值是唯一的，则可以通过将 reminder 表与 dateset 表连接起来而无需额外的列开始列。

INSERT INTO dateset (start)
SELECT start FROM reminder;

WITH
CTE_Joined
AS
(
    SELECT
        reminder.id AS reminder_id
        ,reminder.dateset_id AS old_dateset_id
        ,dateset.id AS new_dateset_id
    FROM
        reminder
        INNER JOIN dateset ON dateset.start = reminder.start
)
UPDATE CTE_Joined
SET old_dateset_id = new_dateset_id
;

<强>3。当开始不是唯一的

即使在这种情况下，也可以在没有临时列的情况下进行。主要思想如下。让我们看一下这个例子:

我们在 reminder 中有两行具有相同的 start 值和 ID 3 和 7:

reminder
id    start         dateset_id
3     2015-01-01    NULL
7     2015-01-01    NULL

我们将它们插入dateset后，会生成新的ID，例如1和2:

dateset
id    start
1     2015-01-01
2     2015-01-01

我们如何链接这两行并不重要。最终结果可能是

reminder
id    start         dateset_id
3     2015-01-01    1
7     2015-01-01    2

或

reminder
id    start         dateset_id
3     2015-01-01    2
7     2015-01-01    1

这两种变体都是正确的。这给我们带来了以下解决方案。

先简单地插入所有行。

INSERT INTO dateset (start)
SELECT start FROM reminder;

在 start 列上匹配/连接两个表，知道它不是唯一的。通过添加 ROW_NUMBER 并通过两列连接来“使其”独一无二。可以使查询更短，但我明确说明了每个步骤:

WITH
CTE_reminder_rn
AS
(
    SELECT
        id
        ,start
        ,dateset_id
        ,ROW_NUMBER() OVER (PARTITION BY start ORDER BY id) AS rn
    FROM reminder
)
,CTE_dateset_rn
AS
(
    SELECT
        id
        ,start
        ,ROW_NUMBER() OVER (PARTITION BY start ORDER BY id) AS rn
    FROM dateset
)
,CTE_Joined
AS
(
    SELECT
        CTE_reminder_rn.id AS reminder_id
        ,CTE_reminder_rn.dateset_id AS old_dateset_id
        ,CTE_dateset_rn.id AS new_dateset_id
    FROM
        CTE_reminder_rn
        INNER JOIN CTE_dateset_rn ON 
            CTE_dateset_rn.start = CTE_reminder_rn.start AND
            CTE_dateset_rn.rn = CTE_reminder_rn.rn
)
UPDATE CTE_Joined
SET old_dateset_id = new_dateset_id
;

我希望从代码中可以清楚地看出它的作用，尤其是当您将它与没有 ROW_NUMBER 的更简单版本进行比较时。显然，即使 start 是唯一的，复杂的解决方案也能工作，但它不如简单的解决方案有效。

此解决方案假定在此过程之前 dateset 为空。

关于sql - PostgreSQL - 根据从另一个表中选择插入行，并用新插入的行更新该表中的 FK，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28334759/

sql - PostgreSQL - 根据从另一个表中选择插入行，并用新插入的行更新该表中的 FK

上一篇：django - 如何在现有模型上激活 unaccent 扩展

下一篇：postgresql - 空的、不可编辑的 pg_hba.conf 文件