sql - PostgreSQL - 根据从另一个表中选择插入行,并用新插入的行更新该表中的 FK

标签 sql postgresql

我正在两个表之间进行数据迁移(拆分出一个相关表)。现有表是 reminders , 它有一个 start列和一个新添加的 dateset_id指向新 dateset 的列表,其中还有一个 start柱子。对于 reminders 中的每一行, 我要 INSERT dateset 中的新行与 start复制过来的值,和UPDATE reminders中的对应行与新插入的 dateset身份证。

这是我试过的 SQL:

WITH inserted_datesets AS (
  INSERT INTO dateset (start)
  SELECT start FROM reminder
  RETURNING reminder.id AS reminder_id, id AS dateset_id
)
UPDATE reminder
SET dateset_id = ids.dateset_id
FROM inserted_datesets AS ids
WHERE reminder.id = ids.reminder_id

我得到一个错误 missing FROM-clause entry for table "reminder" ,因为我包括了 reminder.id RETURNING 中的列子句,但实际上并没有为插入选择它。这是有道理的,但我不知道如何修改查询来做我需要的。我是否缺少一种完全不同的方法?

最佳答案

有几种方法可以解决这个问题。

<强>1。临时加一列

正如其他人提到的,直接的方法是临时将列 reminder_id 添加到 dateset。用 reminder 表中的原始 ID 填充它。使用它将 reminderdateset 表连接起来。删除临时列。

<强>2。当开始是唯一的

如果 start 列的值是唯一的,则可以通过将 reminder 表与 dateset 表连接起来而无需额外的列开始列。

INSERT INTO dateset (start)
SELECT start FROM reminder;

WITH
CTE_Joined
AS
(
    SELECT
        reminder.id AS reminder_id
        ,reminder.dateset_id AS old_dateset_id
        ,dateset.id AS new_dateset_id
    FROM
        reminder
        INNER JOIN dateset ON dateset.start = reminder.start
)
UPDATE CTE_Joined
SET old_dateset_id = new_dateset_id
;

<强>3。当开始不是唯一的

即使在这种情况下,也可以在没有临时列的情况下进行。主要思想如下。让我们看一下这个例子:

我们在 reminder 中有两行具有相同的 start 值和 ID 3 和 7:

reminder
id    start         dateset_id
3     2015-01-01    NULL
7     2015-01-01    NULL

我们将它们插入dateset后,会生成新的ID,例如1和2:

dateset
id    start
1     2015-01-01
2     2015-01-01

我们如何链接这两行并不重要。最终结果可能是

reminder
id    start         dateset_id
3     2015-01-01    1
7     2015-01-01    2

reminder
id    start         dateset_id
3     2015-01-01    2
7     2015-01-01    1

这两种变体都是正确的。这给我们带来了以下解决方案。

先简单地插入所有行。

INSERT INTO dateset (start)
SELECT start FROM reminder;

start 列上匹配/连接两个表,知道它不是唯一的。通过添加 ROW_NUMBER 并通过两列连接来“使其”独一无二。可以使查询更短,但我明确说明了每个步骤:

WITH
CTE_reminder_rn
AS
(
    SELECT
        id
        ,start
        ,dateset_id
        ,ROW_NUMBER() OVER (PARTITION BY start ORDER BY id) AS rn
    FROM reminder
)
,CTE_dateset_rn
AS
(
    SELECT
        id
        ,start
        ,ROW_NUMBER() OVER (PARTITION BY start ORDER BY id) AS rn
    FROM dateset
)
,CTE_Joined
AS
(
    SELECT
        CTE_reminder_rn.id AS reminder_id
        ,CTE_reminder_rn.dateset_id AS old_dateset_id
        ,CTE_dateset_rn.id AS new_dateset_id
    FROM
        CTE_reminder_rn
        INNER JOIN CTE_dateset_rn ON 
            CTE_dateset_rn.start = CTE_reminder_rn.start AND
            CTE_dateset_rn.rn = CTE_reminder_rn.rn
)
UPDATE CTE_Joined
SET old_dateset_id = new_dateset_id
;

我希望从代码中可以清楚地看出它的作用,尤其是当您将它与没有 ROW_NUMBER 的更简单版本进行比较时。显然,即使 start 是唯一的,复杂的解决方案也能工作,但它不如简单的解决方案有效。

此解决方案假定在此过程之前 dateset 为空。

关于sql - PostgreSQL - 根据从另一个表中选择插入行,并用新插入的行更新该表中的 FK,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28334759/

相关文章:

mysql - 在 VALUES 查询中添加 SELECT 时出错

SQL:如何在 UPDATE 子句中应用函数(存储过程)来更改值?

mysql - 在实时机器上更新(或替换)整个数据库表的最佳方法是什么?

PostgreSQL – 等待检查点完成

mysql - 选择具有多个参数的 HAVING

sql - 在数据库中存储状态更新的更好方法是什么?

sql - 使用 CURRENT_TIMESTAMP 查询时间戳分区表的效率

sql - 从多个表中选择,删除重复项

sql - array_append 如果元素不存在

performance - 当我创建太多分区时,postgreSQL 的性能严重下降