我正在两个表之间进行数据迁移(拆分出一个相关表)。现有表是 reminders
, 它有一个 start
列和一个新添加的 dateset_id
指向新 dateset
的列表,其中还有一个 start
柱子。对于 reminders
中的每一行, 我要 INSERT
dateset
中的新行与 start
复制过来的值,和UPDATE
reminders
中的对应行与新插入的 dateset
身份证。
这是我试过的 SQL:
WITH inserted_datesets AS (
INSERT INTO dateset (start)
SELECT start FROM reminder
RETURNING reminder.id AS reminder_id, id AS dateset_id
)
UPDATE reminder
SET dateset_id = ids.dateset_id
FROM inserted_datesets AS ids
WHERE reminder.id = ids.reminder_id
我得到一个错误 missing FROM-clause entry for table "reminder"
,因为我包括了 reminder.id
RETURNING
中的列子句,但实际上并没有为插入选择它。这是有道理的,但我不知道如何修改查询来做我需要的。我是否缺少一种完全不同的方法?
最佳答案
有几种方法可以解决这个问题。
<强>1。临时加一列
正如其他人提到的,直接的方法是临时将列 reminder_id
添加到 dateset
。用 reminder
表中的原始 ID
填充它。使用它将 reminder
与 dateset
表连接起来。删除临时列。
<强>2。当开始是唯一的
如果 start
列的值是唯一的,则可以通过将 reminder
表与 dateset
表连接起来而无需额外的列开始
列。
INSERT INTO dateset (start)
SELECT start FROM reminder;
WITH
CTE_Joined
AS
(
SELECT
reminder.id AS reminder_id
,reminder.dateset_id AS old_dateset_id
,dateset.id AS new_dateset_id
FROM
reminder
INNER JOIN dateset ON dateset.start = reminder.start
)
UPDATE CTE_Joined
SET old_dateset_id = new_dateset_id
;
<强>3。当开始不是唯一的
即使在这种情况下,也可以在没有临时列的情况下进行。主要思想如下。让我们看一下这个例子:
我们在 reminder
中有两行具有相同的 start
值和 ID 3 和 7:
reminder
id start dateset_id
3 2015-01-01 NULL
7 2015-01-01 NULL
我们将它们插入dateset
后,会生成新的ID,例如1和2:
dateset
id start
1 2015-01-01
2 2015-01-01
我们如何链接这两行并不重要。最终结果可能是
reminder
id start dateset_id
3 2015-01-01 1
7 2015-01-01 2
或
reminder
id start dateset_id
3 2015-01-01 2
7 2015-01-01 1
这两种变体都是正确的。这给我们带来了以下解决方案。
先简单地插入所有行。
INSERT INTO dateset (start)
SELECT start FROM reminder;
在 start
列上匹配/连接两个表,知道它不是唯一的。通过添加 ROW_NUMBER
并通过两列连接来“使其”独一无二。可以使查询更短,但我明确说明了每个步骤:
WITH
CTE_reminder_rn
AS
(
SELECT
id
,start
,dateset_id
,ROW_NUMBER() OVER (PARTITION BY start ORDER BY id) AS rn
FROM reminder
)
,CTE_dateset_rn
AS
(
SELECT
id
,start
,ROW_NUMBER() OVER (PARTITION BY start ORDER BY id) AS rn
FROM dateset
)
,CTE_Joined
AS
(
SELECT
CTE_reminder_rn.id AS reminder_id
,CTE_reminder_rn.dateset_id AS old_dateset_id
,CTE_dateset_rn.id AS new_dateset_id
FROM
CTE_reminder_rn
INNER JOIN CTE_dateset_rn ON
CTE_dateset_rn.start = CTE_reminder_rn.start AND
CTE_dateset_rn.rn = CTE_reminder_rn.rn
)
UPDATE CTE_Joined
SET old_dateset_id = new_dateset_id
;
我希望从代码中可以清楚地看出它的作用,尤其是当您将它与没有 ROW_NUMBER
的更简单版本进行比较时。显然,即使 start
是唯一的,复杂的解决方案也能工作,但它不如简单的解决方案有效。
此解决方案假定在此过程之前 dateset
为空。
关于sql - PostgreSQL - 根据从另一个表中选择插入行,并用新插入的行更新该表中的 FK,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28334759/