我正在使用 PostgreSQL。我在这里读到的所有内容都表明,在一个只使用单列完全连接的查询中,连接表的顺序基本上无关紧要。
我的直觉告诉我,这也应该适用于多列,只要每个公共(public)列都尽可能列在查询中(也就是说,只要两个连接表有公共(public)列)。但事实并非如此,我正在努力找出原因。
简化为三个表a、b、c。
Columns in table a: id, name_a
Columns in table b: id, id_x
Columns in table c: id, id_x
这个查询:
SELECT *
FROM a
FULL JOIN b USING(id)
FULL JOIN c USING(id, id_x);
返回与这行不同的行数:
SELECT *
FROM a
FULL JOIN c USING(id)
FULL JOIN b USING(id, id_x);
我想要/期望的东西很难说清楚,但基本上,我想要一个“完整”的完全合并。除非不可避免,否则我不希望任何地方出现空字段。
例如,每当有一个非空 id 时,我希望相应的名称列始终具有 name_a 并且不为空。相反,其中一个示例查询返回半冗余结果,一行有 name_a 但没有 id,另一行有 id 但没有 name_a,而不是单个合并行。
当连接以其他顺序列出时,我确实得到了想要的结果(但我不确定可能会发生什么其他问题,因为 future 的数据是未知的)。
最佳答案
您的查询不同。
首先,您使用单个列 id
对 b
进行完全连接
。
在第二个中,您正在使用两列对 b
进行完全连接
。
虽然在某些情况下这两个查询可能返回相同的结果,但没有理由认为结果具有可比性。
关于sql - 为什么 FULL JOIN 顺序在这些查询中有所不同?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45196359/