mysql - 将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL

标签 mysql postgresql select group-by distinct

我一直在使用 PostgreSQL,现在正在迁移到 MySQL

在我的查询中,我使用 PostgreSQLSELECT DISTINCT ON (col1, col2, col3),我想知道是否有任何对应的语句在 MySQL 中。

最佳答案

没有完全等效的方法可以将使用 SELECT DISTINCT ON 的 Postgresql 查询转换为 MySQL。

Postgresql SELECT DISTINCT ON

在 Postgresql 中,下面的查询会剔除表达式 (col1, col2, col3) 匹配的所有行,并且只保留每组匹配的“first col4, col5 row”行:

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

所以如果你的 table 是这样的:

col1 | col2 | col3 | col4 | col5
--------------------------------
1    | 2    | 3    | 777  | 888
1    | 2    | 3    | 888  | 999
3    | 3    | 3    | 555  | 555

我们的查询将只为 (1,2,3) 保留一行,为 (3,3,3) 保留一行。结果行将是:

col4 | col5
-----------
777  | 888
555  | 555

请注意,每组的“第一行”是不可预测的,除非我们指定 ORDER BY,否则我们的第一行也可能是 (888, 999):

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

(表达式上的 DISTINCT 必须匹配最左边的 ORDER BY 表达式,但 ORDER BY 可以包含额外的表达式)。

对 GROUP BY 的 MySQL 扩展

MySQL 扩展了 GROUP BY 的使用这样我们就可以选择未在 GROUP BY 子句中命名的非聚合列。每当我们选择非聚合列时,服务器可以自由地从该列的每个组中选择任何值,因此结果值将是不确定的。

所以这个 Postgresql 查询:

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename

可以认为等价于这个 MySQL 查询:

SELECT col4, col5
FROM tablename
GROUP BY col1, col2, col3

Postgresql 和 MySQL 都会为每个 (col1, col2, col3) 返回“第一行”,并且在这两种情况下,返回的行都是不可预测的,因为我们没有指定和 order by 子句。

很多人很想用 ORDER BY 转换这个 Postgresql 查询:

SELECT DISTINCT ON (col1, col2, col3) col4, col5
FROM tablename
ORDER BY col1, col2, col3, col4

用这个:

SELECT col4, col5
FROM (
  SELECT col1, col2, col3, col4, col5
  FROM tablename
  ORDER BY col1, col2, col3, col4
) s
GROUP BY col1, col2, col3

这里的想法是将 ORDER BY 应用于子查询,以便当 MySQL 按 col1、col2、col3 分组时,它将保留 col4 和 col5 的第一个遇到的值。 想法不错,但是错了! MySQL 可以自由选择 col4 和 col5 的任何值,我们不知道最先遇到哪些值,这取决于优化器。所以我会更正它:

SELECT t1.col4, t1.col5
FROM tablename t1 INNER JOIN (SELECT col1, col2, col3, MIN(col4) as m_col4
                              FROM tablename
                              GROUP BY col1, col2, col3) s
     ON t1.col1=s.col1
        AND t1.col2=s.col2
        AND t1.col3=s.col3
        AND t1.col4=s.m_col4
GROUP BY
  t1.col1, t1.col2, t1.col3, t1.col4

但这开始变得更加复杂了。

结论

作为一般规则,没有将 Postgresql 查询转换为 MySQL 查询的确切方法,但有很多变通方法,生成的查询可能与原始查询一样简单,也可能变得非常复杂,但是这取决于查询本身。

关于mysql - 将 SELECT DISTINCT ON 查询从 Postgresql 转换为 MySQL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17673457/

相关文章:

php - 我的 csv 导入未格式化日期

ruby-on-rails - PG_Search 和多个字段

MySQL:表与 View 与例程

Laravel Dusk + Vue 与 ElementUI

php - 来自多个表的 SELECT 命令中的交叉关联 PhP/Mysql 字段

linux - select 函数可能会更新 linux 中的超时参数。为什么它是 'may update'?

mysql - 如何在字段中找到一个字符串并在mysql数据库中在它之前添加一个url?

mysql - 查询 TEXT 列是否会导致创建临时表?

php - mysqli 将位和整数作为字符串返回

postgresql - 如何使用内连接更新两个表中的多个字段