MYSQL 在使用 GROUP BY 时显示不正确的行

标签 mysql select group-by max greatest-n-per-group

我有两个表:

article('id', 'ticket_id', 'incoming_time', 'to', 'from', 'message')
ticket('id', 'queue_id')

其中工单代表支持人员和客户之间的电子邮件线程,文章是组成线程的单个消息。

我要为每个 ticket_id 查找具有最长进入时间(表示为 unix 时间戳)的文章,这是我当前使用的查询:

SELECT article.* , MAX(article.incoming_time) as maxtime
FROM ticket, article
WHERE ticket.id = article.ticket_id
AND ticket.queue_id = 1
GROUP BY article.ticket_id

例如,

:article:
id --- ticket_id --- incoming_time --- to ------- from ------- message --------
11     1             1234567           help@      client@      I need help...   
12     1             1235433           client@    help@        How can we help?
13     1             1240321           help@      client@      Want food!    
...

:ticket:
id --- queue_id
1      1
...

但结果看起来是文章 ID 最小的行,而不是我要查找的是进入时间最长的文章。

如有任何建议,我们将不胜感激!

最佳答案

这是大多数 MySQL 程序员都会遇到的经典障碍。

  • 您有一列 ticket_id,它是 GROUP BY 的参数。此列中的不同值定义组。
  • 您有一列 incoming_time,它是 MAX() 的参数。此列中每组行的最大值作为 MAX() 的值返回。
  • 您拥有表 article 的所有其他列。 为这些列返回的值是任意的,而不是来自出现 MAX() 值的同一行。

数据库无法推断您想要的值来自出现最大值的同一行。

考虑以下情况:

  • 有多个行出现相同的最大值。应该使用哪一行来显示 article.* 的列?

  • 您编写了一个返回 MIN()MAX() 的查询。这是合法的,但是 article.* 应该显示哪一行?

    SELECT article.* , MIN(article.incoming_time), MAX(article.incoming_time)
    FROM ticket, article
    WHERE ticket.id = article.ticket_id
    AND ticket.queue_id = 1
    GROUP BY article.ticket_id
    
  • 您使用聚合函数,例如 AVG()SUM(),其中没有行具有该值。数据库如何猜测显示哪一行?

    SELECT article.* , AVG(article.incoming_time)
    FROM ticket, article
    WHERE ticket.id = article.ticket_id
    AND ticket.queue_id = 1
    GROUP BY article.ticket_id
    

在大多数品牌的数据库中——以及 SQL 标准本身——你不被允许写这样的查询,因为有歧义。您不能在选择列表中包含任何不在聚合函数内或未在 GROUP BY 子句中命名的列。

MySQL 更为宽松。它允许您执行此操作,并由您自行编写查询而不会产生歧义。如果您确实有歧义,它会从组中物理上排在第一位的行中选择值(但这取决于存储引擎)。

值得一提的是,SQLite 也有这种行为,但它选择组中的最后 行来解决歧义。去搞清楚。如果 SQL 标准没有说明要做什么,则由供应商实现。

这是一个可以为您解决问题的查询:

SELECT a1.* , a1.incoming_time AS maxtime
FROM ticket t JOIN article a1 ON (t.id = a1.ticket_id)
LEFT OUTER JOIN article a2 ON (t.id = a2.ticket_id 
  AND a1.incoming_time < a2.incoming_time)
WHERE t.queue_id = 1
  AND a2.ticket_id IS NULL;

换句话说,查找没有其他行 (a2) 具有相同 ticket_id 的行 (a1) 和更长的 incoming_time。如果未找到更大的 incoming_time,则 LEFT OUTER JOIN 返回 NULL 而不是匹配项。

关于MYSQL 在使用 GROUP BY 时显示不正确的行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/979034/

相关文章:

MySQL 查询以获取用户未关注的帖子列表

php - 基于另一个下拉菜单的下拉菜单项

mysql - 函数 SUM 在 MYSQL 中没有按预期工作

c# - 将具有多个 GroupBy 列的 SQL 查询转换为 LINQ

php - 空文件问题

动态页面上的 PHP 分页无法正常工作

Mysql 限制,但添加更多行

MySQL SELECT 查询 - 用另外两个 SUM() 值的总和减去 SUM() 值

sql - 在 With 语句中选择 Null

c# - 这个按小时平均和分组的 LINQ 查询编写得是否高效?