sql - 在窗口函数中计算运行总和

标签 sql postgresql sql-order-by aggregate-functions window-functions

我在 Redshift(使用 Postgres 8)中遇到这个运行总和问题:

select extract(month from registration_time) as month
 , extract(week from registration_time)%4+1 as week
 , extract(day from registration_time) as day
 , count(*) as count_of_users_registered
 , sum(count(*)) over (ORDER BY (1,2,3))
from loyalty.v_user
group by 1,2,3
order by 1,2,3
;

我得到的错误是:

ERROR: 42601: Aggregate window functions with an ORDER BY clause require a frame clause

最佳答案

可以在同一查询级别上对聚合函数的结果运行窗口函数。在这种情况下使用子查询要简单得多:

SELECT *, sum(count_registered_users) OVER (ORDER BY month, week, day) AS running_sum
FROM  (
   SELECT extract(month FROM registration_time)::int     AS month
        , extract(week  FROM registration_time)::int%4+1 AS week
        , extract(day   FROM registration_time)::int     AS day
        , count(*) AS count_registered_users
   FROM   loyalty.v_user
   GROUP  BY 1, 2, 3
   ORDER  BY 1, 2, 3
   ) sub;

我还修复了表达式计算 week 的语法。 extract() 返回 double ,但模运算符% 不接受 double 数字。我将所有三个都转换为 integer

@a_horse commented ,您不能在窗口函数的 ORDER BY 子句中使用位置引用(与查询的 ORDER BY 子句不同)。

但是,您不能在此查询中使用 over (order by registration_time),因为您是按 monthweekregistration_time 既未聚合,也未按要求包含在 GROUP BY 子句中。在查询评估的那个阶段,您无法再访问该列。

可以重复 ORDER BY 子句中前三个 SELECT 项的表达式以使其工作:

SELECT extract(month FROM registration_time)::int     AS month
     , extract(week  FROM registration_time)::int%4+1 AS week
     , extract(day   FROM registration_time)::int     AS day
     , count(*) AS count_registered_users
     , sum(count(*)) OVER (ORDER BY 
              extract(month FROM registration_time)::int
            , extract(week  FROM registration_time)::int%4+1
            , extract(day   FROM registration_time)::int) AS running_sum
FROM   loyalty.v_user
GROUP  BY 1, 2, 3
ORDER  BY 1, 2, 3;

但这似乎相当嘈杂。 (不过性能会很好。)

旁白:我确实想知道 week%4+1 背后的目的……整个查询可能更简单。

相关:

关于sql - 在窗口函数中计算运行总和,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33574053/

相关文章:

java - hibernate可以在实体表创建后初始化数据吗?

mysql - SQL - 连接表

mysql - 从不同数据库的两个表中查询数据

postgresql - 查询中的两个 array_aggs 是否共享同一个窗口?

使用带有 ORDER BY 和 LIMIT 的 INNER JOIN 的 MySQL 更新

php Mysql 将用户消息分组和排序在一起

sql - 此声明更短/排序

sql - Azure SQL 数据库行号无法正常工作

performance - 在 PostgreSQL 中,在同一个表中包含 TEXT 列比在单独的表中包含更快吗?

sql - 如何按 A 列排序,然后按 B 列排序?