sql - PostgreSQL 中的时间窗口

标签 sql postgresql timescaledb

我是 PostgreSQL 的新手(具体来说,我使用 Timescale 数据库)并且有一个关于时间窗口的问题。

数据:

date      |customerid|names   
2014-01-01|1         |Andrew 
2014-01-02|2         |Pete   
2014-01-03|2         |Andrew 
2014-01-04|2         |Steve  
2014-01-05|2         |Stef   
2014-01-06|3         |Stef  
2014-01-07|1         |Jason 
2014-01-08|1         |Jason 

问题是:回到过去 x 天(从每一行来看),有多少个共享相同 ID 的不同名称?

对于 x=2 天,结果应如下所示:

date      |customerid|names  |count 
2014-01-01|1         |Andrew |1 
2014-01-02|2         |Pete   |1 
2014-01-03|2         |Andrew |2 
2014-01-04|2         |Steve  |3 
2014-01-05|2         |Stef   |3 
2014-01-06|3         |Stef   |1
2014-01-07|1         |Jason  |1
2014-01-08|1         |Jason  |1  

在不对每一行使用循环的情况下,这在 PostgreSQL 中是否可行?

附加信息:数据的时间间隔实际上不是等距的。

非常感谢!

最佳答案

如果能使用窗口函数就好了:

select t.*,
       count(distinct name) over (partition by id
                                  order by date
                                  range between interval 'x day' preceding and current row
                                 ) as cnt_x
from t;

唉,那是不可能的。所以你可以使用横向连接:

select t.*, tt.cnt_x
from t left join lateral
     (select count(distinct t2.name) as cnt_x
      from t t2
      where t2.id = t.id and
             t2.date >= t.date - interval 'x day' and t2.date <= t.date
     ) tt
     on true;

为了提高性能,您需要在 (id, date, name) 上建立索引。

关于sql - PostgreSQL 中的时间窗口,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62471237/

相关文章:

sql - 当右表中有很多匹配的行时左连接

sql - 逗号分隔的 SQL 字符串 需要分隔

sql - 如果引用不存在的表/列,导致创建存储过程失败

mysql - 在mysql中搜索相似的词

java - postgresql - 在 java 项目中定义串行数据类型

具有许多左连接的 Postgresql 查询优化

sql - 数千列的动态枢轴

sql - TimescaleDB - 计数器

postgresql - 在 WHERE 子句中使用的所有列上创建索引是一种好习惯吗

postgresql - 无法使用 pg_dump PostgreSQL 备份超表 TimescaleDB 数据库