我每 5 分钟记录一次 TIMESTAMP 天气数据,我想以 15 分钟为间隔进行分组。我发现下面的 floor 函数看起来很有前途,但是 BQ 不支持 UNIX_TIMESTAMP 函数
SELECT
FLOOR(UNIX_TIMESTAMP(utc_timestamp)/(15 * 60)) AS timekey
GROUP BY
timekey
执行此操作的最佳方法是什么?
最佳答案
以下是 BigQuery 标准 SQL
#standardSQL
SELECT
TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey
你可以像下面的例子一样使用虚拟数据来测试、玩上面的游戏
#standardSQL
WITH `project.dataset.table` AS (
SELECT TIMESTAMP '2019-03-15 00:00:00' utc_timestamp, 1 metric UNION ALL
SELECT '2019-03-15 00:05:00', 2 UNION ALL
SELECT '2019-03-15 00:10:00', 3 UNION ALL
SELECT '2019-03-15 00:15:00', 4 UNION ALL
SELECT '2019-03-15 00:20:00', 5 UNION ALL
SELECT '2019-03-15 00:25:00', 6 UNION ALL
SELECT '2019-03-15 00:30:00', 7 UNION ALL
SELECT '2019-03-15 00:35:00', 8 UNION ALL
SELECT '2019-03-15 00:40:00', 9
)
SELECT
TIMESTAMP_SECONDS(15*60 * DIV(UNIX_SECONDS(utc_timestamp), 15*60)) timekey,
AVG(metric) metric
FROM `project.dataset.table`
GROUP BY timekey
-- ORDER BY timekey
结果
Row timekey metric
1 2019-03-15 00:00:00 UTC 2.0
2 2019-03-15 00:15:00 UTC 5.0
3 2019-03-15 00:30:00 UTC 8.0
显然,您可以使用您的逻辑需要的任何聚合 - 我使用 AVG() 只是为了举例
关于mysql - 如何使用 Google BigQuery 按时间间隔分组,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55191664/