SQL 以不同的时间间隔选择行

标签 sql sql-server

我遇到了一种情况,我有一个巨大的表,包含大量的行,看起来像(例如):

id          Timestamp               Value
14574499    2011-09-28 08:33:32.020 99713.3000
14574521    2011-09-28 08:33:42.203 99713.3000
14574540    2011-09-28 08:33:47.017 99713.3000
14574559    2011-09-28 08:38:53.177 99720.3100
14574578    2011-09-28 08:38:58.713 99720.3100
14574597    2011-09-28 08:39:03.590 99720.3100
14574616    2011-09-28 08:39:08.950 99720.3100
14574635    2011-09-28 08:39:13.793 99720.3100
14574654    2011-09-28 08:39:19.063 99720.3100
14574673    2011-09-28 08:39:23.780 99720.3100
14574692    2011-09-28 08:39:29.167 99758.6400
14574711    2011-09-28 08:39:33.967 99758.6400
14574730    2011-09-28 08:39:40.803 99758.6400
14574749    2011-09-28 08:39:49.297 99758.6400

好的,规则是: 时间戳可以是任意 n 秒间隔,5 秒、30 秒、60 秒等,具体取决于记录的年龄(存档发生)。

我希望能够查询此表以根据时间戳选择每个第 n 行。

例如:

从mytable中选择*,其中intervalBetweenTheRows = 30s

(就本问题而言,基于假设,请求的间隔始终比数据库中可用的精度更高)

因此,每第 n 行基于每行之间的时间

有什么想法吗?!

卡尔

对于那些感兴趣的人来说,递归CTE实际上相当慢,我想到了一个稍微不同的方法:

SELECT TOP 500
    MIN(pvh.[TimeStamp]) as [TimeStamp],
    AVG(pvh.[Value]) as [Value]
FROM
    PortfolioValueHistory pvh
WHERE
    pvh.PortfolioID = @PortfolioID
    AND pvh.[TimeStamp] >= @StartDate
    AND pvh.[TimeStamp] <= @EndDate
GROUP BY
    FLOOR(DateDiff(Second, '01/01/2011 00:00:00', pvh.[TimeStamp]) / @ResolutionInSeconds)
ORDER BY 
    [TimeStamp] ASC

我用时间戳减去任意日期来给出要使用的基本整数,然后将其除以我想要的分辨率,然后按此分组,取最小时间戳(邮票“区域”的第一个) )以及该“时期”的平均值。

这用于绘制历史数据图表,因此平均值对我来说很好。

根据我能想到的表大小,这是最快的执行

感谢大家的帮助。

最佳答案

假设要求是否返回行的决定因素取决于上一个返回行所耗时,这需要一种过程方法。不过,递归 CTE 可能比游标更有效。

WITH RecursiveCTE
     AS (SELECT TOP 1 *
         FROM @T
         ORDER BY [Timestamp]
         UNION ALL
         SELECT id,
                [Timestamp],
                Value
         FROM   (
                --Can't use TOP directly
                SELECT T.*,
                       rn = ROW_NUMBER() OVER (ORDER BY T.[Timestamp])
                 FROM   @T T
                        JOIN RecursiveCTE R
                          ON T.[Timestamp] >=
                                 DATEADD(SECOND, 30, R.[Timestamp])) R
         WHERE  R.rn = 1)
SELECT *
FROM RecursiveCTE

关于SQL 以不同的时间间隔选择行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7713532/

相关文章:

sql - 将数据(直接查询模式)从 Databricks SQL 查询引入 Power BI

mysql - 用 2 个表中的 2 列划分两个 select 语句,MySQL

sql - Postgres 选择具有百分比匹配的行,并按百分比排序

sql - 使用 SQL 从多个表中获取 Count(*)

sql-server - 从列中检索日期部分

sql - 关键字 'TOP' 附近的语法不正确。数据库服务器

mysql - 在考虑另一列的一列上选择 DISTINCT

sql - 如何使用 Powershell Restore-SqlDatabase cmdlet 可靠地覆盖现有数据库

sql - 使用输出在合并语句中设置变量

sql-server - 基于开始结束日期 SQL Server 拆分行