php - 查找 PostgreSQL 中一组之间的所有行

标签 php sql postgresql window-functions gaps-and-islands

我有一个名为 tc_fuel 的表,它从 GPS 车辆接收所有与燃料相关的数据,我想获取最后一个“Tank Usage”来计算整个油箱的 MPG,但是读数当坦克已满(100)时,有时会在 2 行或 3 行或更多行后重复,所以我剩下 2 个 100 的值彼此相邻,我希望能够获得最后一个“填充”开始和结束 ID .

我目前拥有的:

SELECT
    "tc_fuel".deviceid,
    "tc_fuel"."id",
    "tc_fuel".fuel,
    "tc_fuel"."fuelUsed",
    "tc_fuel"."fuelUsed"
FROM "tc_fuel"
WHERE fuel=100
    AND deviceid=19
ORDER BY ID
DESC LIMIT 2

然后我进入 PHP 检查 id 是否与它的 100 多条记录不同,以检查燃料值是否彼此相邻,但这比它应该做的更多工作我想知道是否有更好的方法.

例如,这辆车从满油箱开始,然后下降到 6% 油箱并加满油箱,我希望能够获取最后一个油箱的所有数据。

id    | deviceId  | fuel
------+-----------+-------
1     | 19        | 100  <-- This should be starting point 
2     | 19        | 97  
3     | 19        | 100  
4     | 19        | 96
5     | 19        | 94
6     | 19        | .... (keeps dropping)
7     | 19        | 33
8     | 19        | 31
9     | 19        | 30
10    | 19        | ....
11    | 19        | 6
12    | 19        | 5
13    | 19        | 6    <-- This should be end point (will flag this id as processed)
14    | 19        | 100  <-- Starts all over again in next iteration of the php script
15    | 19        | 99
16    | 19        | 98
17    | 19        | 100
18    | 19        | 99
19    | 19        | 97
20    | 19        | 96
21    | 19        | ....

最佳答案

“填充”的定义有点模糊。当燃料值上升超过 50 时,我会假设它是一个 fillup。替换为您选择的数字。似乎新坦克必须以 fuel = 100 开头(尽管这是一个奇怪的条件)。我将其添加为评论 - 取消评论以激活:

SELECT *
FROM  (
   SELECT *, count(*) FILTER (WHERE fillup) OVER (PARTITION BY device_id ORDER BY id) AS tank
   FROM  (
      SELECT *
           , fuel - lag(fuel, 1, 0) OVER (PARTITION BY device_id ORDER BY id) > 50
             -- AND fuel = 100  -- additional condition(s)?
             AS fillup
      FROM   tbl
      ) sub1
   ) sub2
WHERE  device_id = 19
AND    tank = 1;

db<> fiddle here

在子查询 sub1 中,使用 window function lag() 计算每个设备之前的燃料条目与当前条目之间的差异.值得注意的是,我使用带有 3 个参数的变体,提供 0 作为缺失行的默认值以覆盖每个分区的第一行。增加超过 50 表示有新的填充。

在子查询 sub2 中,使用另一个窗口函数计算随时间推移的填充次数,从而为每一行分配一个“坦克”编号。

在外部 SELECT 中,选择您的设备和“ jar ”填充的编号。瞧。

如果将条件 WHERE device_id = 19 移动到最里面的 suqbquery,则可以删除 PARTITION 子句。速度更快,通用性更差。

关于 FILTER 子句:

只获取给定设备的最后一个 jar

根据您的评论,定义为“上次油箱从 20 或以下填充到 100”。

我假设较晚的时间点对应于较高的 id 值。 (请注意,在并发写入负载下,串行列可能会出现极端情况。)

最简单的方法:只需颠倒顺序并从底部开始计数:

SELECT *
FROM  (
   SELECT *, count(*) FILTER (WHERE fillup) OVER (ORDER BY id DESC) AS tank
  FROM  (
      SELECT *, lag(fuel, 1, 0) OVER (ORDER BY id DESC) = 100
                AND fuel <= 20 AS fillup
      FROM   tbl
      WHERE  device_id = 19
      ) sub1
   ) sub2
WHERE  tank = 0
-- ORDER  BY id  -- optional to get result in ascending order

db<> fiddle here

为此,按程序遍历行可能会更快,因为它只需要一次遍历,并且可以在找到第一个坦克后立即停止。
tbl(device_id, id DESC) 上的索引支持它。

示例代码:

关于php - 查找 PostgreSQL 中一组之间的所有行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58312219/

相关文章:

javascript - 尽管用户已登录 wordpress,但要求用户登录不适用于重力形式

mysql - 仅在数据库查询时名字和姓氏的首字母

sql - 双表问题

sql - 连接来自另一个查询的 crosstab() 查询的返回类型

如果不存在,则 SQL 插入多行,否则使用 COALESCE 更新特定列

python - 初始化几何类型的空列的合适值是多少

php - Drupal TB mega 菜单太慢了

php - PHP Ajax开发环境的建议

php - 如何在 Laravel 中合并两个请求

sql - 试图找到喜欢和不喜欢的替代方法 (SQL)