我正在使用 Prometheus 来抓取 AWS cloudwatch 指标,并在某些 SQS 队列的消息数量激增时发送警报。假设我的队列深度图如下所示:
我希望当它仅向上时发出警报。目前,我使用表达式 increase(QueueDepthMetric[10m])
,其中 QueueDepthMetric
是上图中表示的变量。我预计这只会显示指标增加的峰值,但它反而显示指标斜率增加的峰值:
这会导致任何尖峰(无论是正尖峰还是负尖峰)都达到警报阈值。浏览完"Query Functions" page在 Prometheus 文档中,我无法找到我正在寻找的功能。
Prometheus 中是否有度量函数或公式只能显示度量的增加,而不显示任何净变化?
请注意,我并不是要确定原始队列深度阈值;而是要确定原始队列深度阈值。相反,我希望确定数字何时急剧增加。
最佳答案
increase
用于计数器,队列深度是一个量规。这些峰值实际上是值减少的地方,因为它们被视为计数器重置。
您想要的是deriv
,它将根据简单的线性回归为您提供给定时间段内的斜率。
关于prometheus - 仅测量 Prometheus 的increase() 函数的积极变化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57561543/