我尝试计算probe_success 的数量并将其乘以探测间隔,试图以秒为单位获得正常运行时间并将值类型设置为总数。问题是随着时间框架的变化,最小步长变化没有给我们一个正确的读数并使这个选项无效。我们实际要做的是根据仪表板设置的时间范围内的成功探测获得正常运行时间百分比。我们使用 singlestat 来显示百分比
(probe_success{instance="www.google.com:443",job="clienttest"})*15
我们尝试将值(value)除以导出商自身的值(value),以试图得到一个同样无法缩放的百分比。
sum(probe_success{instance="www.google.com:443",job="clienttest"}) / sum(probe_success{instance="self",job="clienttest"}) *100
最佳答案
对于 singlestat 面板,您想要做的只是使用 probe_success{instance="www.google.com:443",job="clienttest"}
作为表达式,并在选项下确保您使用的是平均聚合。
在 PromQL 方面你也可以做 avg_over_time(probe_success[1h])
,见 this blog post .
关于grafana - 我试图根据 Prometheus blackbox exporter 的成功响应来计算 Grafana 的正常运行时间,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49156704/