我在一些警报策略上使用基于日志的指标,这些警报策略会在我们的日志中显示特定错误时触发警报。
问题是,在事件创建后,它从未解决,因为当没有错误时,指标图表显示“无数据”,而不仅仅是 0。
我如何更新警报策略以显示 0 而不是无数据?
容器的指标也是如此。当容器死亡时,警报不会自动解决(仅在 7 天后)
fetch k8s_container
| metric 'logging.googleapis.com/user/errors'
| group_by 1m, [row_count: row_count()]
| every 1m
| group_by [], [row_count_aggregate: aggregate(row_count)]
10倍
最佳答案
我已经解决了这个问题,方法是更新警报策略以在聚合和“最近值”不是“一分钟后”的条件上使用总和(而不是计数器)
这会导致警报在出现新错误时触发,但也会在一分钟左右后解决。
10倍
关于alert - 如何确保基于 stackdriver 日志的指标获得 0 值而不是没有数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64307996/