kubernetes - GKE 1.16.9 Prometheus,每个 pod 的 grafana 细节不起作用?

标签 kubernetes prometheus grafana

我有一个运行 kubernetes 1.16.9 的 GKE 集群。我正在尝试使用 Prometheus 和 Grafana 使监控系统正常工作。
我使用的仪表板是标准的“Kubernetes Cluster Monitoring”
https://grafana.com/grafana/dashboards/315
但是,当我导入它时,我看不到逐个 pod 的 CPU/内存使用情况,我只看到“值”:
grafana dashboard not working image
我有另一个集群,使用 kubernetes 1.15 的设置几乎相同,仪表板完美地显示了每个 pod 和每个 pod 的使用情况。
为什么会这样?我对理解 prometheus/grafana 以及所有这些如何协同工作还很陌生。
working image
什么可能导致这个问题?指标正在显示,并且 kubectl top pod 出现......所以我认为指标服务器运行良好......
关于尝试调试这个的任何提示?

最佳答案

遇到这个问题的不止您一个人。事情是这样的:pod_namecontainer_name labels来自 kubelet在 1.14 中不推荐使用 pod 和容器,然后在 1.16 中删除

Removed metrics

Removed cadvisor metric labels pod_name and container_name to match instrumentation guidelines. Any Prometheus queries that match pod_name and container_name labels (e.g. cadvisor or kubelet probe metrics) must be updated to use pod and container instead. (#80376, @ehashman)


所以如上所述 -
任何与 pod_name 匹配的 Prometheus 查询和 container_name标签(例如 cadvisor 或 kubelet 探针指标)必须更新以使用 podcontainer反而
非常相似的问题供您引用 - Grafana dashboard not displaying pod name instead pod_name
顺便说一句,你试过这个吗? https://grafana.com/grafana/dashboards/11143

关于kubernetes - GKE 1.16.9 Prometheus,每个 pod 的 grafana 细节不起作用?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63025921/

相关文章:

docker - Kubernetes Pods `ErrImagePull` 是什么意思?

cors - 在 Kubernetes API 中启用 CORS

spring-boot - 尽管明确注册了 TimedAspect,@Timed 仍然无法工作 - spring boot 2.1

grafana - 我可以将grafana与未在支持的数据源列表中列出的关系数据库一起使用吗?

cassandra - 在 Kubernetes 上备份和恢复 Cassandra

kubernetes - 部署到 Kubernetes (GKE) 时无法访问 SFTP 服务器

kubernetes - 在尝试部署 Prometheus 时出现错误 : found in Chart. yaml,但在图表/目录中丢失:kube-state-metrics

java - Grafana 仪表板将执行器池的 "boundedElastic"与 "parallel"分开

regex - Prometheus/从 __meta_gce_tags 创建标签列表

monitoring - 结合 2 个不同实例的状态配置 Prometheus 警报规则