monitoring - 监控 GKE 节点中 CPU 和内存的百分比

标签 monitoring google-kubernetes-engine stackdriver google-cloud-stackdriver google-cloud-monitoring

我想使用 Stackdriver 监控来监控我的 GKE 节点的 CPU/mem 百分比使用情况。

但是,在查看 Stackdriver Monitoring UI 时,似乎没有任何此类选项可用(以百分比表示)。

另一方面,对于(似乎是)绝对内存使用情况,似乎有 2 个极其相似的指标(它们的描述是相同)。 (附截图)。

有人知道如何提供 GKE 节点上使用的内存和 CPU 的百分比吗? (不是容器)

enter image description here

enter image description here

最佳答案

根据 https://cloud.google.com/monitoring/api/metrics_kubernetes :

node/memory/allocatable_utilizationnode/cpu/allocatable_utilization 似乎在做你想做的事:

  • node/memory/allocatable_utilization - [BETA] 内存可分配利用率

    • 说明:实例上当前正在使用的可分配内存的比例。此值不能超过 1,因为使用量不能超过可分配的内存字节。每 60 秒采样一次。采样后,最长 120 秒内数据不可见。
    • 种类:GAUGE,类型:DOUBLE,单位:1
    • 监控资源:k8s_node
    • 标签:
      • memory_type:evictablenon-evictable。可驱逐内存是内核可以轻松回收的内存,而非可驱逐内存则不能。
      • 组件:相应系统守护程序的名称。
  • node/cpu/allocatable_utilization - [BETA] CPU 可分配利用率。

    • 说明:实例上当前正在使用的可分配 CPU 的比例。每 60 秒采样一次。采样后,数据在长达 240 秒内不可见。
    • 种类:GAUGE,类型:DOUBLE,单位:1
    • 监控资源:k8s_node

不过,这两个指标都标记为 BETA


提到的原始答案:container/cpu/limit_utilizationcontainer/memory/limit_utilization

关于monitoring - 监控 GKE 节点中 CPU 和内存的百分比,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59643585/

相关文章:

monitoring - 算法交易软件安全 guard

python - 故意导致读/写超时?

kubernetes - Google Container Engine 的托管 Kubernetes 环境是否会导致锁定?

kubernetes - 如何在 Google Kubernetes Engine 上将集群节点设为私有(private)?

google-app-engine - App Engine 柔性环境的错误报告

c# - 使用 C++ 或 C# 打开之前的全局检测文件信息

java - 监视 Java Web 应用程序 - JMX 是正确的选择吗?

google-cloud-platform - 有没有办法通过私有(private) GKE 集群运行 GCP 的 Cloud Run?

python - 使用 python 的 GAE 灵活和 Stackriver 日志严重性级别

kubernetes - 如何将 Google Container Engine 中的自定义指标记录到 Stackdriver?