GKE群集配置有群集/节点自动配置。
我创建了一个默认的节点池,可以在其上运行系统特定的Pod。每当请求带有GPU的Pod时,GKE都会自动创建新的启用GPU的节点池。
但是,无论何时删除此类Pod,GKE都不会将新创建的节点池缩减为零实例。相反,一个实例保持运行。如果没有请求GPU,则节点池应该达到最小大小,即零。
注意:
我编辑了此Daemonset,还添加了标签““cluster-autoscaler.kubernetes.io/safe-to-evict”:“true”
到 pod 。
有人可以帮助将新创建的节点池缩减为零节点吗?
更新:
在新节点上运行的Pod是:
fluentd-gcp(来自DaemonSet)
库贝代理
nvidia-gpu-device-plugin(来自DaemonSet)
这些 pod 不应该被赶走吗?
最佳答案
默认情况下,GKE保留了额外的节点资源以进行快速Pod调度。这是自动缩放策略控制的默认行为。
可以通过将策略设置为“优化利用”来更改此行为。
https://cloud.google.com/kubernetes-engine/docs/concepts/cluster-autoscaler
关于kubernetes - GKE不会将节点缩减为零,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60931160/