显然,我的 Kubernetes 集群的 GC 无法删除任何镜像,并且服务器正在进入全盘状态。
您能否指导我在哪里可以找到 ImageGC 的日志以及尝试删除图像时出错的原因或发生这种情况的原因?
3m 5d 1591 ip-xxx.internal Node Warning FreeDiskSpaceFailed {kubelet ip-xxx.internal} failed to garbage collect required amount of images. Wanted to free 6312950988, but freed 0
3m 5d 1591 ip-xxx.internal Node Warning ImageGCFailed {kubelet ip-xxx.internal} failed to garbage collect required amount of images. Wanted to free 6312950988, but freed 0
谢谢!
最佳答案
日志的方式可能不多(见 this issue),但可能有 Kubernetes 事件数据。查找 ImageGCFailed
类型的事件。
或者,您可以检查 cadvisor Prometheus 指标,看看它是否公开了有关容器垃圾收集器的任何信息。
有关 GC 功能的一般文档:https://kubernetes.io/docs/concepts/cluster-administration/kubelet-garbage-collection/
关于docker - Kubernetes 垃圾收集失败 - FreeDiskSpaceFailed & ImageGCFailed,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45446482/