azure - Kubernetes NodeLost/NotReady/高 IO 磁盘

标签 azure kubernetes acs azure-container-service

我在生产环境中遇到了一个非常复杂的 Kubernetes 问题,丢失了所有代理节点,它们从 Ready 变为 NotReady,所有 pod 从 Running 变为 NodeLost 状态。我发现 Kubernetes 正在大量使用磁盘:

Agent Node Usage

Agent Node Usage 2

Kubectl get nodes

enter image description here

我的集群是使用 acs-engine 0.17.0 部署的(我也测试了以前的版本,也发生了同样的情况)。

另一方面,我们决定部署包含 Premium 磁盘的 Standard_DS2_VX VM 系列,并将 IOPS 增加到 2000(之前低于 500 IOPS),并且发生了同样的事情。我现在要尝试更高的数字。

对此的任何帮助将不胜感激。

最佳答案

这是一个耗尽资源的微服务,然后 Kubernetes 只是停止节点。我们致力于建立基于资源/限制的机制,以便避免整个集群中断。

关于azure - Kubernetes NodeLost/NotReady/高 IO 磁盘,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50479212/

相关文章:

Azure Windows VM 在 RDP 中显示全黑屏

azure - 通过 RDP 连接到 Azure VM : An internal error has occurred

kubernetes - KUBERNETES 上没有持久性的 REDIS 集群

asp.net - 在 C# 中设置 Azure ACS

php - 创建独立的 MS Graph 登录门户

azure - 使用 IP 地址而不是主机名访问 azure 应用程序服务

mysql - 如何在不在主机上发布端口的情况下访问在 docker 容器(由 Rancher 管理)中运行的 MySQL?

logging - 如何在不打开两个终端并使用 kubectl tail 命令的情况下获取两个 Pod 的日志?

silverlight - Azure ACS 与 Silverlight 网站

facebook - ACS/Facebook 集成 - ACS40001 : An error occurred while attempting to get an access token from Facebook