azure-container-service - 我的 AKS 集群已关闭,如何恢复?

标签 azure-container-service

我一直在 AKS 中的单个代理集群上对我的应用程序进行负载测试。在测试过程中,与仪表板的连接停滞并且从未恢复。我的应用程序似乎也出现故障,因此我假设集群处于不良状态。

API服务器是restate-f4cbd3d9.hcp.centralus.azmk8s.io

kubectl cluster-info dump 显示以下错误:

{
    "name": "kube-dns-v20-6c8f7f988b-9wpx9.14fbbbd6bf60f0cf",
    "namespace": "kube-system",
    "selfLink": "/api/v1/namespaces/kube-system/events/kube-dns-v20-6c8f7f988b-9wpx9.14fbbbd6bf60f0cf",
    "uid": "47f57d3c-d577-11e7-88d4-0a58ac1f0249",
    "resourceVersion": "185572",
    "creationTimestamp": "2017-11-30T02:36:34Z",
    "InvolvedObject": {
        "Kind": "Pod",
        "Namespace": "kube-system",
        "Name": "kube-dns-v20-6c8f7f988b-9wpx9",
        "UID": "9d2b20f2-d3f5-11e7-88d4-0a58ac1f0249",
        "APIVersion": "v1",
        "ResourceVersion": "299",
        "FieldPath": "spec.containers{kubedns}"
    },
    "Reason": "Unhealthy",
    "Message": "Liveness probe failed: Get http://10.244.0.4:8080/healthz-kubedns: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)",
    "Source": {
        "Component": "kubelet",
        "Host": "aks-agentpool-34912234-0"
    },
    "FirstTimestamp": "2017-11-30T02:23:50Z",
    "LastTimestamp": "2017-11-30T02:59:00Z",
    "Count": 6,
    "Type": "Warning"
}

以及 Kube-System 中的一些 Pod 同步错误。

问题示例:

az aks browse -g REstate.Server -n REstate

Merged "REstate" as current context in C:\Users\User\AppData\Local\Temp\tmp29d0conq

Proxy running on http://127.0.0.1:8001/
Press CTRL+C to close the tunnel...
error: error upgrading connection: error dialing backend: dial tcp 10.240.0.4:10250: getsockopt: connection timed out

最佳答案

您可能需要 ssh 到节点来查看 Kubelet 服务是否正在运行。将来您可以设置资源配额,以免耗尽集群节点中的所有资源。

资源配额 - https://kubernetes.io/docs/concepts/policy/resource-quotas/

关于azure-container-service - 我的 AKS 集群已关闭,如何恢复?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/47565663/

相关文章:

azure - 如何在 kubernetes 中使用 windows 容器挂载卷?

azure-container-service - 限制每个部署或容器的 Log Analytics 日志记录

azure - Azure 中的微服务

azure - 用于获取容器/目录/AZURE 存储中的文件列表的 Rest API

azure - Kubernetes:AKS 无法查看该站点

azure - 如何更改 kubernetes api 服务器标志 [AKS] [Kubernetes 1.8]

javascript - 按目录获取azure容器blob列表

Azure - az aks cli azure 广告错误

azure - Kubernetes/Azure ACS : Why can't I access external IPs of my Service?

azure-container-service - 通过 AKS 上的高级网络增加每个节点的最大 pod