kubernetes - 恢复 kops Kubernetes 集群

标签 kubernetes kops

有一个由 kops 创建的 kubernetes 集群 当运行 kops validate 时,这是输出:

    INSTANCE GROUPS
NAME            ROLE    MACHINETYPE MIN MAX SUBNETS
master-us-east-1a   Master  m4.xlarge   1   1   us-east-1a
nodes           Node    c4.2xlarge  1   75  us-east-1a

NODE STATUS
NAME                ROLE    READY
ip-172-20-59-93.ec2.internal    master  False

VALIDATION ERRORS
KIND    NAME                MESSAGE
Machine i-0a44bbdd18c86e846     machine "i-0a44bbdd18c86e846" has not yet joined cluster
Machine i-0d3302056f3dfeef0     machine "i-0d3302056f3dfeef0" has not yet joined cluster
Machine i-0d6199876b91962f4     machine "i-0d6199876b91962f4" has not yet joined cluster
Node    ip-172-20-59-93.ec2.internal    master "ip-172-20-59-93.ec2.internal" is not ready

Validation Failed

我该如何恢复这个集群?此集群的 s3 文件可用。

etcd 卷显示状态为“正在使用”

screenshot

最佳答案

kops 将集群的状态存储在 S3 中。

  1. 找到存储状态的桶
  2. 设置export KOPS_STATE_STORE=s3://your-k8s-state-store
  3. 运行 kops 更新集群
  4. 如果失败。
  5. 终止与集群相关的所有实例
  6. 运行kops create cluster

请注意,集群的内部状态不在 S3 中,而是在 etcd 中。这里的答案有关于这个主题的更多细节以及如何备份/恢复 etcd:How to restore kubernetes cluster using kops?

关于kubernetes - 恢复 kops Kubernetes 集群,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52778698/

相关文章:

kubernetes - 服务帐户x509:证书由未知授权机构签名

kubernetes - Google GKE kubernetes DNS 无法解析服务名称

kubernetes - 在Kubernetes中推出后,是否可以更快地在本地终止容器

kubernetes - kops k8s cluster Kubectl 命令超时问题

amazon-web-services - 使用 kops 在 AWS 上的 kubernetes 集群中自定义 SSL 证书,身份验证失败

amazon-web-services - AWS 是否会限制 CPU 使用率?

kubernetes - GKE PVC 与磁盘

docker - 如何更新部署到Kubernetes(EKS)的应用程序代码?

python - 如何使用 Prefect 在 AKS 上部署 Kubernetes 作业

amazon-web-services - 在 KOP 中定义自定义 SSH key 或查找自动生成的 SSH key