kubernetes - 我的 GKE 集群的主可用区有多高?

标签 kubernetes google-cloud-platform gcp

尽管 GKE 提供了将节点部署到多个可用区的选项,但它似乎为主节点创建了一个使用一个可用区的集群。我担心如果主 AZ 出现故障,我将无法再管理我的集群。我知道我的应用程序将继续运行,但我无法扩展我的服务或部署我的应用程序的新版本等是一个大问题。

我对“GKE 集群容易受到主区域宕机”的理解正确吗?如果不是,你能解释一下怎么做吗?如果它是正确的,我有什么选择可以使其高度可用,以便它可以容忍一个可用区出现故障?

最佳答案

今天的 GKE 主节点不是高度可用的,如果一个区域出现故障,您的集群的 Kubernetes API 也会随之出现故障。但是,您应该注意 GKE 主服务器是具有 99.5% SLA 的托管服务。 https://cloud.google.com/container-engine/sla future ,GKE 可能会为 master(API 服务器)提供高可用的解决方案。

您的理解是正确的,如果 Kubernetes master/API 在短时间内不可用,它不会影响您在集群上运行的已部署工作负载(例如网站或其他服务)。但是您将无法放大/缩小事物。

作为用户,您现在无法做任何事情来使 master 高度可用。

但是,我想说 99.5% 是一个相当不错的正常运行时间。它对应于每天 7 分钟 ( https://uptime.is/99.5 ),如果您不是 24/7 全天候管理您的集群,您可能会时不时地看到问题。如果您使用自动化,您可能应该有一些重试逻辑。

关于kubernetes - 我的 GKE 集群的主可用区有多高?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44338013/

相关文章:

java - Google Kubernetes Engine - Redis 主从复制不会发生

kubernetes - 如何使用 Google Compute Engine Instances 设置 Tensorflow 集群来训练模型?

kubernetes - GCP:Kubernetes 集群前虚拟机上的反向代理

kubernetes - 为什么我的 Nginx Ingress Controller 给出 503?

kubernetes - yaml 解析错误 Helm

kubernetes - 如何使用 Helm 将覆盖文件传递到特定服务 YAML 文件?

google-cloud-platform - 如何获取函数内api网关验证的路由中的jwt有效负载?

go - GCP IoT Core 拒绝此 RSA_PEM 公钥并出错

google-cloud-platform - Google Cloud Dataprep可以监控GCS路径中是否有新文件吗?

docker - 在Kubernetes集群中使用Docker镜像启动服务的最佳实践