kubernetes – 我的GKE集群的主区域有多高可用性?

GKE似乎使用一个可用区域为主服务器创建一个集群,尽管它提供了将节点部署到多个可用区域的选项.我担心如果主控AZ发生故障,我就无法管理我的集群了.我了解我的应用程序将继续运行但是我无法扩展我的服务或部署新版本的应用程序等是一个很大的问题.

我对“GKE集群容易受到主区域崩溃”的理解是否正确?如果没有,你能解释一下吗?如果它是正确的,我有什么选择让它高度可用,以便它可以容忍一个可用区域下降?

最佳答案
今天的GKE主服务器不具备高可用性,如果某个区域出现故障,您的集群的Kubernetes API将随之崩溃.但是,您应该注意GKE master是具有99.5%SLA的托管服务. https://cloud.google.com/container-engine/sla将来,GKE可能会为主服务器(API服务器)提供高可用性解决方案.

您的理解是正确的,如果Kubernetes master / API在短时间内变得不可用,它不会影响在群集上运行的已部署工作负载(例如网站或其他服务).但是你无法扩大/缩小规模.

作为用户,您无法做任何事情来使主人今天高度可用.

但是,我会说99.5%是一个相当不错的正常运行时间.它相当于每天7分钟(https://uptime.is/99.5),如果您不是每周7天,每天24小时管理您的群集,您可能会偶尔看到问题.如果您使用的是自动化,则应该有一些重试逻辑.

转载注明原文:kubernetes – 我的GKE集群的主区域有多高可用性? - 代码日志