一.需求来源 背景问题 首先来看一下背景问题.如下图所示:如果我们直接管理集群中所有的 Pod,应用 A.B.C 的 Pod,其实是散乱地分布在集群中. 现在有以下的问题: 首先,如何保证集群内可用 Pod 的数量?也就是说我们应用 A 四个 Pod 如果出现了一些宿主机故障,或者一些网络问题,如何能保证它可用的数量? 如何为所有 Pod 更新镜像版本?我们是否要某一个 Pod 去重建新版本的 Pod? 然后在更新过程中,如何保证服务的可用性? 以及更新过程中,如果发现了问题,如何快速回滚到上一…