Kubernetes Deployment 源码分析(二)
概述startDeploymentController 入口逻辑DeploymentController 对象DeploymentController 类型定义DeploymentController 初始化ResourceEventHandlerDeployment 变更事件ReplicaSet 变更事件DeploymentController 启动Run()syncDeployment小结
概述
源码版本:kubernetes-v1.22.3 / commit-id: c92036
Deployment 是最常用的 Kubernetes 原生 Workload 资源之一,我们一开始尝试使用 Kubernetes 的时候大概率就是从运行一个 Deployment 类型的工作负载开始的。
在上一篇《Kubernetes Deployment 源码分析(一)》中我们过了下 Deployment 的全部特性,主要介绍“滚动更新”和“回滚”等主要功能,从而心中有个概念,知道 Deployment 的能力边界在那里,所以今天以此为基础,我们继续从源码角度看下 Deployment 的实现。
注意:阅读 Deployment 源码需要有一定的自定义控制器工作原理基础,里面涉及到了 Informer 工作机制、workqueue(延时/限速工作队列)、ResourceEventHandler 等等逻辑,没有相关知识储备直接看本文会有一定挑战,建议先阅读《深入理解 K8S 原理与实现》系列目录里列的相关文章。
《Kubernetes Deployment Controller 源码分析》分为两讲:
startDeploymentController 入口逻辑
DeploymentController 的初始化和启动入口是 startDeploymentController()
函数
- cmd/kube-controller-manager/app/apps.go:72
1func startDeploymentController(ctx ControllerContext) (http.Handler, bool, error) {
2 dc, err := deployment.NewDeploymentController(
3 ctx.InformerFactory.Apps().V1().Deployments(),
4 ctx.InformerFactory.Apps().V1().ReplicaSets(),
5 ctx.InformerFactory.Core().V1().Pods(),
6 ctx.ClientBuilder.ClientOrDie("deployment-controller"),
7 )
8 if err != nil {
9 return nil, true, fmt.Errorf("error creating Deployment controller: %v", err)
10 }
11 go dc.Run(int(ctx.ComponentConfig.DeploymentController.ConcurrentDeploymentSyncs), ctx.Stop)
12 return nil, true, nil
13}
在 startDeploymentController()
函数中先通过 NewDeploymentController()
方法初始化一个 DeploymentController 实例,这里的参数 DeploymentInformer、ReplicaSetInformer、PodInformer 和 Clientset,因而 DeploymentController 也就具备了获取Deployment、 ReplicaSet、Pod 三类资源变更事件以及 CURD apiserver 操作各种资源的能力。接着这个函数中又调用了 DeploymentController 的 Run()
方法来启动 DeploymentController,这里的参数 ConcurrentDeploymentSyncs 默认值是 5,也就是默认情况下并发调谐的 Deployment 数量是 5 个。
DeploymentController 对象
继续看下 DeploymentController 对象的定义和初始化。
DeploymentController 类型定义
接着来看 DeploymentController 类型的定义
- pkg/controller/deployment/deployment_controller.go:68
1type DeploymentController struct {
2 // ReplicaSet 操控器
3 rsControl controller.RSControlInterface
4 client clientset.Interface
5 eventRecorder record.EventRecorder
6
7 syncHandler func(dKey string) error
8 // 测试用
9 enqueueDeployment func(deployment *apps.Deployment)
10
11 // 用来从 cache 里 get/list Deployment
12 dLister appslisters.DeploymentLister
13 // 用来从 cache 里 get/list ReplicaSet
14 rsLister appslisters.ReplicaSetLister
15 // 用来从 cache 里 get/list Pod
16 podLister corelisters.PodLister
17
18 dListerSynced cache.InformerSynced
19 rsListerSynced cache.InformerSynced
20 podListerSynced cache.InformerSynced
21
22 // 工作队列,限速队列实现
23 queue workqueue.RateLimitingInterface
24}
25
DeploymentController 初始化
- pkg/controller/deployment/deployment_controller.go:101
1func NewDeploymentController(dInformer appsinformers.DeploymentInformer, rsInformer appsinformers.ReplicaSetInformer, podInformer coreinformers.PodInformer, client clientset.Interface) (*DeploymentController, error) {
2 // Event 相关逻辑
3 eventBroadcaster := record.NewBroadcaster()
4 eventBroadcaster.StartStructuredLogging(0)
5 eventBroadcaster.StartRecordingToSink(&v1core.EventSinkImpl{Interface: client.CoreV1().Events("")})
6
7 // ……
8
9 // new dc
10 dc := &DeploymentController{
11 client: client,
12 eventRecorder: eventBroadcaster.NewRecorder(scheme.Scheme, v1.EventSource{Component: "deployment-controller"}),
13 queue: workqueue.NewNamedRateLimitingQueue(workqueue.DefaultControllerRateLimiter(), "deployment"),
14 }
15 // 主要是 clientset
16 dc.rsControl = controller.RealRSControl{
17 KubeClient: client,
18 Recorder: dc.eventRecorder,
19 }
20 // ResourceEventHandler 配置,后面会分析
21 dInformer.Informer().AddEventHandler(cache.ResourceEventHandlerFuncs{
22 AddFunc: dc.addDeployment,
23 UpdateFunc: dc.updateDeployment,
24 DeleteFunc: dc.deleteDeployment,
25 })
26 rsInformer.Informer().AddEventHandler(cache.ResourceEventHandlerFuncs{
27 AddFunc: dc.addReplicaSet,
28 UpdateFunc: dc.updateReplicaSet,
29 DeleteFunc: dc.deleteReplicaSet,
30 })
31 podInformer.Informer().AddEventHandler(cache.ResourceEventHandlerFuncs{
32 DeleteFunc: dc.deletePod,
33 })
34
35 // 这里有主要逻辑,后面会讲
36 dc.syncHandler = dc.syncDeployment
37 dc.enqueueDeployment = dc.enqueue
38 // 各种 lister
39 dc.dLister = dInformer.Lister()
40 dc.rsLister = rsInformer.Lister()
41 dc.podLister = podInformer.Lister()
42 dc.dListerSynced = dInformer.Informer().HasSynced
43 dc.rsListerSynced = rsInformer.Informer().HasSynced
44 dc.podListerSynced = podInformer.Informer().HasSynced
45 return dc, nil
46}
ResourceEventHandler
上面提到了几个 ResourceEventHandler 回调函数:
- addDeployment
- updateDeployment
- deleteDeployment
- addReplicaSet
- updateReplicaSet
- deleteReplicaSet
- deletePod
逐个分析下。
Deployment 变更事件
这里逻辑比较简单,三个方法一起看:
- pkg/controller/deployment/deployment_controller.go:167
1func (dc *DeploymentController) addDeployment(obj interface{}) {
2 d := obj.(*apps.Deployment)
3 klog.V(4).InfoS("Adding deployment", "deployment", klog.KObj(d))
4 // 新增 Deployment 时直接 enqueue
5 dc.enqueueDeployment(d)
6}
7
8func (dc *DeploymentController) updateDeployment(old, cur interface{}) {
9 oldD := old.(*apps.Deployment)
10 curD := cur.(*apps.Deployment)
11 klog.V(4).InfoS("Updating deployment", "deployment", klog.KObj(oldD))
12 // old Deployment 只用来打印一个日志,cur Deployment enqueue
13 dc.enqueueDeployment(curD)
14}
15
16func (dc *DeploymentController) deleteDeployment(obj interface{}) {
17 d, ok := obj.(*apps.Deployment)
18 if !ok {
19 // 处理 DeletedFinalStateUnknown 场景
20 tombstone, ok := obj.(cache.DeletedFinalStateUnknown)
21 if !ok {
22 utilruntime.HandleError(fmt.Errorf("couldn't get object from tombstone %#v", obj))
23 return
24 }
25 d, ok = tombstone.Obj.(*apps.Deployment)
26 if !ok {
27 utilruntime.HandleError(fmt.Errorf("tombstone contained object that is not a Deployment %#v", obj))
28 return
29 }
30 }
31 klog.V(4).InfoS("Deleting deployment", "deployment", klog.KObj(d))
32 // 入队
33 dc.enqueueDeployment(d)
34}
ReplicaSet 变更事件
然后来看 ReplicaSet 相关回调函数的实现。
1、Added
- pkg/controller/deployment/deployment_controller.go:199
1func (dc *DeploymentController) addReplicaSet(obj interface{}) {
2 rs := obj.(*apps.ReplicaSet)
3 // 如果是准备删除了,重启的过程会收到 Added 事件,这时候直接调用删除操作
4 if rs.DeletionTimestamp != nil {
5 dc.deleteReplicaSet(rs)
6 return
7 }
8 // 查询对应的 Deployment
9 if controllerRef := metav1.GetControllerOf(rs); controllerRef != nil {
10 d := dc.resolveControllerRef(rs.Namespace, controllerRef)
11 if d == nil {
12 return
13 }
14 klog.V(4).InfoS("ReplicaSet added", "replicaSet", klog.KObj(rs))
15 // 将这个 Deployment 加入工作队列
16 dc.enqueueDeployment(d)
17 return
18 }
19
20 // 如果是一个孤儿 ReplicaSet,则看是不是能找到一个 Deployment 来领养
21 ds := dc.getDeploymentsForReplicaSet(rs)
22 if len(ds) == 0 {
23 return
24 }
25 klog.V(4).InfoS("Orphan ReplicaSet added", "replicaSet", klog.KObj(rs))
26 // 一般只有一个 Deployment,但是也不能排出多个的情况,所以这里用的是 ds 列表,循环 enqueue
27 for _, d := range ds {
28 dc.enqueueDeployment(d)
29 }
30}
2、Updated
- pkg/controller/deployment/deployment_controller.go:256
1func (dc *DeploymentController) updateReplicaSet(old, cur interface{}) {
2 curRS := cur.(*apps.ReplicaSet)
3 oldRS := old.(*apps.ReplicaSet)
4 if curRS.ResourceVersion == oldRS.ResourceVersion {
5 // Resync 的时候 RV 相同,不做处理
6 return
7 }
8
9 curControllerRef := metav1.GetControllerOf(curRS)
10 oldControllerRef := metav1.GetControllerOf(oldRS)
11 controllerRefChanged := !reflect.DeepEqual(curControllerRef, oldControllerRef)
12 if controllerRefChanged && oldControllerRef != nil {
13 // 如果 rs 的 ref 变更了,就需要通知老的 ref 对应的 Deployment
14 if d := dc.resolveControllerRef(oldRS.Namespace, oldControllerRef); d != nil {
15 dc.enqueueDeployment(d)
16 }
17 }
18
19 if curControllerRef != nil {
20 d := dc.resolveControllerRef(curRS.Namespace, curControllerRef)
21 if d == nil {
22 return
23 }
24 klog.V(4).InfoS("ReplicaSet updated", "replicaSet", klog.KObj(curRS))
25 // 当前 rs 对应 dp 入队
26 dc.enqueueDeployment(d)
27 return
28 }
29
30 // 孤儿 rs 的场景,和 Added 时处理逻辑一样
31 labelChanged := !reflect.DeepEqual(curRS.Labels, oldRS.Labels)
32 if labelChanged || controllerRefChanged {
33 ds := dc.getDeploymentsForReplicaSet(curRS)
34 if len(ds) == 0 {
35 return
36 }
37 klog.V(4).InfoS("Orphan ReplicaSet updated", "replicaSet", klog.KObj(curRS))
38 for _, d := range ds {
39 dc.enqueueDeployment(d)
40 }
41 }
42}
3、Deleted
- pkg/controller/deployment/deployment_controller.go:304
1func (dc *DeploymentController) deleteReplicaSet(obj interface{}) {
2 rs, ok := obj.(*apps.ReplicaSet)
3
4 // 删除场景需要处理的 DeletedFinalStateUnknown 场景
5 if !ok {
6 tombstone, ok := obj.(cache.DeletedFinalStateUnknown)
7 if !ok {
8 utilruntime.HandleError(fmt.Errorf("couldn't get object from tombstone %#v", obj))
9 return
10 }
11 rs, ok = tombstone.Obj.(*apps.ReplicaSet)
12 if !ok {
13 utilruntime.HandleError(fmt.Errorf("tombstone contained object that is not a ReplicaSet %#v", obj))
14 return
15 }
16 }
17
18 // 孤儿 rs 被删除时没有 Deployment 需要关心
19 controllerRef := metav1.GetControllerOf(rs)
20 if controllerRef == nil {
21 return
22 }
23 d := dc.resolveControllerRef(rs.Namespace, controllerRef)
24 if d == nil {
25 return
26 }
27 klog.V(4).InfoS("ReplicaSet deleted", "replicaSet", klog.KObj(rs))
28 // 入队
29 dc.enqueueDeployment(d)
30}
DeploymentController 启动
前面看了哪些 Event 会向 workqueue 中添加 item,接着看下这些 item 是怎么被消费的。
Run()
Run()
方法本身很简洁,根据给定的并发数,也就是默认 5 并发,启动 dc.worker
- pkg/controller/deployment/deployment_controller.go:149
1func (dc *DeploymentController) Run(workers int, stopCh <-chan struct{}) {
2 defer utilruntime.HandleCrash()
3 defer dc.queue.ShutDown()
4
5 klog.InfoS("Starting controller", "controller", "deployment")
6 defer klog.InfoS("Shutting down controller", "controller", "deployment")
7
8 if !cache.WaitForNamedCacheSync("deployment", stopCh, dc.dListerSynced, dc.rsListerSynced, dc.podListerSynced) {
9 return
10 }
11
12 for i := 0; i < workers; i++ {
13 go wait.Until(dc.worker, time.Second, stopCh)
14 }
15
16 <-stopCh
17}
继续看 worker 的内容
- pkg/controller/deployment/deployment_controller.go:460
1func (dc *DeploymentController) worker() {
2 for dc.processNextWorkItem() {
3 }
4}
5
6func (dc *DeploymentController) processNextWorkItem() bool {
7 key, quit := dc.queue.Get() // 从 workqueue 中获取一个 item
8 if quit {
9 return false
10 }
11 defer dc.queue.Done(key)
12 // 主要逻辑
13 err := dc.syncHandler(key.(string))
14 dc.handleErr(err, key)
15
16 return true
17}
这里从 workqueue 里拿到一个 key 之后,通过调用 syncHandler()
方法来处理,前面强调过这行代码:
- dc.syncHandler = dc.syncDeployment
所以接着我们继续跟 dc.syncDeployment 的实现。
syncDeployment
syncDeployment()
方法做的事情是拿着 workqueue 里出队的 key,根据这个 key 来 sync 对应的 Deployment,继续看下具体的逻辑。
- pkg/controller/deployment/deployment_controller.go
1func (dc *DeploymentController) syncDeployment(key string) error {
2 // 从 key 中分割出 namespace 和 name
3 namespace, name, err := cache.SplitMetaNamespaceKey(key)
4 if err != nil {
5 klog.ErrorS(err, "Failed to split meta namespace cache key", "cacheKey", key)
6 return err
7 }
8
9 startTime := time.Now()
10 klog.V(4).InfoS("Started syncing deployment", "deployment", klog.KRef(namespace, name), "startTime", startTime)
11 defer func() {
12 klog.V(4).InfoS("Finished syncing deployment", "deployment", klog.KRef(namespace, name), "duration", time.Since(startTime))
13 }()
14 // 根据 namespace 和 name 从 cache 中检索对应 Deployment 对象
15 deployment, err := dc.dLister.Deployments(namespace).Get(name)
16 if errors.IsNotFound(err) {
17 klog.V(2).InfoS("Deployment has been deleted", "deployment", klog.KRef(namespace, name))
18 return nil
19 }
20 if err != nil {
21 return err
22 }
23
24 // 为了不改动这个 cache,这是一个 ThreadSafeStore
25 d := deployment.DeepCopy()
26
27 // 空 LabelSelector 会匹配到所有 pods,发一个 Warning Event,更新 .Status.ObservedGeneration 然后返回
28 everything := metav1.LabelSelector{}
29 if reflect.DeepEqual(d.Spec.Selector, &everything) {
30 dc.eventRecorder.Eventf(d, v1.EventTypeWarning, "SelectingAll", "This deployment is selecting all pods. A non-empty selector is required.")
31 if d.Status.ObservedGeneration < d.Generation {
32 d.Status.ObservedGeneration = d.Generation
33 dc.client.AppsV1().Deployments(d.Namespace).UpdateStatus(context.TODO(), d, metav1.UpdateOptions{})
34 }
35 return nil
36 }
37
38 // 获取当前 Deployment 拥有的所有 ReplicaSet,同时会更新这些 ReplicaSet 的 ControllerRef
39 rsList, err := dc.getReplicaSetsForDeployment(d)
40 if err != nil {
41 return err
42 }
43 // 这个 map 是 map[types.UID][]*v1.Pod 类型,key 是 rs 的 UID,value 是对应 rs 管理的所有 pod 列表
44 podMap, err := dc.getPodMapForDeployment(d, rsList)
45 if err != nil {
46 return err
47 }
48
49 // 已经标记要删除了,这时候只更新状态
50 if d.DeletionTimestamp != nil {
51 return dc.syncStatusOnly(d, rsList)
52 }
53
54 // 根据 .Spec.Pause配置看是否更新 Deployment 的 conditions
55 if err = dc.checkPausedConditions(d); err != nil {
56 return err
57 }
58
59 if d.Spec.Paused {
60 // Pause 或 scale 时的调谐逻辑
61 return dc.sync(d, rsList)
62 }
63
64 // 应该过期了,老版本的 "deprecated.deployment.rollback.to" 注解回滚逻辑
65 if getRollbackTo(d) != nil {
66 // 回滚到旧版本的逻辑
67 return dc.rollback(d, rsList)
68 }
69 // 如果是 scale
70 scalingEvent, err := dc.isScalingEvent(d, rsList)
71 if err != nil {
72 return err
73 }
74 if scalingEvent {
75 // Pause 或 scale 时的调谐逻辑
76 return dc.sync(d, rsList)
77 }
78
79 switch d.Spec.Strategy.Type {
80 // 重建策略
81 case apps.RecreateDeploymentStrategyType:
82 return dc.rolloutRecreate(d, rsList, podMap)
83 // 滚动更新策略
84 case apps.RollingUpdateDeploymentStrategyType:
85 return dc.rolloutRolling(d, rsList)
86 }
87 return fmt.Errorf("unexpected deployment strategy type: %s", d.Spec.Strategy.Type)
88}
小结
syncDeployment()
方法看完之后,Deployment 控制器的逻辑就算过完一遍了。当然这个方法内部涉及到的一些小方法的调用这里只是简单介绍其功能,并没有深究所有实现细节,不过这些小方法的逻辑都不难,就暂不赘述了。
对 Deployment Controller 的代码分析在 client-go 和 Job Controller 之后,所以这里看起来感觉会很简单,对应有些描述也没有那么详细,如果大家看过前面我发的相关文章,看本文的逻辑应该也不会感觉吃力,反正我希望你先回过头看下我之前发的相关文章,最新版可以在我的博客网站 Daniel Hu's Blog 查阅。
转载请保留本文原始链接 https://www.danielhu.cn)
Kubernetes Deployment 源码分析(二)的更多相关文章
- Kubernetes Deployment 源码分析(一)
概述Deployment 基础创建 DeploymentReplicaSet滚动更新失败回滚历史版本回滚其他特性小结 概述 Deployment 是最常用的 Kubernetes 原生 Workloa ...
- Fresco 源码分析(二) Fresco客户端与服务端交互(1) 解决遗留的Q1问题
4.2 Fresco客户端与服务端的交互(一) 解决Q1问题 从这篇博客开始,我们开始讨论客户端与服务端是如何交互的,这个交互的入口,我们从Q1问题入手(博客按照这样的问题入手,是因为当时我也是从这里 ...
- 框架-springmvc源码分析(二)
框架-springmvc源码分析(二) 参考: http://www.cnblogs.com/leftthen/p/5207787.html http://www.cnblogs.com/leftth ...
- Tomcat源码分析二:先看看Tomcat的整体架构
Tomcat源码分析二:先看看Tomcat的整体架构 Tomcat架构图 我们先来看一张比较经典的Tomcat架构图: 从这张图中,我们可以看出Tomcat中含有Server.Service.Conn ...
- 十、Spring之BeanFactory源码分析(二)
Spring之BeanFactory源码分析(二) 前言 在前面我们简单的分析了BeanFactory的结构,ListableBeanFactory,HierarchicalBeanFactory,A ...
- Vue源码分析(二) : Vue实例挂载
Vue源码分析(二) : Vue实例挂载 author: @TiffanysBear 实例挂载主要是 $mount 方法的实现,在 src/platforms/web/entry-runtime-wi ...
- 多线程之美8一 AbstractQueuedSynchronizer源码分析<二>
目录 AQS的源码分析 该篇主要分析AQS的ConditionObject,是AQS的内部类,实现等待通知机制. 1.条件队列 条件队列与AQS中的同步队列有所不同,结构图如下: 两者区别: 1.链表 ...
- Kubernetes client-go 源码分析 - Reflector
概述入口 - Reflector.Run()核心 - Reflector.ListAndWatch()Reflector.watchHandler()NewReflector()小结 概述 源码版本: ...
- ABP源码分析二:ABP中配置的注册和初始化
一般来说,ASP.NET Web应用程序的第一个执行的方法是Global.asax下定义的Start方法.执行这个方法前HttpApplication 实例必须存在,也就是说其构造函数的执行必然是完成 ...
随机推荐
- trait能力在PHP中的使用
相信大家对trait已经不陌生了,早在5.4时,trait就已经出现在了PHP的新特性中.当然,本身trait也是特性的意思,但这个特性的主要能力就是为了代码的复用. 我们都知道,PHP是现代化的面向 ...
- TP5 数据保存、更新问题(save、saveAll)
一.今天写项目的时候,突然发现一个坑爹的问题,使用saveAll新增多条数据,但是一直提示缺少更新条件,然而我发现代码里面并没有更新,而且saveAll我仅仅是去新增多条数据而已 原来源码 模型类中有 ...
- Java基础系列(25)- break、continue、goto
break在任何循环语句的主体部分,均可用break控制循环的流程.break用于强行退出循环,不执行循环中剩余的语句.(break语句也在switch语句中使用) continue语句用于在循环语句 ...
- Kafka 3.0新特性
1.概述 Kafka是一个分布表示实时数据流平台,可独立部署在单台服务器上,也可部署在多台服务器上构成集群.它提供了发布与订阅的功能,用户可以发送数据到Kafka集群中,也可以从Kafka集群中读取数 ...
- YbtOJ-大收藏家【分层图,最大流】
正题 题目链接:https://www.ybtoj.com.cn/contest/117/problem/2 题目大意 \(n\)个人,每人有\(a_i\)个属于自己的物品.\(m\)次交换依次进行, ...
- 深入浅出WPF-06.Binding(绑定)03
MultiBinding(多路Binding) 当UI中的显示信息是由源Source中的多个数据来决定时,使用MultiBinding.他和Binding的区别是需要传递多个元数据,针对多个数据源需要 ...
- VueCLI3 创建vue项目
关于旧版本 Vue CLI 的包名称由 vue-cli 改成了 @vue/cli. 如果你已经全局安装了旧版本的 vue-cli (1.x 或 2.x),你需要先通过 npm uninstall vu ...
- Windows10 IIS Web服务器安装配置
前言: 对于.NET开发者而已,IIS Web托管服务器应该是十分的熟悉的.对于刚安装Windows10的系统的用户而已Internet Information Services(IIS)功能是默认关 ...
- 4-让线程睡眠的sleep方法
让线程睡眠的sleep方法 Thread类有一个静态的sleep方法,当一个执行中的线程调用了Thread的sleep方法,调用线程就会让出指定时间的执行权,也就是在这期间不参与CPU调度,但是该线程 ...
- dg create datafile auto failed 排除处理
1.Environment:11.2.0.4 dg 2.Symptoms:告警描述:Wed Sep 22 14:29:15 2021Errors in file /data/app/oracle/di ...