Controller Manager作为集群内部的管理控制中心,负责集群内的Node、Pod副本、服务端点(Endpoint)、命名空间(Namespace)、服务账号(ServiceAccount)、资源定额(ResourceQuota)等的管理,当某个Node意外宕机时,及时发现并执行自动化修复流程。

Controller Manager内部包含Replication Controller、Node Controller、ResourceQuota Controller、Namespace Controller、ServiceAccount Controller、Token Controller、Service Controller及Endpoint Controller等多个Controller,每种Controller都负责一种具体的控制流程。

1.1 Replication Controller

为了区别Controller Manager中的Replication Controller副本控制器和资源对象Replication Controller。将资源对象简写为RC。Replication Controller指副本控制器

副本控制器核心作用时确保任何时候集群中一个RC所关联的Pod副本数量保持预设值。超出摧毁,反之则创建。只有当pod重启策略为Always时,才会管理该pod的操作。pod被创建后不会消失,唯一的例外时当pod处于succeeded或failed状态时间过长,被系统自动回收。副本控制器会再其他工作节点重新创建,运行pod副本。

RC中的Pod模板就像一个模具,制作出的东西离开模具,之间不存在关系了。pod被创建后,模板如何变化都不会影响这个pod。pod可以通过修改标签脱离RC的管控。用来从集群中迁移,数据修复等调试。pod被迁移后,RC会创建新的pod替代之前的pod。删除RC不会影响之前创建的pod,如果要删除RC控制的pod,将RC中的副本数设置为0

副本控制器的职责如下

(1)确保当前集群中由且仅有N个Pod实例,N时RC中定义的Pod副本数量

(2)通过调整RC的spec.replicas属性值来实现系统扩容和缩容。

(3)通过改变RC中的pod模板(主要是镜像版本)来实现系统的滚动升级。

1.2 Node Controller

kubelet定时向API Server汇报状态信息,API Server接受到信息后更新到etcd。etcd存储的节点信息包括节点健康状态,节点资源,节点名称,节点地址信息,操作系统版本,Docker版本,kubelet版本。节点健康状态包含就绪True,未就绪False和未知Unknown三种。

(1)启动时如果设置了--clustr-cidr参数,那么为每个没有设置Spec。PodCIDR的Node节点生成一个CIDR地址,并用该CIDR地址设置节点的Spec.PodCIDR属性。防止不同系欸但的CIDR地址发生冲突。

(2)逐个读取节点信息,多次尝试修改nodeStatusMap中的节点状态信息,将该节点信息和Node Controller的nodeStatusMap中保存的节点信息做比较。如果判断没有收到kubelet发出的节点信息,或者第一次收到,或者节点状态变成非健康。则再nodeStatusMap中保存该节点的状态信息,并用Node Controller所在节点的系统时间作为探测时间和节点状态变化时间。如果节点信息发生改变,保存该节点状态信息。并用Node Controller所在节点的系统时间未作探测时间和节点状态变化时间。如果收到节点信息,但状态没改变,保存系欸但状态信息,用Node Controller所在节点系统时间作为探测时间,用上次节点信息的节点状态变化时间作为该节点的状态变化时间。如果一段时间没有收到节点状态信息,设置节点状态为未知,并且通过API Server保存节点状态。

(3)逐个读取节点信息,如果节点状态为非就绪状态,将节点加入待删除队列,否则将节点从该队列中删除。如果节点状态为非就绪状态,且系统指定了Cloud Provider,则调用Cloud Provider查看节点,发现节点故障,删除etcd中节点信息,并删除该节点相关的pod等资源信息。

1.3 ResourceQuota Controller

资源配额管理确保了指定的资源对象再任何时候不会超量占用系统物理资源,避免由于某些业务进程的设计或实现的缺陷导致整个系统运行紊乱甚至意外宕机,对集群的平稳运行和稳定性有非常重要的作用。

kubernetes支持如下三个层次的资源配额管理。

(1)容器级别,对CPU和Memory进行限制

(2)Pod级别,对一个pod内所有容器的可用资源进行限制。

(3)Namespace级别,为Namespace多租户级别的资源限制,包括pod数量,RC数量,Service数量,ResourceQuota数量,Secert数量,可持有的PV数量。

kubernetes配额管理通过Admission Control准入控制来控制的,Admission Control当前提供了两种方式的配额约束,分别是LimitRanger与ResourceQuota。其中LimitRanger作用域Pod和Container上,ResourceQuota作用于Namespace上,限制Namespace里的各类资源的使用总额。

1.4 Namespace Controller

用户通过Apiserver 可以创建新的Namespace并保存在etcd中,Namespace Controller定期通过API Server读取这些Namespace信息。如果Namespace被API表示为优雅删除,则将该NameSpace状态设hi为Terminating并保存到etcd中,Namespace Controller删除该Namespace下所有的资源对象。

当Namespace状态被设置成Terminating后,Admission Controller的NamespaceLifecycle插件来阻止为该Namespace创建新的资源。Namespace Controller删除完该Namespace所有资源对象后,对该Namespace执行finalize操作,删除Namespace的spec.finalizers域中的信息。

如果Namespace设置了删除期限,并且spec.finalizers域值为空,Namespace Controller通过API Server删除该Namespace资源。

1.5 Service Controller与Endpoint Controller

Endpoints表示了一个Service对应的所有Pod副本的访问地址,而endpoints controller就是负责生成和维护所有Endpoints对象的控制器。负责监听Service和对应的pod副本的变化,如果Service被删除,删除和该Service同名的Endpoints对象。如果新的Service被创建或者修改,根据该Service信息获得相关的pod列表,然后创建或者更新Service对应的Endpoints对象。如果监测到pod的事件,则更新它所对应的Service的Endpoints对象

每个Node上的kube-proxy进程获取每个Service的Endpoints,实现Service的负载均衡。

kubernetes之Controller Manager原理分析的更多相关文章

  1. kubernetes的Controller Manager

    1. Controller Manager简介 Controller Manager作为集群内部的管理控制中心,负责集群内的Node.Pod副本.服务端点(Endpoint).命名空间(Namespa ...

  2. 029.核心组件-Controller Manager

    一 Controller Manager原理 1.1 Controller Manager概述 一般来说,智能系统和自动系统通常会通过一个"控制系统"来不断修正系统的工作状态.在K ...

  3. Kubernetes Job Controller 原理和源码分析(二)

    概述程序入口Job controller 的创建Controller 对象NewController()podControlEventHandlerJob AddFunc DeleteFuncJob ...

  4. Kubernetes Job Controller 原理和源码分析(一)

    概述什么是 JobJob 入门示例Job 的 specPod Template并发问题其他属性 概述 Job 是主要的 Kubernetes 原生 Workload 资源之一,是在 Kubernete ...

  5. Kubernetes Job Controller 原理和源码分析(三)

    概述Job controller 的启动processNextWorkItem()核心调谐逻辑入口 - syncJob()Pod 数量管理 - manageJob()小结 概述 源码版本:kubern ...

  6. kubernetes垃圾回收器GarbageCollector Controller源码分析(二)

    kubernetes版本:1.13.2 接上一节:kubernetes垃圾回收器GarbageCollector Controller源码分析(一) 主要步骤 GarbageCollector Con ...

  7. kubernetes之Scheduler原理分析

    scheduler在整个系统承担了承上启下的重要功能 承上值负责接受Controller Manager创建新的pod,安排目标Node 旗下指安置工作完成后,目标Node上的kubelet服务进程接 ...

  8. Kubernetes Controller Manager

    Controller Manager 作为集群内部的管理控制中心,负责集群内的Node.Pod副本.Service Endpoint.NameSpace.ServiceAccount.Resource ...

  9. SPI协议及工作原理分析

    说明.文章摘自:SPI协议及其工作原理分析 http://blog.csdn.net/skyflying2012/article/details/11710801 一.概述. SPI, Serial ...

随机推荐

  1. springcloud中微服务的优雅停机(已验证)

    大部分项目部署中,为了方便,可能都直接使用kill -9 服务的pid来停掉服务. 但是由于Eureka采用心跳的机制来上下线服务,会导致服务消费者调用此已经kill的服务提供者然后出错. 可以采用以 ...

  2. python开发笔记-类

    类的基本概念: 问题空间:问题空间是问题解决者对一个问题所达到的全部认识状态,它是由问题解决者利用问题所包含的信息和已贮存的信息主动的地构成的. 初始状态:一开始时的不完全的信息或令人不满意的状况: ...

  3. C++中字符数组和字符指针问题

    环境:vs2010 说明:在阅读这部分内容之前应该先明确C++内存分配问题 ,那一篇文章说的比较清楚. 1.字符数组,初始化: char str1[]="abc"; char st ...

  4. docker拷贝宿主与容器中的文件

    从容器里面拷文件到宿主机 语法:docker cp 容器名:要拷贝的文件在容器里面的路径 要拷贝到宿主机的相应路径 例子:容器名为ubuntu,要从容器里面拷贝的文件路为:/usr/local/tom ...

  5. ML.NET 笔记

    ROC曲线 ROC空间将偽陽性率(FPR)定義為 X 軸,真陽性率(TPR)定义为 Y 轴. TPR:在所有實際為陽性的樣本中,被正確地判斷為陽性之比率. FPR:在所有實際為阴性的样本中,被錯誤地判 ...

  6. 《OKR工作法》——打造一支专一的团队

    <OKR工作法>在最开始讲了这样一个故事,阿塔兰忒是斯巴达跑的最快的人,她的父亲为了将她嫁出去举办了一场跑步比赛并许诺冠军可以娶自己的女儿,阿塔兰忒为了不结婚决定参加比赛自己拿冠军.然而在 ...

  7. 28-ESP8266 SDK开发基础入门篇--编写wifi模块TCP 客户端程序(官方API版,非RTOS版)

    https://www.cnblogs.com/yangfengwu/p/11432795.html 注:这节实现的功能是WIFI模块作为TCP 客户端,连接咱的TCP服务器,然后实现透传 本来想着做 ...

  8. mapreduce中reduce没有执行

    hadoop执行mapreduce过程reduce不执行原因 1.如果你的map过程中没有context.write()是不执行reduce过程的:2.如果你的map过程中context.write( ...

  9. 梯度裁剪(Clipping Gradient):torch.nn.utils.clip_grad_norm

    torch.nn.utils.clip_grad_norm_(parameters, max_norm, norm_type=2) 1.(引用:[深度学习]RNN中梯度消失的解决方案(LSTM) ) ...

  10. D3.js的v5版本入门教程(第十章)

    在这一章我们干点有趣的事——让我们上一章绘制的图表动起来,这样岂不是很有意思 为了让图表动起来,我们还是需要以下新的知识点 .attr(xxx) .transition() .attr(xxx),tr ...