本文分享自华为云社区《kube-apiserver限流机制原理》，作者：可以交个朋友。

背景

apiserver是kubernetes中最重要的组件，一旦遇到恶意刷接口或请求量超过承载范围，apiserver服务可能会崩溃，导致整个kubernetes集群不可用。所以我们需要对apiserver做限流处理来提升kubernetes的健壮性。

k8s-apiserver限流能力发展过程

apiserver限流能力的发展分为两个阶段：

kubernetes 1.18版本之前kube-apiserver只是将请求分成了变更类型(create、update、delete、patch)和非变更类型(get、list、watch)，并通过启动参数设置了两种类型的最大并发数。

--max-requests-inflight　 　　　　    ## 限制同时运行的非变更类型请求的个数上限，0表示无限制。

--max-mutating-requests-inflight　  ## 限制同时运行的变更类型请求的个数上限。0 表示无限制。

此时的apiserver限流能力较弱，若某个客户端错误的向kube-apiserver发起大量的请求时，必然会阻塞kube-apiserver，影响其他客户端的请求，因此高阶的限流APF就诞生了。

kubernetes1.18版本之后APF（ APIPriorityAndFairness ）成为kubernetes的默认限流方式。 APF以更细粒度的方式对请求进行分类和隔离，根据优先级和公平性进行处理。

--enable-priority-and-fairness   ##  该值作为APF特性开关，默认为true

--max-requests-inflight、--max-mutating-requests-inflight    ## 当开启APF时，俩值相加确定kube-apiserver的总并发上限

两个阶段限流能力对比

限流能力	1.18版本前	1.18版本后(APF)
颗粒度	仅根据是否变更做分类	可以根据请求对象、请求者身份、命名空间等做分类
隔离性	一个坏用户可能堵塞整个系统	为请求分配固定队列，坏请求只能撑爆其使用的队列
公平性	会出现饿死	用公平性算法从队列中取出请求
优先级	无	有特权级别，可让重要请求不被限制

APF关键资源介绍

APF通过FlowSchema 和 PriorityLevelConfiguration两个资源配置限流策略。

FlowSchema：解决老版本分类颗粒度粗的问题。根据rules字段匹配请求，匹配规则包含：请求对象、执行操作、请求者身份和命名空间

apiVersion: flowcontrol.apiserver.k8s.io/v1beta2

kind: FlowSchema                 # 一个kubernetes集群中可以定义多个FlowSchema

metadata:

  name: myfl

spec:

  distinguisherMethod:           # 可选值为：ByNamespace或ByUser，用于把请求分组。属于同组的请求会分配到固定的queue中，如果省略该参数，则该FlowSchema匹配的所有请求都将视为同一个分组。

    type: ByUser

  matchingPrecedence: 90         # 数字越小代表FlowSchema的匹配顺序越在前，取值范围：1~10000。

  priorityLevelConfiguration:    # FlowSchema关联的priorityLevelConfiguration

    name: mypl

  rules:

  - nonResourceRules:            # 匹配非资源型：匹配接口URL

    - nonResourceURLs:

      - '*'

    resourceRules:               # 匹配资源型：匹配apigroup、namespace、resources、verbs

    - apiGroups:

      - '*'

      namespaces:

      - '*'

      resources:

      - '*'

      verbs:

      - get

      - create

      - list

      - update

    subjects:                   # 匹配请求者主体：可选Group、User、ServiceAccount

    - group:

        name: '*'

      kind: Group

    - kind: User

      user:

        name: '*'

    - kind: ServiceAccount

      serviceAccount:

        name: myserviceaccount

        namespace: demo

PriorityLevelConfiguration：解决老版本隔离性差的问题和优先级问题，并定义了限流细节（总队列数、队列长度、是否可排队）。当请求与某个FlowSchema匹配后，该请求会关联FlowSchema中指定的PriorityLevelConfiguration资源，每个PriorityLevelConfiguration相互隔离，且能承受的并发请求数也不一样

apiVersion: flowcontrol.apiserver.k8s.io/v1beta2

kind: PriorityLevelConfiguration          ## 每个PriorityLevelConfiguration有自己独立的限流配置， PriorityLevelConfiguration之间是完全隔离的。

metadata:

  name: mypl

spec:

  type: Limited                           # 设置是否为特权级别，如果为Exempt则不进行限流，如果为Limited则进行限流

  limited:

    assuredConcurrencyShares: 2           # 值越大，PriorityLevelConfiguration的并发上限越高。若当前并发执行数未达到并发上限，则PL处于空闲状态。

    limitResponse:                        # 定义如何处理当前无法被处理的请求

      type: Queue                         # 类型，Queue或者Reject，Reject直接返回429并拒绝，Queue将请求加入队列

      queuing:

        handSize: 1                       # 根据ByNamespace或ByUser对请求分组，每个分组对应queues的数量，

        queueLengthLimit: 20              # 此PriorityLevelConfiguration中每个队列的长度

        queues: 2                         # 此PriorityLevelConfiguration中的队列数

一个FlowSchema只能关联一个priorityLevelConfiguration，多个FlowSchema可以关联同一个priorityLevelConfiguration

PriorityLevelConfiguration并发上限 = assuredConcurrencyShares / 所有assuredConcurrencyShares之和 * apiserver总并发数

APF处理过程

请求与集群中的FlowSchema列表按照顺序依次匹配，每个FlowSchema的matchingPrecedence字段决定其在列表中的顺序，matchingPrecedence字段值越小，越靠前，越先进行匹配请求。

根据FlowSchema资源中的rules规则进行匹配，匹配方式可以是 “请求的资源类型”、“请求的动作类型”、“请求者的身份”、“请求的命名空间” 等多个维度。

若请求与某个FlowSchema成功匹配，匹配就会结束。FlowSchema关联着一个PriorityLevelConfiguration，每个PriorityLevelConfiguration中包含许多queue，根据FlowSchema.spec.Distinguisher字段将请求进行"分组"，根据分组来分配queue，分配queue数量由PriorityLevelConfiguration资源的handSize字段决定，如果省略该参数，则该FlowSchema匹配的所有请求都将视为同一个"分组"。

每个PriorityLevelConfiguration资源都有独立的并发上限，assuredConcurrencyShares字段为apiserver总并发数的权重占比，值越大分配的并发上限就越高，当PriorityLevelConfiguration达到并发上限后，请求会根据所属的"分组"写入固定的queue中，请求被阻塞等待。请求与queue的固定关联可以让恶意用户只影响其使用的queue，而不会影响同PriorityLevelConfiguration中的其他queue。

当PriorityLevelConfiguration未达到并发上限时，fair queuing算法从所有queue中选择一个合适的queue取出请求，解除请求的阻塞，执行这个请求。fair queuing算法能保证同一个 PriorityLevelConfiguration 中的所有queue被处理机会平等。

APF实战

kubernetes原生自带了一些FlowSchema和PriorityLevelConfiguration规则，我们选择一个查看，如下图：

下面我们创建新的APF规则：当请求对象是apf命名空间中的deployment，则进行"apfpl"限流规则。

apiVersion: flowcontrol.apiserver.k8s.io/v1beta2

kind: FlowSchema

metadata:

  name: apffl

spec:

  matchingPrecedence:  150

  priorityLevelConfiguration:

    name: apfpl                           ## 关联名为apfpl的PriorityLevelConfiguration

  rules:

    - resourceRules:

      - apiGroups:

          - apps

        clusterScope: true

        namespaces:

          - apf                           ## 匹配apf命名空间

        resources:

          - deployments                   ## 匹配操作deployment的请求

        verbs:

          - '*'                           ## 匹配任意操作类型

      subjects:

        - kind: Group

          group:

            name: '*'                     ## 匹配任意组身份

---

apiVersion: flowcontrol.apiserver.k8s.io/v1beta2

kind: PriorityLevelConfiguration

metadata:

  name: apfpl

spec:

  limited:

    assuredConcurrencyShares: 2

    limitResponse:                         ## 设置限流处理细节

      queuing:

        handSize: 1

        queueLengthLimit: 20

        queues: 2

      type: Queue

  type: Limited                             ## 对请求做限流处理

接着在apf命名空间和default命名空间分别创建deployment进行测试。apf_fs为请求被分类到的 FlowSchema 的名称，apf_pl为该请求的优先级名称。查看apiserver日志信息，见下图：

循环操作deployment，我们可以使用命令查看是否触发限流等待

kubectl get --raw /debug/api_priority_and_fairness/dump_priority_levels

返回waitingRequests非0，则代表触发最大并发数，有请求被限流进入等待队列。PriorityLevelConfiguration资源不为空闲表示已达到并发上限

点击关注，第一时间了解华为云新鲜技术~

kube-apiserver限流机制原理的更多相关文章

Hadoop内部的限流机制
前言文章标题一開始提及到了一个令人感到有些抽象又显得有些非常"大"的词,限流.事实上这个词语在非常多行业都能够用到,比方近期春运,各大主要城市,火车站,地铁站都要做到限流吧,避免 ...
Sentinel限流实现原理
Sentinel限流的神秘面纱: 之前我们学习过限流比较主流的三种算法:漏桶,令牌桶,滑动窗口.而Sentinel采用的是最后一种,滑动窗口来实现限流的. 通过对Sentinel基础Api的使用,我们 ...
详解Redisson分布式限流的实现原理
摘要:本文将详细介绍下RRateLimiter的具体使用方式.实现原理还有一些注意事项. 本文分享自华为云社区<详解Redisson分布式限流的实现原理>,作者: xindoo. 我们目前 ...
【Distributed】限流技巧
一.概述 1.1 高并发服务限流特技 1.2 为什么要互联网项目要限流 1.3 高并发限流解决方案二.限流算法 2.1 计数器 2.2 滑动窗口计数 2.3 令牌桶算法使用RateLimiter实 ...
服务熔断、降级、限流、异步RPC -- HyStrix
背景伴随着业务复杂性的提高,系统的不断拆分,一个面向用户端的API,其内部的RPC调用层层嵌套,调用链条可能会非常长.这会造成以下几个问题: API接口可用性降低引用Hystrix官方的一个例子, ...
rest framework之限流组件
一.自定义限流限流组件又叫做频率组件,用于控制客户端可以对API进行的请求频率,比如说1分钟访问3次,如果在1分钟内超过3次就对客户端进行限制. 1.自定义限流假设现在对一个API访问,在30s内 ...
从-99打造Sentinel高可用集群限流中间件
接上篇Sentinel集群限流探索,上次简单提到了集群限流的原理,然后用官方给的 demo 简单修改了一下,可以正常运行生效. 这一次需要更进一步,基于 Sentinel 实现内嵌式集群限流的高可用方 ...
Redis的自增也能实现滑动窗口限流？
限流是大家开发之路上一定会遇到的需求.比如:限制一定时间内,接口请求请求频率:一定时间内用户发言.评论次数等等,类似于滑动窗口算法.这里分享一份拿来即用的代码,一起看看如何利用常见的 Redis 实现 ...
超详细的Guava RateLimiter限流原理解析
超详细的Guava RateLimiter限流原理解析 mp.weixin.qq.com 点击上方“方志朋”,选择“置顶或者星标” 你的关注意义重大! 限流是保护高并发系统的三把利器之一,另外两个是 ...
SpringBoot 整合 RabbitMQ（包含三种消息确认机制以及消费端限流）
目录说明生产端消费端说明本文 SpringBoot 与 RabbitMQ 进行整合的时候,包含了三种消息的确认模式,如果查询详细的确认模式设置,请阅读:RabbitMQ的三种消息确认模式同 ...

随机推荐

Kotlin 基础入门
目录一.基础语法 1.1 常见数据类型 1.2 变量 1.2.1 变量声明 1.2.2 类型推断 1.2.3 Null 安全 1.2.4 面向对象语言 1.3 流程控制 1.3.1 if 表达式 1 ...
java+mysql学生信息管理系统
实现:mysql+eclipse(idea设置之后也可运行)+jdk8 功能: 管理员:管理登+管理员注册学生:添加学生信息+删除学生信息+修改学生信息+查询学生信息+学生列表展示界面展示: 详情 ...
[Rust] 变量的属性: 不可变(immutable), 可变(mutable), 重定义(shadowing), 常量(const), 静态(static)
[Rust] 变量的属性: 不可变(immutable), 可变(mutable), 重定义(shadowing), 常量(const), 静态(static) 变量的可变性在 Rust 中, 变量 ...
【Azure 环境】使用 az ad group create 时候遇见 Insufficient privileges to complete the operation
问题描述使用China Azure,通过Azure CLI 创建AAD组报错,提示权限不足 Insufficient privileges to complete the operation # 使 ...
【Azure 存储服务】使用POST方式向Azure Storage Queue中插入Message的办法
问题描述使用POST HTTP Request, 如何向Azure Storage Queue中写入Message呢?例如使用CURL发送POST指令是否可以呢? CURL -H "Con ...
C#的托盘窗体显示与隐藏效果 - 开源研究系列文章
今天无聊,进行的C#的编码内容仍然在继续.这些天不断地在完善及编写C#的Winform相关的代码,并将其整理形成博文.这次带来的是关于窗体的显示及隐藏效果的代码段.上次有过一个代码,这次当做新代码进行 ...
手把手教你蜂鸟e203协处理器的扩展
NICE协处理器赛题要求: 对蜂鸟E203 RISC-V内核进行运算算子(譬如加解密算法.浮点运算.矢量运算等)的扩展,可通过NICE协处理器接口进行添加,也可直接实现RISC-V指令子集(譬如 ...
以Servlet来解释抽象实现类
在 Java Servlet API 中: Servlet 接口定义了一个 Servlet 的基本行为.这个接口是抽象的,因为它包含抽象方法,比如 service(), init(), 和 destr ...
制作有延迟插件的rabbitmq镜像
插件Git官方地址:https://github.com/rabbitmq/rabbitmq-delayed-message-exchange Dockerfile FROM rabbitmq:3.8 ...
CYQ.Data 支持 DaMeng 达梦数据库
DaMeng 达梦数据库介绍: 达梦数据库(DMDB)是中国自主研发的关系型数据库管理系统,由达梦科技股份有限公司开发. 达梦数据库提供了企业级的数据库解决方案,广泛应用于金融.电信.政府.制造等行业 ...

kube-apiserver限流机制原理