简介：弹性伸缩作为 Kubernetes 的核心能力之一，但它一直是围绕这无状态的应用负载展开。而 Fluid 提供了分布式缓存的弹性伸缩能力，可以灵活扩充和收缩数据缓存。它基于 Runtime 提供了缓存空间、现有缓存比例等性能指标, 结合自身对于 Runtime 资源的扩缩容能力，提供数据缓存按需伸缩能力。

作者 |
车漾 Fluid 社区 Commiter
谢远东 Fluid 社区 Commiter
来源 | 阿里巴巴云原生公众号

导读：弹性伸缩作为 Kubernetes 的核心能力之一，但它一直是围绕这无状态的应用负载展开。而 Fluid 提供了分布式缓存的弹性伸缩能力，可以灵活扩充和收缩数据缓存。它基于 Runtime 提供了缓存空间、现有缓存比例等性能指标, 结合自身对于 Runtime 资源的扩缩容能力，提供数据缓存按需伸缩能力。

背景

随着越来越多的大数据和 AI 等数据密集应用开始部署和运行在 Kubernetes 环境下，数据密集型应用计算框架的设计理念和云原生灵活的应用编排的分歧，导致了数据访问和计算瓶颈。云原生数据编排引擎 Fluid 通过数据集的抽象，利用分布式缓存技术，结合调度器，为应用提供了数据访问加速的能力。

弹性伸缩作为 Kubernetes 的核心能力之一，但它一直是围绕这无状态的应用负载展开。而 Fluid 提供了分布式缓存的弹性伸缩能力，可以灵活扩充和收缩数据缓存。它基于 Runtime 提供了缓存空间、现有缓存比例等性能指标, 结合自身对于 Runtime 资源的扩缩容能力，提供数据缓存按需伸缩能力。

这个能力对于互联网场景下大数据应用非常重要，由于多数的大数据应用都是通过端到端流水线来实现的。而这个流水线包含以下几个步骤：

数据提取：利用 Spark，MapReduce 等大数据技术对于原始数据进行预处理。
模型训练：利用第一阶段生成特征数据进行机器学习模型训练，并且生成相应的模型。
模型评估：通过测试集或者验证集对于第二阶段生成模型进行评估和测试。
模型推理：第三阶段验证后的模型最终推送到线上为业务提供推理服务。

可以看到端到端的流水线会包含多种不同类型的计算任务，针对每一个计算任务，实践中会有合适的专业系统来处理（TensorFlow，PyTorch，Spark， Presto）；但是这些系统彼此独立，通常要借助外部文件系统来实现把数据从一个阶段传递到下一个阶段。但是频繁的使用文件系统实现数据交换，会带来大量的 I/O 开销，经常会成为整个工作流的瓶颈。

而 Fluid 对于这个场景非常适合，用户可以创建一个 Dataset 对象，这个对象有能力将数据分散缓存到 Kubernetes 计算节点中，作为数据交换的介质，这样避免了数据的远程写入和读取，提升了数据使用的效率。但是这里的问题是临时数据缓存的资源预估和预留。由于在数据生产消费之前，精确的数据量预估是比较难满足，过高的预估会导致资源预留浪费，过低的预估会导致数据写入失败可能性增高。还是按需扩缩容对于使用者更加友好。我们希望能够达成类似 page cache 的使用效果，对于最终用户来说这一层是透明的但是它带来的缓存加速效果是实实在在的。

我们通过自定义 HPA 机制，通过 Fluid 引入了缓存弹性伸缩能力。弹性伸缩的条件是当已有缓存数据量达到一定比例时，就会触发弹性扩容，扩容缓存空间。例如将触发条件设置为缓存空间占比超过 75%，此时总的缓存空间为 10G，当数据已经占满到 8G 缓存空间的时候，就会触发扩容机制。

下面我们通过一个例子帮助您体验 Fluid 的自动扩缩容能力。

前提条件

推荐使用 Kubernetes 1.18 以上，因为在 1.18 之前，HPA 是无法自定义扩缩容策略的，都是通过硬编码实现的。而在 1.18 后，用户可以自定义扩缩容策略的，比如可以定义一次扩容后的冷却时间。

具体步骤

1. 安装 jq 工具方便解析 json。

在本例子中我们使用操作系统是 centos，可以通过 yum 安装 jq。

yum install -y jq

2. 下载、安装 Fluid 最新版。

git clone https://github.com/fluid-cloudnative/fluid.git

cd fluid/charts

kubectl create ns fluid-system

helm install fluid fluid

3. 部署或配置 Prometheus。

这里通过 Prometheus 对于 AlluxioRuntime 的缓存引擎暴露的 Metrics 进行收集，如果集群内无 prometheus：

$ cd fluid

$ kubectl apply -f integration/prometheus/prometheus.yaml

如集群内有 prometheus，可将以下配置写到 prometheus 配置文件中：

scrape_configs:

  - job_name: 'alluxio runtime'

    metrics_path: /metrics/prometheus

    kubernetes_sd_configs:

      - role: endpoints

    relabel_configs:

    - source_labels: [__meta_kubernetes_service_label_monitor]

      regex: alluxio_runtime_metrics

      action: keep

    - source_labels: [__meta_kubernetes_endpoint_port_name]

      regex: web

      action: keep

    - source_labels: [__meta_kubernetes_namespace]

      target_label: namespace

      replacement: $1

      action: replace

    - source_labels: [__meta_kubernetes_service_label_release]

      target_label: fluid_runtime

      replacement: $1

      action: replace

    - source_labels: [__meta_kubernetes_endpoint_address_target_name]

      target_label: pod

      replacement: $1

      action: replace

4. 验证 Prometheus 安装成功。

$ kubectl get ep -n kube-system  prometheus-svc

NAME             ENDPOINTS        AGE

prometheus-svc   10.76.0.2:9090   6m49s

$ kubectl get svc -n kube-system prometheus-svc

NAME             TYPE       CLUSTER-IP      EXTERNAL-IP   PORT(S)          AGE

prometheus-svc   NodePort   172.16.135.24   <none>        9090:32114/TCP   2m7s

如果希望可视化监控指标，您可以安装 Grafana 验证监控数据，具体操作可以参考文档。

5. 部署 metrics server。

检查该集群是否包括 metrics-server，执行kubectl top node有正确输出可以显示内存和 CPU，则该集群 metrics server 配置正确。

kubectl top node

NAME                       CPU(cores)   CPU%   MEMORY(bytes)   MEMORY%

192.168.1.204   93m          2%     1455Mi          10%

192.168.1.205   125m         3%     1925Mi          13%

192.168.1.206   96m          2%     1689Mi          11%

否则手动执行以下命令：

kubectl create -f integration/metrics-server

6. 部署 custom-metrics-api 组件。

为了基于自定义指标进行扩展，你需要拥有两个组件：

第一个组件是从应用程序收集指标并将其存储到 Prometheus 时间序列数据库。
第二个组件使用收集的度量指标来扩展 Kubernetes 自定义 metrics API，即 k8s-prometheus-adapter。

第一个组件在第三步部署完成，下面部署第二个组件。

如果已经配置了custom-metrics-api，在 adapter 的 configmap 配置中增加与 dataset 相关的配置：

apiVersion: v1

kind: ConfigMap

metadata:

  name: adapter-config

  namespace: monitoring

data:

  config.yaml: |

    rules:

    - seriesQuery: '{__name__=~"Cluster_(CapacityTotal|CapacityUsed)",fluid_runtime!="",instance!="",job="alluxio runtime",namespace!="",pod!=""}'

      seriesFilters:

      - is: ^Cluster_(CapacityTotal|CapacityUsed)$

      resources:

        overrides:

          namespace:

            resource: namespace

          pod:

            resource: pods

          fluid_runtime:

            resource: datasets

      name:

        matches: "^(.*)"

        as: "capacity_used_rate"

      metricsQuery: ceil(Cluster_CapacityUsed{<<.LabelMatchers>>}*100/(Cluster_CapacityTotal{<<.LabelMatchers>>}))

否则手动执行以下命令：

kubectl create -f integration/custom-metrics-api/namespace.yaml

kubectl create -f integration/custom-metrics-api

注意：因为 custom-metrics-api 对接集群中的 Prometheous 的访问地址，请替换 prometheous url 为你真正使用的 Prometheous 地址。

检查自定义指标：

$ kubectl get --raw "/apis/custom.metrics.k8s.io/v1beta1" | jq

{

  "kind": "APIResourceList",

  "apiVersion": "v1",

  "groupVersion": "custom.metrics.k8s.io/v1beta1",

  "resources": [

    {

      "name": "pods/capacity_used_rate",

      "singularName": "",

      "namespaced": true,

      "kind": "MetricValueList",

      "verbs": [

        "get"

      ]

    },

    {

      "name": "datasets.data.fluid.io/capacity_used_rate",

      "singularName": "",

      "namespaced": true,

      "kind": "MetricValueList",

      "verbs": [

        "get"

      ]

    },

    {

      "name": "namespaces/capacity_used_rate",

      "singularName": "",

      "namespaced": false,

      "kind": "MetricValueList",

      "verbs": [

        "get"

      ]

    }

  ]

}

7. 提交测试使用的 Dataset。

$ cat<<EOF >dataset.yaml

apiVersion: data.fluid.io/v1alpha1

kind: Dataset

metadata:

  name: spark

spec:

  mounts:

    - mountPoint: https://mirrors.bit.edu.cn/apache/spark/

      name: spark

---

apiVersion: data.fluid.io/v1alpha1

kind: AlluxioRuntime

metadata:

  name: spark

spec:

  replicas: 1

  tieredstore:

    levels:

      - mediumtype: MEM

        path: /dev/shm

        quota: 1Gi

        high: "0.99"

        low: "0.7"

  properties:

    alluxio.user.streaming.data.timeout: 300sec

EOF

$ kubectl create -f dataset.yaml

dataset.data.fluid.io/spark created

alluxioruntime.data.fluid.io/spark created

8. 查看这个 Dataset 是否处于可用状态。

可以看到该数据集的数据总量为 2.71GiB，目前 Fluid 提供的缓存节点数为 1，可以提供的最大缓存能力为 1GiB。此时数据量是无法满足全量数据缓存的需求。

$ kubectl get dataset

NAME    UFS TOTAL SIZE   CACHED   CACHE CAPACITY   CACHED PERCENTAGE   PHASE   AGE

spark   2.71GiB          0.00B    1.00GiB          0.0%                Bound   7m38s

9. 当该 Dataset 处于可用状态后，查看是否已经可以从 custom-metrics-api 获得监控指标。

kubectl get --raw "/apis/custom.metrics.k8s.io/v1beta1/namespaces/default/datasets.data.fluid.io/*/capacity_used_rate" | jq

{

  "kind": "MetricValueList",

  "apiVersion": "custom.metrics.k8s.io/v1beta1",

  "metadata": {

    "selfLink": "/apis/custom.metrics.k8s.io/v1beta1/namespaces/default/datasets.data.fluid.io/%2A/capacity_used_rate"

  },

  "items": [

    {

      "describedObject": {

        "kind": "Dataset",

        "namespace": "default",

        "name": "spark",

        "apiVersion": "data.fluid.io/v1alpha1"

      },

      "metricName": "capacity_used_rate",

      "timestamp": "2021-04-04T07:24:52Z",

      "value": "0"

    }

  ]

}

10. 创建 HPA 任务。

$ cat<<EOF > hpa.yaml

apiVersion: autoscaling/v2beta2

kind: HorizontalPodAutoscaler

metadata:

  name: spark

spec:

  scaleTargetRef:

    apiVersion: data.fluid.io/v1alpha1

    kind: AlluxioRuntime

    name: spark

  minReplicas: 1

  maxReplicas: 4

  metrics:

  - type: Object

    object:

      metric:

        name: capacity_used_rate

      describedObject:

        apiVersion: data.fluid.io/v1alpha1

        kind: Dataset

        name: spark

      target:

        type: Value

        value: "90"

  behavior:

    scaleUp:

      policies:

      - type: Pods

        value: 2

        periodSeconds: 600

    scaleDown:

      selectPolicy: Disabled

EOF

首先，我们解读一下从样例配置，这里主要有两部分一个是扩缩容的规则，另一个是扩缩容的灵敏度：

规则：触发扩容行为的条件为 Dataset 对象的缓存数据量占总缓存能力的 90%；扩容对象为AlluxioRuntime，最小副本数为 1，最大副本数为 4；而 Dataset 和 AlluxioRuntime 的对象需要在同一个 namespace。
策略：可以 K8s 1.18 以上的版本，可以分别针对扩容和缩容场景设置稳定时间和一次扩缩容步长比例。比如在本例子, 一次扩容周期为 10 分钟（periodSeconds），扩容时新增 2 个副本数，当然这也不可以超过 maxReplicas 的限制；而完成一次扩容后，冷却时间（stabilizationWindowSeconds）为 20 分钟；而缩容策略可以选择直接关闭。

11. 查看 HPA 配置，当前缓存空间的数据占比为 0。远远低于触发扩容的条件。

$ kubectl get hpa

NAME    REFERENCE              TARGETS   MINPODS   MAXPODS   REPLICAS   AGE

spark   AlluxioRuntime/spark   0/90      1         4         1          33s

$ kubectl describe hpa

Name:                                                    spark

Namespace:                                               default

Labels:                                                  <none>

Annotations:                                             <none>

CreationTimestamp:                                       Wed, 07 Apr 2021 17:36:39 +0800

Reference:                                               AlluxioRuntime/spark

Metrics:                                                 ( current / target )

  "capacity_used_rate" on Dataset/spark (target value):  0 / 90

Min replicas:                                            1

Max replicas:                                            4

Behavior:

  Scale Up:

    Stabilization Window: 0 seconds

    Select Policy: Max

    Policies:

      - Type: Pods  Value: 2  Period: 600 seconds

  Scale Down:

    Select Policy: Disabled

    Policies:

      - Type: Percent  Value: 100  Period: 15 seconds

AlluxioRuntime pods:   1 current / 1 desired

Conditions:

  Type            Status  Reason               Message

  ----            ------  ------               -------

  AbleToScale     True    ScaleDownStabilized  recent recommendations were higher than current one, applying the highest recent recommendation

  ScalingActive   True    ValidMetricFound     the HPA was able to successfully calculate a replica count from Dataset metric capacity_used_rate

  ScalingLimited  False   DesiredWithinRange   the desired count is within the acceptable range

Events:           <none>

12. 创建数据预热任务。

$ cat<<EOF > dataload.yaml

apiVersion: data.fluid.io/v1alpha1

kind: DataLoad

metadata:

  name: spark

spec:

  dataset:

    name: spark

    namespace: default

EOF

$ kubectl create -f dataload.yaml

$ kubectl get dataload

NAME    DATASET   PHASE       AGE   DURATION

spark   spark     Executing   15s   Unfinished

13. 此时可以发现缓存的数据量接近了 Fluid 可以提供的缓存能力（1GiB）同时触发了弹性伸缩的条件。



$  kubectl  get dataset

NAME    UFS TOTAL SIZE   CACHED       CACHE CAPACITY   CACHED PERCENTAGE   PHASE   AGE

spark   2.71GiB          1020.92MiB   1.00GiB          36.8%               Bound   5m15s

从 HPA 的监控，可以看到 Alluxio Runtime 的扩容已经开始, 可以发现扩容的步长为 2。

$ kubectl get hpa

NAME    REFERENCE              TARGETS   MINPODS   MAXPODS   REPLICAS   AGE

spark   AlluxioRuntime/spark   100/90    1         4         2          4m20s

$ kubectl describe hpa

Name:                                                    spark

Namespace:                                               default

Labels:                                                  <none>

Annotations:                                             <none>

CreationTimestamp:                                       Wed, 07 Apr 2021 17:56:31 +0800

Reference:                                               AlluxioRuntime/spark

Metrics:                                                 ( current / target )

  "capacity_used_rate" on Dataset/spark (target value):  100 / 90

Min replicas:                                            1

Max replicas:                                            4

Behavior:

  Scale Up:

    Stabilization Window: 0 seconds

    Select Policy: Max

    Policies:

      - Type: Pods  Value: 2  Period: 600 seconds

  Scale Down:

    Select Policy: Disabled

    Policies:

      - Type: Percent  Value: 100  Period: 15 seconds

AlluxioRuntime pods:   2 current / 3 desired

Conditions:

  Type            Status  Reason              Message

  ----            ------  ------              -------

  AbleToScale     True    SucceededRescale    the HPA controller was able to update the target scale to 3

  ScalingActive   True    ValidMetricFound    the HPA was able to successfully calculate a replica count from Dataset metric capacity_used_rate

  ScalingLimited  False   DesiredWithinRange  the desired count is within the acceptable range

Events:

  Type     Reason                        Age                    From                       Message

  ----     ------                        ----                   ----                       -------

  Normal   SuccessfulRescale             21s                    horizontal-pod-autoscaler  New size: 2; reason: Dataset metric capacity_used_rate above target

  Normal   SuccessfulRescale             6s                     horizontal-pod-autoscaler  New size: 3; reason: Dataset metric capacity_used_rate above target

14. 在等待一段时间之后发现数据集的缓存空间由 1GiB 提升到了 3GiB，数据缓存已经接近完成。

$ kubectl  get dataset

NAME    UFS TOTAL SIZE   CACHED    CACHE CAPACITY   CACHED PERCENTAGE   PHASE   AGE

spark   2.71GiB          2.59GiB   3.00GiB          95.6%               Bound   12m

同时观察 HPA 的状态，可以发现此时 Dataset 对应的 runtime 的 replicas 数量为 3，已经使用的缓存空间比例 capacity_used_rate 为 85%，已经不会触发缓存扩容。

$ kubectl get hpa

NAME    REFERENCE              TARGETS   MINPODS   MAXPODS   REPLICAS   AGE

spark   AlluxioRuntime/spark   85/90     1         4         3          11m

15. 清理环境。

kubectl delete hpa spark

kubectl delete dataset spark

总结

Fluid 提供了结合 Prometheous，Kubernetes HPA 和 Custom Metrics 能力，根据占用缓存空间的比例触发自动弹性伸缩的能力，实现缓存能力的按需使用。这样能够帮助用户更加灵活的使用通过分布式缓存提升数据访问加速能力，后续我们会提供定时扩缩的能力，为扩缩容提供更强的确定性。

原文链接

本文为阿里云原创内容，未经允许不得转载。

Fluid 给数据弹性一双隐形的翅膀 -- 自定义弹性伸缩的更多相关文章

在excel中如何给一列数据批量加上双引号
在实际开发中,会遇到这样的需求,大量的数据,需要从配置文件里读取,客户给到的枚举值是字符串,而配置文件里的数据,是json格式,需要加上双引号,这样就需要使用Excel来批量格式化一下数据. 客户给到 ...
vijos 1237 隐形的翅膀
隐形的翅膀背景小杉终于进入了天堂.他看到每个人都带着一双隐形翅膀,他也想要. (小杉是怎么看到的?……) 描述天使告诉小杉,每只翅膀都有长度,两只翅膀的长度之比越接近黄金分割比例,就越完美. 现 ...
如何实现Docker应用的自定义弹性伸缩
简介现在有很多客户很关心应用的自动弹性伸缩,有些客户也有自己的监控框架,并希望能跟阿里云容器服务进行集成.阿里云容器服务提供了服务弹性伸缩触发器,并能够跟监控框架集成来实现自定义的服务自动弹性伸缩. ...
Codevs 2765 隐形的翅膀
2765 隐形的翅膀题目描述 Description 天使告诉小杉,每只翅膀都有长度,两只翅膀的长度之比越接近黄金分割比例(黄金分割比= 0.6180339887498949),就越完美. 现在 ...
caffe数据读取的双阻塞队列说明
caffe的datareader类中 class QueuePair { public: explicit QueuePair(int size); ~QueuePair(); BlockingQue ...
C#调用接口返回json数据中含有双引号或其他非法字符的解决办法
这几天,调用别人接口返回json数据含有特殊符号(双引号),当转换成json对象总是报错, json字符格式如下 { "BOXINFO":[ { ", "ITE ...
**后台怎么处理JSON数据中含有双引号？
http://bbs.csdn.net/topics/390578406?page=1 注意是后台,不是用js另外我这个json是直接取得别人的传过来的字符串,不是我自己拼写的,所以我自己不能做到转义 ...
如何处理JSON数据中含有双引号
{"quality": "B"A"D"} 实际上要 value.replace("\"","\\\& ...
云原生的弹性 AI 训练系列之三：借助弹性伸缩的 Jupyter Notebook，大幅提高 GPU 利用率
Jupyter Notebooks 在 Kubernetes 上部署往往需要绑定一张 GPU,而大多数时候 GPU 并没有被使用,因此利用率低下.为了解决这一问题,我们开源了 elastic-jupy ...
12-28 显示团购数据界面的搭建，cell的自定义方面的知识总结
1.通过plist加载模型数据 2.controller中懒加载数据 3.设置tableView的数据源 4.写数据源的方法 5.观察演示项目,分析通过默认的cell的4种现实方式,无法实现要想要的现 ...

随机推荐

Python实践：基于Matplotlib实现某产品全年销量数据可视化
本文分享自华为云社区<画图实战-Python实现某产品全年销量数据多种样式可视化>,作者:虫无涯. 学习心得有时候我们需要对某些数据进行分析,得到一些可视化效果图,而这些效果图可以直观展 ...
drf(JWT认证)
一. jwt实现过程 1. 构建jwt过程第一: 用户提交用户名和密码给服务端,如果登录成功,使用jwt创建一个token,并给用户返回 eyJ0eXAiOiJqd3QiLCJhbGciOiJIUz ...
Java 22正式发布，一文了解全部新特性
就在昨晚,Java 22正式发布!该版本提供了 12 项功能增强,其中包括 7 项预览功能和 1 项孵化器功能.它们涵盖了对 Java 语言.API.性能以及 JDK 中包含的工具的改进. 下面就来一 ...
记录--基于css3写出的流光登录（注释超详细！）
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助完整效果对基本的表单样式进行设置这里设置了基本的表单样式,外层用了div进行包裹,重点是运用了两个i元素在后期通过css样式勾画出一条 ...
记录--短视频滑动播放在 H5 下的实现
这里给大家分享我在网上总结出来的一些知识,希望对大家有所帮助短视频已经无数不在了,但是主体还是使用 app 来承载的.本文讲述 H5 如何实现 app 的视频滑动体验. 无声胜有声,一图顶百辩,且看 ...
快速上手系列：XML
一 xml 简介extensible markup language :可扩展标记型语言(1)标记型语言:html 也是标记型语言,即使用标签来操作(2)可扩展: 1)html 里面的标签是固定的,每 ...
Oracle 获取月初、月末时间，获取上一月月初、月末时间
select trunc(sysdate, 'mm'), last_day(trunc(sysdate)), trunc(add_months(trunc(sysdate), -1), 'mm'), ...
JNDI注入分析
JNDI介绍 JNDI(Java Naming and Directory Interface,Java命名和目录接口)是为Java应用程序提供命名和目录访问服务的API,允许客户端通过名称发现和查找 ...
KingbaseES V8R6 等待事件之IO类BufFileRead BufFileWrite
等待事件含义当数据库创建临时文件时,会发生IO:BufFileRead和IO:BufFileWrite等待事件.当操作需要的内存比当前定义的work_mem内存参数更多时,会将临时数据写入磁盘永久存 ...
探秘Kubernetes：在本地环境中玩转容器技术
在云计算时代,Kubernetes 已成为云原生技术的真正基石.它是应用程序容器的编排动力源,可跨多个集群自动部署.扩展和运行容器.Kubernetes 不仅仅是一个流行词,它还是一种模式转变,是现代 ...

Fluid 给数据弹性一双隐形的翅膀 -- 自定义弹性伸缩

背景