1.运行单个任务的pod

  ReplicationController、ReplicaSet、DaemonSet会持续运行任务,永远达不到完成态 。这些 pod 中的进程在退出时会重新启动。但是在一个可完成的任务中,其进程终止后,不应该再重新启动。你也会遇到只想运行完成工作后就终止任务的情况。

1.1 介绍Job资源

  Kubernetes通过Job资源提供了对此的支持,它允许你运行一种pod,该pod在内部进程成功结束时,不重启容器。一旦任务完成,pod就被认为处于完成状态。

  在发生节点故障时,该节点上由Job管理的pod将按照ReplicaSet的pod的方式, 重新安排到其他节点。如果进程本身异常退出(进程返回错误退出代码时),可以将Job配置为重新启动容器。

  图4.10显示了如果一个Job所创建的pod,在最初被调度节点上异常退出后,被重新安排到一个新节点上的情况。该图还显示了托管的pod(未重新安排)和由ReplicaSet管理的pod(被重新安排)。

  例如,Job对于临时任务很有用,关键是任务要以正确的方式结束。可以在未托管的pod中运行任务并等待它完成,但是如果发生节点异常或pod在执行任务时被从节点中逐出,则需要手动重新创建该任务。手动做这件事并不合理——特别是如果任务需要几个小时才能完成。

  这样的任务的一个例子是,如果有数据存储在某个地方,需要转换并将其导出到某个地方。你将通过运行构建在busybox镜像上的容器镜像来模拟此操作,该容器将调用sleep命令两分钟。镜像可以自己构建,这里只演示一些结果。

1.2 定义Job资源

apiVersion: batch/v1        #job属于batch API组,版本为v1
kind: Job
metadata:
name: batch-job
spec: #没有指定pod选择器(他将根据pod模版中的标签创建)
template:
metadata:
labels:
app: batch-job
spec:
restartPolicy: OnFailure #job不能使用Always为默认的重新启动策略
containers:
- name: main
image: luksa/batch-job

  Job是batch API组v1 API版本的一部分。YAML定义了一个Job类型的资源, 它将运行luksa/batch-job镜像,该镜像调用一个运行120秒的进程,然后退出。在一个pod的定义中,可以指定在容器中运行的进程结束时,Kubernetes会做什么。这是通过pod配置的属性restartPolicy完成的,默认为Always。Job pod不能使用默认策略,因为它们不是要无限期地运行。

  因此,需要明确地将重启策略设置为OnFailure或Never。此设置防止容器在完成任务时重新启动(pod被Job管理时并不是这样的)。

1.3 Job运行一个pod

  在使用kubectl create 命令创建此作业后,应该看到它立即启动一个pod:

$ kubectl get jobs
NAME   DESIRED SUCCESSFUL AGE
batch-job 1   0 2s
$ kubectl get po
NAME READY STATUS RESTARTS AGE
batch-job-28qf4 1/1 Running 0 4s

  两分钟过后,pod将不再出现在pod列表中,工作将被标记为己完成。默认情况下, 除非使用--show-all(或-a)开关,否则在列出pod时不显示己完成的pod:

$ kubectl get po -a
NAME READY STATUS RESTARTS AGE
batch-job-2Bqf4 0/1 Completed 0 2m

  完成后pod未被删除的原因是允许你查阅其日志。例如:

$ kubectl logs batch-job-28qf4
Fri Apr 29 09:58:22 UTC 2016 Batch job starting Fri Apr 29 10:00:22 UTC 2016 Finished succesfully

  pod可以被直接删除,或者在删除创建它的Job时被删除。在你删除它之前, 让我们再看一下Job资源:

$ kubectl get job
NAME DESIRED SUCCESSFUL AGE
batch-job 1 1 9m

  作业显示己成功完成。但为什么这样的信息显示为一个数字而不是yes或true? DESIRED列表示什么意思?

1.4 在Job中运行多个pod实例

  作业可以配置为创建多个pod实例,并以并行或串行方式运行它们。这是通过在Job配置中设置completions和parallelism属性来完成的。

  顺序运行Job pod

  如果需要一个Job运行多次,则可以将completions设为希望作业的pod运行多少次。下面的代码清单显示了一个例子。

apiVersion: batch/v1
kind: Job
metadata:
name: multi-completion-batch-job
spec:
completions: 5 #将completions设置为5,将使此作业顺利运行5个pod
template:
metadata:
labels:
app: batch-job
spec:
restartPolicy: OnFailure
containers:
- name: main
image: luksa/batch-job

  Job将一个接一个地运行五个pod。它最初创建一个pod,当pod的容器运行完成时,它创建第二个pod,以此类推,直到五个pod成功完成。如果其中一个pod 发生故障,工作会创建一个新的pod,所以Job总共可以创建五个以上的pod。

  并行运行Job pod

apiVersion: batch/v1
kind: Job
metadata:
name: multi-completion-batch-job
spec:
completions: 5 #这项任务要保证五个pod成功完成
parallelism: 2 #最多两个pod可以并行运行
template:
metadata:
labels:
app: batch-job
spec:
restartPolicy: OnFailure
containers:
- name: main
image: luksa/batch-job

  通过将parallelism设置为2,Job创建两个pod并行运行它们:

$ kubectl get po
NAME       READY STATUS RESTARTS AGE
multi-completion-batch-job-lmmnk 1/1 Running 0 21s
multi-completion-batch-job -qx4nq 1/1 Running 0 21s

  只要其中一个pod完成任务,工作将运行下一个pod,直到五个pod都成功完成任务。

  Job的缩放

  甚至可以在Job运行时更改Job的parallelism属性。这与缩放ReplicaSet或ReplicationController类似,可以使用kubectl scale命令完成:

$ kubectl scale job multi-completion-batch-job --replicas 3
job "multi-completion-batch-job" scaled

  由于将parallelism从2增加到3,另一个pod立即启动,因此现在有三个pod在运行。

1.5 限制Job pod完成任务的时间

  关于Job需要讨论最后一件事。Job要等待一个pod多久来完成任务?如果pod卡住并且根本无法完成(或者无法足够快完成),该怎么办?

  通过在pod配置中设置activeDeadlineSeconds属性,可以限制pod的时间。 如果pod运行时间超过此时间,系统将尝试终止pod,并将Job标记为失败。

  注意通过指定Job manifest中的spec.backoffLimit字段,可以配置Job在被标记为失败之前可以重试的次数。如果没有明确指定它,则默认为6。

2.安排Job定期运行或在将来运行一次

  Job资源在创建时会立即运行pod。但是许多批处理任务需要在特定的时间运行, 或者在指定的时间间隔内重复运行。在Linux和类UNIX操作系统中,这些任务通常被称为cron任务。Kubernetes也支持这种任务。

  Kubernetes中的cron任务通过创建CronJob资源进行配置。运行任务的时间表以知名的cron格式指定,所以如果熟悉常规cron任务,将在几秒钟内了解Kubernetes的CronJob。

  在配置的时间,Kubernetes将根据在CronJob对象中配置的Job模板创建Job资源。创建Job资源时,将根据任务的pod模板创建并启动一个或多个pod副本,如在前一部分中所了解的那样。

  接下来如何创建CronJob。

2.1 创建一个CronJob

  想象一下,需要每15分钟运行一次前一个示例中的批处理任务。为此,使用以下规范创建一个CronJob资源。

apiVersion: batch/v1beta1
kind: CronJob
metadata:
name: batch-job-every-fifteen-minutes
spec:
schedule: "0,15,30,45 * * * *" #这项工作每天在每小时0、15、30和45分钟运行
jobTemplate:
spec:
template: #此CronJob创建job资源会用到的模版
metadata:
labels:
app: periodic-batch-job
spec:
restartPolicy: OnFailure
containers:
- name: main
image: luksa/batch-job

  配置时间表安排

  如果不熟悉cron时间表格式,可以在网上找到很棒的教程和解释,但合理作一个快速介绍,时间表从左到右包含以下五个条目:

    • 分钟
    • 小时
    • 星期几

  在该示例中,每15分钟运行一次任务因此schedule字段的值应该是"0,15,30,45****"这意味着每小时的0、15、30和45分钟(第一个星号),每月的每一天(第二个星号),每月(第三个星号)和每周的每一天(第四个星号)。

  相反,如果希望每隔30分钟运行一次,但仅在每月的第一天运行,则应将计划设置为”0,30 * 1 * *”,并且如果希望它每个星期天的3AM运行,将它设置为"0 3 * * 0"(最后一个零代表星期天)。

  配置Job模板

  CronJob通过CronJob规范中配置的jobTemplate属性创建任务资源。

2.2 了解计划任务的运行方式

  在计划的时间内,CronJob资源会创建Job资源,然后Job创建pod。

  可能发生Job或pod创建并运行得相对较晚的情况。可能对这项工作高的要求,任务开始不能落后于预定的时间过多。在这种情况下,可以通过指定CronJob规范中的startingDeadlineSeconds字段来指定截止日期,如下面的代码清单所示。

#代码4.15,为Crontab指定一个startingDeadlineSeconds
apiVersionbatch/v1beta1
kind: CronJob
spec:
schedule "0,15,30,45 * * * *"
startingDeadlineSeconds:15 #pod最迟必须在预定时间后15秒开始运行

  在代码4.15的例子中,工作运行的时间应该是10:30:00。如果因为任何原因10:30:15不启动,任务将不会运行,并将显示为Failed。

  在正常情况下,CronJob总是为计划中配置的每个执行创建一个Job,但可能会同时创建两个Job,或者根本没有创建。为了解决第一个问题,你的任务应该是幂等的(多次而不是一次运行不会得到不希望的结果)。对于第二个问题,请确保下—个任务运行完成本应该由上一次的(错过的)运行完成的任何工作。

Kubernetes之job的更多相关文章

  1. [笔记]kubernetes 无法启动问题

    在启动kubernetes的时候报错误. ERROR: timed out for http://localhost:4001/v2/keys/ 原因是无法启动etcd, etcd 监听4001本地端 ...

  2. 基于Kubernetes在AWS上部署Kafka时遇到的一些问题

    作者:Jack47 转载请保留作者和原文出处 欢迎关注我的微信公众账号程序员杰克,两边的文章会同步,也可以添加我的RSS订阅源. 交代一下背景:我们的后台系统是一套使用Kafka消息队列的数据处理管线 ...

  3. 基于Python+Django的Kubernetes集群管理平台

    ➠更多技术干货请戳:听云博客 时至今日,接触kubernetes也有一段时间了,而我们的大部分业务也已经稳定地运行在不同规模的kubernetes集群上,不得不说,无论是从应用部署.迭代,还是从资源调 ...

  4. Docker中部署Kubernetes

    Kubernetes为Google开源的容器管理框架,提供了Docker容器的夸主机.集群管理.容器部署.高可用.弹性伸缩等一系列功能:Kubernetes的设计目标包括使容器集群任意时刻都处于用户期 ...

  5. kubernetes部署Fluentd+Elasticsearch+kibana 日志收集系统

    一.介绍 1. Fluentd 是一个开源收集事件和日志系统,用与各node节点日志数据的收集.处理等等.详细介绍移步-->官方地址:http://fluentd.org/ 2. Elastic ...

  6. kubernetes 文档

    kubernetes 官方文档:http://kubernetes.io/docs/ null

  7. kubernetes 1.4.5集群部署

    2016/11/16 23:39:58 环境: centos7 [fu@centos server]$ uname -a Linux centos 3.10.0-327.el7.x86_64 #1 S ...

  8. kubernetes单机板

    参考地址: *** http://blog.csdn.net/carter115/article/details/51121223 ** http://www.cnblogs.com/dongdong ...

  9. 一次kubernetes资源文件创建失败的排查

    今天在jenkins中创建kubernetes的rc时,检查目标yaml文件时报出如下错误: + /opt/jenkins/kube/kubectl -s http://10.xx.xx.xx:808 ...

  10. kubernetes&tensorflow

    谷歌内部--Borg Google Brain跑在数十万台机器上 谷歌电商商品分类深度学习模型跑在1000+台机器上 谷歌外部--Kubernetes(https://github.com/kuber ...

随机推荐

  1. [设计模式] 读懂UML图

    类之间关系(由强到弱) realize(继承):三角+实线(指向类),继承类(SUV是一种汽车) generalization(实现):三角+虚线(指向接口),实现接口(汽车是一种车) composi ...

  2. CentOS下cpu分析 top

    CentOS下 cpu 分析-top 时间:2017-03-20 12:09来源:linux.it.net.cn 作者:IT   一. 前言 我们都知道windows下对各个运行的任务,要通过任务管理 ...

  3. Centos7 搭建prometheus+Grafana监控

    https://baijiahao.baidu.com/s?id=1676883786156871051&wfr=spider&for=pc node   scrape_configs ...

  4. rpm命令的简介(2)-(转自 青春乐园 )

    青春乐园 怎样查看rpm安装包的安装路径 rpm -qpl xxxxxx.rpm 1.如何安装rpm软件包 rmp软件包的安装可以使用程序rpm来完成.执行下面的命令 rpm -i your-pack ...

  5. Centos下删除文件后空间并未释放

    [root@DeviceSP /]# df -h Filesystem Size Used Avail Use% Mounted on /dev/vda3 90G 82G 3.8G 96% / tmp ...

  6. 基于CC2530的ZigBee最小系统

    http://www.cirmall.com/circuit/1946/%E5%9F%BA%E4%BA%8ECC2530%E7%9A%84ZigBee%E6%9C%80%E5%B0%8F%E7%B3% ...

  7. 存储单位 KB MB bit

  8. vue 表格中的下拉框单选、多选处理

    最近在用vue做前后端分离,需要在表格中用到下拉框,由于需求变动,从最开始的单选变为多选,折腾了许久,记录一下,供后人铺路 vue 中的表格下拉框单选 collectionsColnumOptions ...

  9. 第5讲 | 从物理层到MAC层:如何在宿舍里自己组网玩联机游戏?

    第一层(物理层) 水晶头要做交叉线,用的就是所谓的 1-3.2-6 交叉接法. 有一个叫做 Hub 的东西,也就是集线器.这种设备有多个口,可以将宿舍里的多台电脑连接起来.但是,和交换机不同,集线器没 ...

  10. 又卡了~从王者荣耀看Android屏幕刷新机制

    前言 正在带妹子上分的我,团战又卡了,我该怎么向妹子解释?在线等. "卡"的意思 不管是端游还是手游,我们都会时不时遇到"卡"的时候,一般这个卡有两种含义: 掉 ...