本文适合有 Java 基础知识的人群

作者:HelloGitHub-Salieri

HelloGitHub 推出的《讲解开源项目》系列。

写在前面的碎碎念:终于到了万众期待的调度层原理了。其实很早之前就想动笔把这部分好好给大家讲讲,因为问的人实在是太多了...大部分小伙伴进用户群的第一句话就是:“群猪,请问无锁化调度是怎么实现的?”,剩下的犀利点的小伙伴甚至直接问:“群猪,你这个性能强劲无上限体现在什么地方啊?”。

可惜不巧的是,鄙人在 7 月初给自己安排了一个惊险刺激的大西北旅游,每天不是在坐车就是在前往坐车的路上,虽然感受到了祖国疆域之辽阔、风景之秀丽、文化之璀璨,人累个半死也是确有其事。文章嘛,自然也就是一路鸽到了现在...

那么,是时候表演真正的技术了~

一、调度层概览

PowerJob 目前支持 4 种定时执行策略,分别是 CRON、固定频率、固定延迟 和 API。API 指的是通过 PowerJob 提供的客户端接口直接启动任务的方式,不需要 server 来支持调度,此处忽略。而剩下的 3 种调度策略,根据其执行频率的不同,可以划分为常规任务秒级任务。我们先讲常规任务。

常规任务指由 CRON 表达式指定定时策略的任务,这一类任务的特点是 执行频率不高。 对于这类任务,PowerJob 采用基于数据库轮询的策略来进行调度,具体的原理图如下。

PowerJob 的任务表中,除了维护任务的基础元数据(如任务名称、定时策略、执行器信息等)之外,还会额外增加一个字段 next_trigger_time,也就是下一次调度时间,当任务被成功创建时,系统会使用 CRON 表达式去初始化该字段,保证每一个 CRON 任务都存在可用的下一次调度时间

有了这个字段,具体的调度就好办了。powerjob-server 会启用一个后台线程定期扫描任务表,查找那些由本机调度的、即将执行(即下一次调度时间与当前时间的差值小于系统规定的阈值)的任务。

(这里埋个小小的伏笔,“由本机调度”其实是实现无锁化调度的关键,将在下一篇文章为大家揭秘,本文主要讲述调度流程,因此直接以单机为例)

一旦发现接下来的一段时间内有任务需要被调度执行,就会为这些任务生成执行记录并推入时间轮,最后完成任务的调度。

听起来似乎很平淡无奇的一个流程,存在着那些精彩的设计与实现呢?请听我细细分解~

二、高性能调度——时间轮

假如,现在给你一个任务,要求 2 秒后执行,你会怎么解决的?

最简单的方案,也就是利用休眠。1 秒后执行,那么我让当前线程 sleep 1 秒,不就达到目的了吗?没错,基于线程休眠的特性,可以用三行代码实现一个最简单的定时执行器,但是它的性能嘛...自然也是相当的拉垮...由于每一个任务都需要绑定一个单独的线程,当系统中存在大量任务时,这种方案消耗的资源极其庞大。

那么如何实现高效的调度呢?

也许,就和牛顿被苹果砸出万有引力引力一样,发明时间轮算法的大神,在为寻找高效调度方案而苦恼不已时,低头看了看自己的劳力士~觉得这个表如此的朴实无华的同时,似乎找到了那么一点点灵感~

根据前面分析,线程休眠型调度器之所以低效,是因为它需要用到大量的线程资源,这浪费了大量的 CPU 和内存资源。那么有没有办法来避免这个消耗呢?看着这个表,有人找到了答案。

时间轮是一种高效利用线程资源来进行批量化调度的一种调度模型。把大批量的调度任务全部都绑定到同一个的调度器(一个线程)上面,使用这一个调度器来进行所有任务的管理,触发以及运行,能够高效的管理各种延时任务,周期任务,通知任务等等。

时间轮的算法模型如上图所示,每个时间轮存在着 N 个槽,两个槽之间的间隔时间固定。每走一个时间间隔,指针就向前推进一格,然后开始处理当前槽内的所有任务。指针不断循环推进,直到时间轮中不存在任何任务。

当新增调度任务时,可根据任务的调度时间和当前时间计算出具体的时间槽。为了能以时间复杂度 O(1) 的代价将任务放入指定位置,需要时间槽具有随机访问的能力,为此该部分使用循环数组实现。每一个时间槽对应的任务队列长度不确定,且只需要提供顺序访问能力,为此任务队列使用单向链表实现。

每一个时间轮都有两个必备参数,时间间隔 tickDuration 和 刻度数量 ticksPerWheel。这两个参数也很好理解,时间间隔就是指针转动的频率,刻度数量就是这个表盘内任务槽的数量,拿现实中的手表来说,tickDuration 就是 1,ticksPerWheel 是 12。

讲了那么多理论,这里举个具体的例子来帮助大家理解时间轮(其实时间轮的概念非常好理解,具体的实现也不算很难,可以说是一种性价比超高的数据结构了~)

假如我现在有一个时间间隔为 1 秒,刻度数为 12 的时间轮,现在需要调度 3 个定时任务,分别在 1 秒、6 秒和 13 秒后执行,那么时间轮的工作流程是怎么样的呢?

首先,第一步是任务的插入。由于表盘的设计是环形数据,通过 (预计执行时间 - 时间轮启动时间)% 刻度数 这个公式便能算出该任务的插槽下标,即这些任务会分别被插入到 0、5 和 0 号槽对应的链表中。

完成任务的插入后,接下来就等着调度线程取出任务并执行了。调度线程通过休眠 tickDuration 的方式,循环读取下一个槽中链表中的任务并执行。由于链表中的任务可能不是本轮需要调度的(就比如 13 秒后执行的任务,其实是下一个调度周期才需要执行),需要额外对任务的预计执行时间做判断,只有符合要求的任务才会被调度执行,并从链表中移除。

这样就做到了 1 个线程完成大量任务的调度,兼备性能和效率。唯一的缺点是由于采取了 tickDuration,那么调度会存在着一定的误差。如果你对调度执行的时间精度要求极高,那时间轮可能不是你的菜,否则,还不赶紧抱走?

时间轮的概念讲完了,接下来回归框架本身。PowerJob 所使用的时间轮设计整体参考 Netty,并在一些地方做了定制化处理,比如由于 PowerJob 调度后执行任务有一定的开销(涉及数据库操作),因此除了指针线程,还额外引入了处理线程池来保证调度的精度。源码一共 326 行,有兴趣的话,快去看吧,类名都给你准备好啦!

com.github.kfcfans.powerjob.server.common.utils.timewheel.HashedWheelTimer

三、可靠调度——WAL

可靠调度也是大家广为关注的一个问题,甚至还有同学在 GitHub Issue 留言告诉我他们自研的调度系统在生产环境中遇到的不可靠调度问题:

那么 PowerJob 存在着错过调度的问题吗?答案显然是否定的。(作为一款一直强调极高可用性和稳定性的生产级调度中间件,要是这一点都做不到,那还有脸见人吗?

那么问题又来了,这,又是如何实现的呢?

不知道大家有没有听说过 WAL(Write-Ahead Logging,预写式日志),这是主流关系型数据库(MS SQLServer、MySQL、Oracle)用来确保了事务原子性和持久性的关键技术。WAL 的核心思想是: 在数据写入到数据库之前,先写入到日志中。 这样,在硬盘数据不损坏的情况下,预写式日志允许存储系统在崩溃后能够在日志的指导下恢复到崩溃前的状态,避免数据丢失。

PowerJob 为了实现任务的可靠调度,也借鉴了该思想。每一个任务被调度执行时,系统都会为其生成一条记录,这条记录包含了该任务实例(任务的一次运行叫任务实例)的预期调度时间。之后,PowerJob 会首先将该记录持久化到数据库中,只有持久化成功后,该任务才会被正式推入时间轮进行调度。

一旦这一台 server 宕机,任务没有被准时执行。其他 server 就能根据已经写入数据库中的任务实例记录将其恢复,做到可靠调度~

也就是说,只要你的系统中还有一台 powerjob-server 活着,就不会有缺失调度的情况。

四、秒级任务

说够了常规任务的调度,让我们来侃侃秒级任务~

秒级任务的特点是运行频率极高(吐槽:这不是废话吗),那么能不能用支持常规任务调度的这套方法来支撑秒级任务的调度呢?

首先是任务的获取。emmm...“一定时间间隔扫描任务表获取待执行任务”,这...等你获取到任务,黄花菜都凉了...这不中啊...没错,使用传统调度方案,第一步就挂了。(我想到了路途艰难,但没想到居然那么难!)

不过,比较聪明的同学可能想到了。既然秒级任务执行频率很高,那 server 获取这个任务后,可以将它保存起来,这样下一次调度就不需要单独查数据库了,而是选择内存遍历,要多快有多快,似乎就解决了这个问题。

然而,这种方式仍不完美。俗话说得好,物以稀为贵,秒级任务的执行频率那么高,在大部分情况下,其实失败个一两次也没什么关系,毕竟立即就会有下一个任务补上。因此,传统任务那一套为了可靠调度而生的机制并不适用于秒级任务,秒级任务使用了那套机制后,也会对数据库产生较大的冲击,导致 PowerJob 整体的性能大幅度下降。那么出路究竟在何方呢?

此时就不得不提解决计算机领域问题的终极神器了:分治。既然不强要求任务执行有非常高的可靠性,那么 powerjob-server 此时就可以放权了。

每一个秒级任务,都会直接被投递到集群中的某一台 powerjob-worker 上,由 powerjob-worker 全权负责执行。而 powerjob-server 此时只需要负责故障恢复即可。

这样一来,server 的压力进一步减轻,同时,由于秒级任务的调度与执行全部落在了 worker 身上,调度的精度也会上升(至少能省下通讯的网络延迟),可谓是一个完美至极的双赢方案。

五、最后

那么以上就是本篇文章全部的内容啦~

本篇文章讲述了 PowerJob 调度层的实现与其中一些精巧的设计。不过限于篇幅,整个调度层其实并没有完全呈现在大家眼前,目前还是犹抱琵琶半遮面的状态~大家最关心的多 server 下任务如何避免重复调度、多 server 如何实现水平的能力扩展本文都没有详细提及,只是简单说了几个字。具体的内容,就放在下一篇文章讲啦~提前剧透一下吧,核心就四个字:分组隔离。等不及的话,自己去代码中寻找答案吧,少年~

项目地址:

https://github.com/KFCFans/PowerJob

趣讲 PowerJob 超强大的调度层,开始表演真正的技术了的更多相关文章

  1. 推荐一款超强大的基于Angularjs的自动完成(Autocomplete)标签及标签组插件–ngTagsInput

    前言 今天利用中午午休时间,给大家分享推荐一款基于Angularjs的自动完成(Autocomplete)标签及标签组插件--ngTagsInput,功能超强大的.不信,你试试就知道^_^... Au ...

  2. 联童科技基于incubator-dolphinscheduler从0到1构建大数据调度平台之路

    联童科技是一家智能化母婴童产业平台,从事母婴童行业以及互联网技术多年,拥有丰富的母婴门店运营和系统开发经验,在会员经营和商品经营方面,能够围绕会员需求,深入场景,更贴近合作伙伴和消费者,提供最优服务产 ...

  3. 大数据与 AI 生态中的开源技术总结

    本文由云+社区发表 作者:堵俊平 在数据爆炸与智能革命的新时代,新的平台与应用层出不穷,开源项目推动了前沿技术和业界生态快速发展.本次分享将以技术和生态两大视角来看大数据和人工智能技术的发展,通过分析 ...

  4. 大数据架构师必读的NoSQL建模技术

    大数据架构师必读的NoSQL建模技术 从数据建模的角度对NoSQL家族系统做了比较简单的比较,并简要介绍几种常见建模技术. 1.前言 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企 ...

  5. 大数据调度工具oozie详细介绍

    背景 之前项目中的sqoop等离线数据迁移job都是利用shell脚本通过crontab进行定时执行,这样实现的话比较简单,但是随着多个job复杂度的提升,无论是协调工作还是任务监控都变得麻烦,我们选 ...

  6. 开篇:免费开源的趣讲 ZooKeeper 教程(连载)

    本文作者:HelloGitHub-老荀 一.起因 良好的开端,是成功的一半. 我是作者老荀,一个普通的程序员,没有 985 和 211 的背景,也从没在大厂工作过.仅仅是喜欢研究技术,一直想做一个讲解 ...

  7. 谁手握账本?趣讲 ZK 的内存模型

    本文作者:HelloGitHub-老荀 Hi,这里是 HelloGitHub 推出的 HelloZooKeeper 系列,免费开源.有趣.入门级的 ZooKeeper 教程,面向有编程基础的新手. 本 ...

  8. PHP设计的超强大的文件上传类(单文件上传)

    form.html <!DOCTYPE html> <html> <head> <title>文件上传</title> </head& ...

  9. genie 来自netflix 的分布式大数据调度服务

    Genie是Netflix开发的联合作业编排引擎.Genie提供REST-ful API来运行各种大数据工作,如Hadoop,Pig,Hive,Spark,Presto,Sqoop等.它还提供用于管理 ...

随机推荐

  1. meta viewport相关

    <!DOCTYPE html> H5标准声明,使用 HTML5 doctype,不区分大小写 <head lang=”en”> 标准的 lang 属性写法 <meta c ...

  2. 007.Nginx虚拟主机

    一 虚拟主机 1.1 虚拟主机概念 对于Nginx而言,每一个虚拟主机相当于一个在同一台服务器中却相互独立的站点,从而实现一台主机对外提供多个 web 服务,每个虚拟主机之间是独立的,互不影响的. 1 ...

  3. JavaScript学习 Ⅴ

    十. 一些对象 Date 对象 Date对象用来表示一个时间 创建Date对象 如果直接使用构造函数创建一个Date对象,则会封装为当前代码执行的时间 var d = new Date(); 创建一个 ...

  4. node+express4+multiparty实现简单文件上传

    文件上传 var fs = require('fs'); var express = require('express'); var multiparty = require('multiparty' ...

  5. Python-02 可视化之tkinter介绍

    1 控件介绍 1.1 Label import tkinter as tk # 使用Tkinter前需要先导入 window = tk.Tk() window.title('My Window') w ...

  6. 数据可视化之powerBI技巧(二)Power BI性能分析器,原来还有这个功能

    ​性能分析器是Power BI前几个月推出的功能,主要用于检测视觉对象和DAX的性能如何,该功能的使用比较简单,首先勾选这个功能, 然后点击开始记录并刷新视觉对象,就可以看出每个元素耗费的时间,如下图 ...

  7. YAPI工具配置LDAP统一用户认证

    背景:因为搭建了LDAP,因此希望将所有配置库或工具都使用LDAP进行统一用户认证,YAPI是其中一个. YAPI:使用docker-compose进行了安装,具体安装步骤自行百度. LDAP:使用d ...

  8. Spring AOP底层实现分析

    Spring AOP代理对象的生成 Spring提供了两种方式来生成代理对象: JdkProxy和Cglib,具体使用哪种方式生成由AopProxyFactory根据AdvisedSupport对象的 ...

  9. OSCP Learning Notes - Exploit(7)

    Pre-Exploit Password Attacks Tools: 1. ncrack Ncrack 0.6 ( http://ncrack.org )Usage: ncrack [Options ...

  10. Maven配置文件中的版本使用-SNAPSHOT

    SNAPSHOT是什么? SNAPSHOT是快照,是一种特殊的版本,制定了某个当前的开发进度副本.不同于正式版本,Maven每次构建都会在远程仓库中检查新的快照.如此每次发布更新代码的快照到仓库中,新 ...