前言:

xxl-job是国内一款使用者比较多的分布式任务调度平台,我们内部从19年开始使用该款开源软件,使用的是2.0.1版本,并在此基础上做了二次开发,添加了一些定制化的功能。随着使用该定时器的业务组越来越多,有些业务组提出想要使用xxl-job新版本中引入的一些功能。因此,我们着手考虑了xxl-job的升级方案。

通过该文章,你可以学习到如下内容:

1. xxl-job的版本从2.0.1升级到2.3.1存在不兼容的问题,而且生产环境已经在使用,如何做到无缝迁移

2. xxl-job中主要功能的具体处理流程和底层原理,遇到问题可以快速排查

3. xxl-job在使用的过程中有哪些注意事项,避免踩坑

升级方案选型:

xxl-job升级面临的问题

  1. xxl-job的版本从2.0.1升级到2.3.1存在不兼容的问题,而且生产环境已经在使用,如何做到无缝迁移
  2. 内部使用的过程中进行过二次开发,对代码进行过修改,如何顺利迁移已经修改过的逻辑

xxl-job升级步骤

  1. 检查xxl-job-core是否向后兼容

经过测试发现,xxl-job-core的2.0.1版本无法成功注册到xxl-job-admin上面去。

为了能够实现升级的平滑过渡,我们考虑了如下三个方案:

(1)修改xxl-job-admin的源代码为了能够保证已有job的正常工作,使得2.3.1版本的xxl-job-admin同时支持2.0.1版本和2.3.1两个版本的xxl-job-core

(2)修改xxl-job-core的代码使得2.3.1版本的xxl-job-core同时识别2.0.1版本和2.3.1版本的注解和配置

(3)admin端和core端都不做修改,升级后各个业务自己修改JobHandler的相关代码

经过调研分析,我们决定采用第二种修改方案,这样我们的改动比较小,而且对各个业务方也基本上是透明的,基本不用对代码进行修改。

  1. 检查数据存储对应关系,编写数据迁移脚本

2.0.1版本的数据库表如下:

XXL_JOB_QRTZ_BLOB_TRIGGERS

Quartz框架中使用的数据表,该项目中目前未使用到

XXL_JOB_QRTZ_CALENDARS

同上

XXL_JOB_QRTZ_CRON_TRIGGERS

存储定时任务的cron信息和时区信息

XXL_JOB_QRTZ_FIRED_TRIGGERS

Quartz框架中存储当前已经运行的触发器状态信息

XXL_JOB_QRTZ_JOB_DETAILS

Quartz框架中存储触发器的详细信息

XXL_JOB_QRTZ_LOCKS

Quartz框架中的悲观锁

XXL_JOB_QRTZ_PAUSED_TRIGGER_GRPS

Quartz框架中暂停的触发器组信息

...................................................

忽略Quartz框架下的其他数据库表,Quartz框架下的数据表和数据迁移工作内容无关

XXL_JOB_QRTZ_TRIGGER_GROUP

定时任务所属分组,也就是各个工程的相关信息

XXL_JOB_QRTZ_TRIGGER_INFO

定时任务的基本信息

XXL_JOB_QRTZ_LDAP_GROUP

LDAP分组与定时任务分组的关联关系表(二次开发添加)

XXL_JOB_QRTZ_TRIGGER_LOGGLUE

以GLUE模式运行的定时任务对应的源码信息

XXL_JOB_QRTZ_TRIGGER_REGISTRY

注册的执行器信息

XXL_JOB_QRTZ_TRIGGER_LOG

记录定时任务的调度结果,这里需要注意的时候,调度成功并不代表着该定时任务执行成功。

2.3.1版本xxl-job数据库表信息如下:

xxl_job_group

对应2.0.1版本中XXL_JOB_QRTZ_TRIGGER_GROUP数据表

xxl_job_info

对应2.0.1版本中的XXL_JOB_QRTZ_TRIGGER_INFO

xxl_job_lock

JobScheduleHelper通过该数据库表实现对定时任务的互斥调度;如果要实现一个简单的分布式调度器,实现JobScheduleHelper这个类基本就够了

xxl_job_log

对应2.0.1版本中的XXL_JOB_QRTZ_TRIGGER_LOG表

xxl_job_log_report

定时任务调度结果的汇总报表

xxl_job_logglue

对应2.0.1版本中的XXL_JOB_QRTZ_TRIGGER_LOGGLUE表

xxl_job_registry

对应2.0.1版本中的XXL_JOB_QRTZ_TRIGGER_REGISTRY表

xxl_job_user

新增的用户信息表,在我们内部不会使用到

手动新增:xxl_job_ldap_group

存储各个技术组的信息

注:有关Quartz框架中数据库表字段解释可以参考这篇技术博客:

https://www.cnblogs.com/zyulike/p/13671130.html

3. 修改2.3.1版本的xxl-job-admin

这个步骤里面的主要工作是迁移和添加二次开发的代码到新版本的xxl-job-admin,主要功能包括:登录逻辑修改,权限管理逻辑修改,邮件报警通知修改成企业微信通知,执行器和定时任务进行分组管理,针对不合理的逻辑进行性能优化。

4. 修改2.3.1版本的xxl-job-core

修改xxl-job-core的代码使得2.3.1版本的xxl-job-core同时识别2.0.1版本和2.3.1版本的注解和配置

注意事项:

  1. 如果在JobHandler实现类中有需要进行一次性初始化的操作,务必避免使用init()这个方法,因为JobHandler每次运行的时候都会重复执行init()方法
  2. 定时任务执行失败可以通过企业微信通知相关的负责人,注意需要抛异常出来才可以
  3. 注册的执行器节点最好使用自动注册的方式

xxl-job定时任务处理流程:

v.2.0.1版本控制台侧xxl-job手动触发定时任务的处理流程:

自动触发定时任务是通过XxlJobDynamicSchedulerConfig中创建的SchedulerFactoryBean来调度完成

v2.3.1版本控制台侧手动触发定时任务的处理流程:

自动触发定时任务是通过XxlJobAdminConfig中创建的XxlJobScheduler来调度完成的

v2.0.1版本业务侧定时任务的处理流程如下:

v2.3.1版本业务侧定时任务的处理流程和v2.0.1版本的处理流程并没有太多的区别,主要的差异在于EmbedServer从JettyServer切换成了NettyServer,底层信息的协议格式依然是HTTP协议。

新版本主要功能底层实现原理解析:

功能解析一:

调度线程池隔离,拆分为”Fast”和”Slow”两个线程池,1分钟窗口期内任务耗时达500ms超过10次,该窗口期内判定为慢任务,慢任务自动降级进入”Slow”线程池,避免耗尽调度线程,提高系统稳定性

上述功能是通过在JobScheduleHelper中设置两个线程池来实现的,不过实在不太理解这个功能的作用是什么,因为只要调度成功给业务侧的EmbedServer后EmbedServer就会返回成功的消息给控制台一端,而不需要等待定时任务具体逻辑真正执行结束。

功能解析二:自研调度组件,移除quartz依赖:一方面是为了精简系统降低冗余依赖,另一方面是为了提供系统的可控度与稳定性;

该自研的调度组件是依赖JobScheduleHelper来完成的,具体处理流程如下所示:

功能解析三:GLUE-JAVA模式的定时任务是如何工作的

通过Groovy ClassLoader将Java源码动态编译成为class,具体处理可以查看GlueFactory类

总结:

今天就写到这里吧,如果有想继续深入沟通的小伙伴儿,请加微信群聊或者本人微信进一步沟通和交流。

             

XXL-JOB最佳实践与升级指南的更多相关文章

  1. (转载)PyTorch代码规范最佳实践和样式指南

    A PyTorch Tools, best practices & Styleguide 中文版:PyTorch代码规范最佳实践和样式指南 This is not an official st ...

  2. 【转】Talend作业设计模式和最佳实践-Part II

    转载地址:https://mp.weixin.qq.com/s?__biz=MzA3OTg1Mzk4Nw==&mid=2453261363&idx=1&sn=5674f1df8 ...

  3. 阿里巴巴发布最佳实践 | 阿里巴巴DevOps实践指南

    编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电 ...

  4. 如何让HTTPS站点评级达到A+? 还得看这篇HTTPS安全优化配置最佳实践指南

    0x00 前言简述 SSL/TLS 简单说明 描述: 当下越来越多的网站管理员为企业站点或自己的站点进行了SSL/TLS配置, SSL/TLS 是一种简单易懂的技术,它很容易部署及运行,但要对其进行安 ...

  5. 【读书笔记】读《高性能网站建设指南》及《高性能网站建设进阶指南:Web开发者性能优化最佳实践》

    这两本书就一块儿搞了,大多数已经理解,简单做个标记.主要对自己不太了解的地方,做一些记录.   一.读<高性能网站建设指南> 0> 黄金性能法则:只有10%~20%的最终用户响应时间 ...

  6. Python 最佳实践指南 2018 学习笔记

    基础信息 版本 Python 2.7 Python 3.x Python2.7 版本在 2020 年后不再提供支持,建议新手使用 3.x 版本进行学习 实现 CPython:Python的标准实现: ...

  7. RESTful API 设计指南,RESTful API 设计最佳实践

    RESTful API 设计指南,RESTful API 设计最佳实践 网络应用程序,分为前端和后端两个部分.当前的发展趋势,就是前端设备层出不穷(手机.平板.桌面电脑.其他专用设备......). ...

  8. 经典的性能优化最佳实践 web性能权威指南 读书笔记

    web性能权威指南 page 203 经典的性能优化最佳实践 无论什么网络,也不管所用网络协议是什么版本,所有应用都应该致力于消除或减 少不必要的网络延迟,将需要传输的数据压缩至最少.这两条标准是经典 ...

  9. 转载:Google 官方应用架构的最佳实践指南 赞👍

    官方给的实践指南,很有实际的指导意义,  特别是对一些小公司,小团队,给了很好的参考意义. 原文地址: https://developer.android.com/topic/libraries/ar ...

随机推荐

  1. $.fn解析

    $.fn是指jquery的命名空间,加上fn上的方法及属性,会对jquery实例每一个有效. 如扩展$.fn.abc(),即$.fn.abc()是对jquery扩展了一个abc方法,那么后面你的每一个 ...

  2. RPA人力资源简历筛选机器人

    简历自动筛选及分析机器人,支持前程无忧.猎聘 1.自动登录招聘网站 2.自动填充简历筛选条件 3.RPA依次读取所筛选的简历信息 4.自动将简历数据复制到本地文档中 5.完成简历信息收集及分析表 6. ...

  3. Linux远程连接工具和运行级别

    常用的Linux远程连接工具: xshell MobaXterm windows的命令行工具 Linux的运行级别 linux有七个运行级别 0----所有的服务都不开启,代表的式关机 1---代表的 ...

  4. 图片管够!用Python做了个图片识别系统(附源码)

    本项目将使用python3去识别图片是否为色情图片,会使用到PIL这个图像处理库,并且编写算法来划分图像的皮肤区域 介绍一下PIL: PIL(Python Image Library)是一种免费的图像 ...

  5. idea 查看 类所有方法的快捷键

    idea 查看 类 所有方法的快捷键 Idea:ctrl+F12 Eclipse:Ctrl+O

  6. PMP 考试常见工具与技术点总结

    转载请注明出处: 网络图:项目进度活动之间的逻辑关系,用来推算关键路径,最大浮动时间等: 横道图(甘特图):以图示的方式,通过活动列表和时间刻度,来展示项目获得那个顺序和持续时间 责任分配矩阵:每件事 ...

  7. pytest多进程/多线程执行测试用例

    前言: 实际项目中的用例数量会非常多,几百上千:如果采用单进程串行执行的话会非常耗费时间.假设每条用例耗时2s,1000条就需要2000s $\approx$ 33min:还要加上用例加载.测试前/后 ...

  8. 基于ABP实现DDD--仓储实践

      由于软件系统中可能有着不同的数据库,不同的ORM,仓储思想的本质是解耦它们.在ABP中具体的实现仓储接口定义在领域层,实现在基础设施层.仓储接口被领域层(比如领域服务)和应用层用来访问数据库,操作 ...

  9. day01--DOS常用命令

    打开CMD的方式 开始+系统+命令提示符 Win键+R输入cmd打开控制台(推荐使用) 在任意的文件夹下面,按住shift键+鼠标右键点击,在此处打开命令行窗口 资源管理器的地址栏前面加,上cmd路径 ...

  10. EfficientFormer:轻量化ViT Backbone

    论文:<EfficientFormer: Vision Transformers at MobileNet Speed > Vision Transformers (ViT) 在计算机视觉 ...