Golang robfig/cron 实现解析
robfig/cron是GO语言中一个定时执行注册任务的package, 最近我在工程中使用到了它,由于它的实现优雅且简单(主要是简单),所以将源码过了一遍,记录和分享在此。
文档:http://godoc.org/github.com/robfig/cron,repo: https://github.com/robfig/cron
基本玩法
Demo代码如下,先用cron.New()初始化一个实例,然后调用AddFunc(spec string, cmd func()) 注册你希望调用的func,第一个参数为调度的时间策略,第二个参数为到时间后执行的方法。robfig/cron支持非常多样的时间策略(下面的代码举了一些例子),最后通过cron.Start()方法启动。
func TestCronDemo(t *testing.T) {
c := cron.New()
// 通过AddFunc注册
c.AddFunc("30 * * * *", func() { fmt.Println("Every hour on the half hour") })
c.AddFunc("30 3-6,20-23 * * *", func() { fmt.Println(".. in the range 3-6am, 8-11pm") })
c.AddFunc("CRON_TZ=Asia/Tokyo 30 04 * * *", func() { fmt.Println("Runs at 04:30 Tokyo time every day") })
c.AddFunc("@every 5m", func() { fmt.Println("every 5m, start 5m fron now") })
// 通过AddJob注册
// var cJob cronJobDemo
// c.AddJob("@every 5s", cJob)
// 启动
c.Start()
// 停止
c.Stop()
}
type cronJobDemo int
func (c cronJobDemo) Run() {
fmt.Println("5s func trigger")
return
}
上面代码中,第9、10行的代码调用方法AddJob(spec string, cmd Job)也可以实现AddFunc注册的功能,Job是interface,需要入参类型实现方法:Run()。实际上,方法AddFunc内部将参数cmd 进行了包装(wrapper),然后也是调用方法AddJob进行注册。
后面介绍都会说成AddJob,等效于AddFunc。
AddJob后发生了什么? (主要的数据结构)
对于Cron的整体逻辑,最关键的两个数据结构就是struct Entry和Cron。
每当你用AddJob注册一个定时调用策略,就会为这个策略生成一个唯一的Entry,不难想象,Entry里会存储被执行的时间、需要被调度执行的实体Job。
生成entry后,再将entry放到struct Cron的entry列表里,Cron的结构里,主要是一些用来和外部交互的channel,比如通过channel添加、删除entry等。详见下面的代码。
// Entry 数据结构,每一个被调度实体一个
type Entry struct {
// 唯一id,用于查询和删除
ID EntryID
// 本Entry的调度时间,不是绝对时间,在生成entry时会计算出来
Schedule Schedule
// 本entry下次需要执行的绝对时间,会一直被更新
// 被封装的含义是Job可以多层嵌套,可以实现基于需要执行Job的额外处理
// 比如抓取Job异常、如果Job没有返回下一个时间点的Job是还是继续执行还是delay
Next time.Time
// 上一次被执行时间,主要用来查询
Prev time.Time
// WrappedJob 是真实执行的Job实体
WrappedJob Job
// Job 主要给用户查询
Job Job
}
// Cron 数据结构,为robfig/cron的运行实体使用的s数据结构
type Cron struct {
entries []*Entry // 调度执行实体列表
// chain 用来定义entry里的warppedJob使用什么逻辑(e.g. skipIfLastRunning)
// 即一个cron里所有entry只有一个封装逻辑
chain Chain
stop chan struct{} // 停止整个cron的channel
add chan *Entry // 增加一个entry的channel
remove chan EntryID // 移除一个entry的channel
snapshot chan chan []Entry // 获取entry整体快照的channel
running bool // 代表是否已经在执行,是cron为使用者提供的动态修改entry的接口准备的
logger Logger // 封装golang的log包
runningMu sync.Mutex // 用来修改运行中的cron数据,比如增加entry,移除entry
location *time.Location // 地理位置
parser ScheduleParser // 对时间格式的解析,为interface, 可以定制自己的时间规则。
nextID EntryID // entry的全局ID,新增一个entry就加1
jobWaiter sync.WaitGroup // run job时会进行add(1), job 结束会done(),stop整个cron,以此保证所有job都能退出
}
需要注意的是,WrappedJob和chain这两个成员,这是Cron实现的Job封装逻辑,目前是解决实际调度Job的异常处理。比如你希望自己的上一个时间点的JobA没有结束,下一个时间点的JobA就不执行,这个“不执行”的逻辑实现就定义在chain,初始化时通过chain将JobA进行封装写入WrappedJob,那么每次JobA调用前会先执行封装逻辑,进行判断。
Start后发生了什么? (程序的主体)
cron.Start()执行后,cron的后台程序(方法run())就开始运行了。而它的主体,就是一个定时器的实现和到时后的job运行,加上cron里的数据维护。
cron的定时器实现是一个简洁而典型的业务层实现,着重了解下,具体的流程图可见下图。
它的关键和值得学习之处是:
- 每个entry都包含自己下一次执行的绝对时间
- 先对entries按下次执行时间升序排序,只需要对第一个entry启动定时器
- 定时器到时,只轮询entries里需要执行的entries,不需要全部轮询。
- 且 执行的是当前时间之前的所有job,容错高;
- 第一个定时器处理结束开启下次定时器时,也只需要更新执行过的entries的下次执行时间,不需要更新所有的entries
上面的逻辑说完,程序主体已经清晰,除此之外,程序主体里的定时器监听和其他多个channel共用了select-case,这些channel在struct Cron里能看到,实现了entries的动态添加、删除、entries快照获取等功能。代码结构如下:
将这些操作通过channel让程序主体来操作,可以有效的减少互斥锁的使用,也会引入问题,会导致有的job执行时间不是非常精准,导致某些entry被遗漏:
- 比如最近的jobA的timer在1ms后就要到时,此时加入一个entry,耗时3ms
- 添加完entry后,再重新启动timer(还是jobA的timer,此处还利 用了golang的time.NewTimer(d Duration)的入参为负数会立即到时的特点)
- 下次到时的时间必然不是jobA期待的执行时间(理论上晚了2ms)
当然,channel的操作首先是非常简洁省时的,其次,定时器实现里,会扫描所有当前时间之前的entries来执行,增加了容错性
值得称赞的细节
interface的使用
struct Entry里的Schedule和Cron里的ScheduleParser都是interface,意味着我们是可以自己定制注册job时的时间策略的格式的,只要自己实现时间策略的解析和获取方法就好
这让我想起了以前看过golang里什么时候用interface和struct的讨论,我觉得这是个很好的例子:预期对同一个接口有多个实现时就抽象成interface,不知道该不该用就用struct。
wrapper的实现
上面有提到,通过对Job的封装,cron实现了同一个job多次调用时的异常处理等,值得以后在实践中借鉴。
最后是我加了一点注释的代码,https://github.com/jiangz222/cron/tree/comments-v3
Golang robfig/cron 实现解析的更多相关文章
- golang reflect包使用解析
golang reflect包使用解析 参考 Go反射编码 2个重要的类型 Type Value 其中Type是interface类型,Value是struct类型,意识到这一点很重要 Type和Va ...
- go语言 robfig/cron包 实现定时 调用
package main import ( "github.com/robfig/cron" "time" "fmt" "os&q ...
- golang使用yaml格式解析构建配置文件
现在主流的配置文件格式有这么几种,xml.yaml.config… xml就算了,太挫了,太土, 太繁琐… config 就是mysql,apache my.cnf的那种格式,这个格式适合功能分层, ...
- golang使用simplejson库解析复杂json
cnblogs原创 golang自带的json解析库encoding/json提供了json字符串到json对象的相互转换,在json字符串比较简单的情况下还是挺好用的,但是当json字符串比较复杂或 ...
- golang 开源项目: 配置解析模块--config
在golang中,配置文件经常使用json格式.json格式的语法,有些繁琐,尤其是出现嵌套的时候,每一块都需要大括号包裹,看起来很臃肿. 本着简单易用的原则,个人开发了一个配置解析模块config, ...
- Golang通过结构体解析和封装XML
Golang解析和封装XML 解析XML成结构体Demo package main import ( "encoding/xml" "fmt" ) //我们通过 ...
- 参考MySQL Internals手册,使用Golang写一个简单解析binlog的程序
GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源. MySQL作为最流行的开源关系型数据库,有大量的拥趸.其生态已经相当完善,各项特性在圈内都有大量研究.每次新特性发布,都会 ...
- Cron表达式解析
每一个域可出现的字符如下:Seconds: 可出现 ", - * /" 四个字符,有效范围为0-59的整数Minutes: 可出 ...
- python apsheduler cron 参数解析
from:https://apscheduler.readthedocs.io/en/v2.1.2/cronschedule.html Cron-style scheduling This is th ...
随机推荐
- 迭代器使用过程中为什么抛出ConcurrentModificationException
出现的场景:在迭代器对集合进行遍历的同时,集合本身进行变更操作(add(), remove(), set()). 当正常调用时: import java.util.ArrayList; import ...
- C#与JavaScript中URL编码解码问题(转)
混乱的URI编码 JavaScript中编码有三种方法:escape.encodeURI.encodeURIComponent C#中编码主要方法:HttpUtility.UrlEncode.Serv ...
- idea 忽略不需要提交的文件
1.打开git bash界面,进入到某个项目的根目录,执行下面命令 touch .gitignore 此时,再该项目的根目录里,会创建.gitignore文本,打开该文本,编辑需要忽略的文件(编辑规则 ...
- Flask蓝图(Blueprint)
一.作用 1.目录结构划分 2.url添加前缀 url_prefix 3.应用特殊装饰器,在该蓝图定义的特殊装饰器,只在改蓝图的起效 二.简单示例 1.创建一个项目文件 2.创建一个同名的python ...
- MySQL数据库之xtrabackup物理备份(一)
前言:说到数据库备份,我们知道可以用来对数据库进行备份的工具有mysqldump.mydumer.mysqlpump等等,实际工作中,机器上的数据库不大的话,都是用mysqldump工具来备份,这些备 ...
- 【java面试】数据库篇
1.SQL语句分为哪几种? SQL语句主要可以划分为以下几类: DDL(Data Definition Language):数据定义语言,定义对数据库对象(库.表.列.索引)的操作. 包括:CREAT ...
- latex2e
classs and packages 这一节介绍新的latex文档结构, 以及新的文件类型: classs and packages 类和包是什么? lext 2.09和latex2e的主要差别就在 ...
- 双指针,BFS和图论(三)
(一)图论 1.大臣的旅费 很久以前,T王国空前繁荣. 为了更好地管理国家,王国修建了大量的快速路,用于连接首都和王国内的各大城市. 为节省经费,T国的大臣们经过思考,制定了一套优秀的修建方案,使得任 ...
- OpenCV2.4.13+Qt5.6.2配置方法
[1.环境变量] D:\Soft\OpenCV2\MinGW_build\bin; C:\Qt\Qt5.6.2\Tools\mingw492_32\bin; D:\Soft\Programming\C ...
- Linux系统实时数据同步inotify+rsync
一.inotify简介 inotify是Linux内核的一个功能,它能监控文件系统的变化,比如删除.读.写和卸载等操作.它监控到这些事件的发生后会默认往标准输出打印事件信息.要使用inotify,Li ...