在Python开发过程中我们经常需要执行定时任务,而此类任务我们通常有如下选项:

  • 自己造轮子
  • 使用schedule库
  • 使用Celery定时任务
  • 使用APScheduler

自己造轮子实现,最大的优势就是灵活性,调试方便,对于某些特定系统也许也是一种选择,不过对于大多数应用来说,我们应当尽可能地使用开源的成熟的方案。下面对后三种方案分别讨论:

使用schedule库

schedule库是一个轻量级的定时任务方案,优势是使用简单,也不需要做什么配置;缺点是无法动态添加任务,也无法将任务持久化。

安装
  1. pip install schedule
使用
  1. import schedule
  2. import time
  3. def job():
  4. print("I'm working...")
  5. schedule.every(10).minutes.do(job)
  6. schedule.every().hour.do(job)
  7. schedule.every().day.at("10:30").do(job)
  8. schedule.every(5).to(10).minutes.do(job)
  9. schedule.every().monday.do(job)
  10. schedule.every().wednesday.at("13:15").do(job)
  11. while True:
  12. schedule.run_pending()
  13. time.sleep(1)

使用Celery

Celery在Python领域可谓大名鼎鼎,我们通常将Celery作为一个任务队列来使用,不过Celery也同时提供了定时任务功能。通常,当我们的解决方案中已经在使用Celery的时候可以考虑同时使用其定时任务功能,但是Celery无法在Flask这样的系统中动态添加定时任务(在Django中有相应的插件可以实现动态添加任务),而且如果对于不使用Celery的项目,单独为定时任务搭建Celery显得过于重量级了。(搭建Celery比较麻烦,还需要配置诸如RabbitMQ之类消息分发程序)。

Celery安装在此不再赘述,大家可以参考官网的资料

使用

Celery虽然无法动态添加定时任务,但是可以在程序固定位置添加定时任务,如下:

  1. from celery import Celery
  2. from celery.schedules import crontab
  3. app = Celery()
  4. # 此处on_after_configure装饰符意味着当Celery app配置完成之后调用该hook函数
  5. @app.on_after_configure.connect
  6. def setup_periodic_tasks(sender, **kwargs):
  7. # Calls test('hello') every 10 seconds.
  8. sender.add_periodic_task(10.0, test.s('hello'), name='add every 10')
  9. # Calls test('world') every 30 seconds
  10. sender.add_periodic_task(30.0, test.s('world'), expires=10)
  11. # Executes every Monday morning at 7:30 a.m.
  12. sender.add_periodic_task(
  13. crontab(hour=7, minute=30, day_of_week=1),
  14. test.s('Happy Mondays!'),
  15. )
  16. @app.task
  17. def test(arg):
  18. print(arg)
  • 这里调用add_periodic_task用于添加一个定时任务,相当于在Celery config文件中的beat_schedule设置项中添加了一项,如下:

    1. app.conf.beat_schedule = {
    2. 'add-every-30-seconds': {
    3. 'task': 'tasks.add',
    4. 'schedule': 30.0,
    5. 'args': (16, 16)
    6. },
    7. }
  • add_periodic_task中指定job function时需要用.s()来调用

使用APScheduler

笔者认为APScheduler是在实际项目最好用的一个工具库。它不仅可以让我们在程序中动态添加和删除我们的定时任务,还支持持久化,且其持久化方案支持很多形式,包括(Memory, MongoDB, SQLAlchemy, Redis, RethinkDB, ZooKeeper), 也可以非常好与一些Python framework集成(包括asyncio, gevent, Tornado, Twisted, Qt). 笔者所在的项目使用的是Flask框架,也有相应的插件可以供我们直接使用。

但是笔者没有使用插件,而是直接将APScheduler集成于项目代码中。

初始化scheduler
  1. # 可以在初始化Flask的时候调用,并将返回的scheduler赋给app
  2. def init_scheduler():
  3. # 这里用于持久化的设置,代码中演示使用MongoDB
  4. # client用于设置你自己的MongoDB的handler, 即MongoClient对象
  5. jobstores = {
  6. 'default': MongoDBJobStore(client=your_db_handler, collection="schedule_job")
  7. }
  8. executors = {
  9. 'default': ThreadPoolExecutor(20)
  10. }
  11. job_defaults = {
  12. 'coalesce': False,
  13. 'max_instances': 5
  14. }
  15. # 这里使用BackgroundScheduler即可
  16. scheduler = BackgroundScheduler(jobstores=jobstores, executors=executors, job_defaults=job_defaults, timezone=utc)
  17. # 注意这里一定要调用start启动scheduler
  18. scheduler.start()
  19. return scheduler
添加定时任务

APScheduler将定时任务分为三种:

  • interval: 比如每隔5分钟执行一次任务
  • cron: 比如每天早上5点执行一次任务
  • date: 比如在2018年5月5日执行一次任务

我们以添加cron job为例:

  1. def test_job(name):
  2. print "hello, %s" % name
  3. def add_daily_job(name):
  4. exec_time = datetime.now() + timedelta(minutes=2)
  5. hour = exec_time.strftime("%H")
  6. minute = exec_time.strftime("%M")
  7. # 这里要选择'cron'
  8. # 另外,job_id可以根据你自己的情况设定,其会被用于remove_job
  9. current_app.scheduler.add_job(
  10. test_job, 'cron', hour=hour, minute=minute,
  11. args=[name], id=job_id)
删除定时任务

通过在add_job时使用的job_id可以删除对应的定时任务。实际上在我们添加任务的时候,APScheduler会把相应的任务信息存储于我们jobstore中设置的持久化存储方案,这里使用的是MongoDB,然后当删除的时候会将相应的任务从MongoDB中删除。

  1. def remove_daily_job(job_id):
  2. current_app.scheduler.remove_job(job_id)

总结:

APScheduler在实际使用过程中拥有最大的灵活性,可以满足我们的大部分定时任务的相关需求;Celery比较重量级,通常如果项目中已有Celery在使用,而且不需要动态添加定时任务时可以考虑使用;schedule非常轻量级,使用简单,但是不支持任务的持久化,也无法动态添加删除任务,所以主要用于简单的小型应用。

References

作者:geekpy
链接:https://www.jianshu.com/p/94b273f6ed77
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

Python定时任务-schedule vs. Celery vs. APScheduler的更多相关文章

  1. Python 定时任务框架 APScheduler 详解

    APScheduler 最近想写个任务调度程序,于是研究了下 Python 中的任务调度工具,比较有名的是:Celery,RQ,APScheduler. Celery:非常强大的分布式任务调度框架 R ...

  2. Python定时任务框架APScheduler 3.0.3 Cron示例

    APScheduler是基于Quartz的一个Python定时任务框架,实现了Quartz的所有功能,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务.基 ...

  3. Python定时任务框架APScheduler

    http://blog.csdn.net/chosen0ne/article/details/7842421 APScheduler是基于Quartz的一个Python定时任务框架,实现了Quartz ...

  4. [转]Python定时任务框架APScheduler

    APScheduler是基于Quartz的 一个Python定时任务框架,实现了Quartz的所有功能,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以 持久化任务 ...

  5. python 定时任务APScheduler 使用介绍

    python 定时任务APScheduler 使用介绍   介绍: APScheduler的全称是Advanced Python Scheduler.它是一个轻量级的 Python 定时任务调度框架. ...

  6. APScheduler(python 定时任务框架)最简单使用教程

    有时候需要部署一些很简单的python定时任务,使用APScheduler是很好的选择.只需要简单的设置几个参数,就可以实现定时.定分甚至秒来跑. 第一步:用pip安装APScheduler pip ...

  7. [Dynamic Language] Python定时任务框架

    APScheduler是一个Python定时任务框架,使用起来十分方便.提供了基于日期.固定时间间隔以及crontab类型的任务,并且可以持久化任务.并以daemon方式运行应用. 在APSchedu ...

  8. Python 并行分布式框架 Celery

    Celery 简介 除了redis,还可以使用另外一个神器---Celery.Celery是一个异步任务的调度工具. Celery 是 Distributed Task Queue,分布式任务队列,分 ...

  9. Python 定时任务的实现方式

    本文转载自: https://lz5z.com/Python%E5%AE%9A%E6%97%B6%E4%BB%BB%E5%8A%A1%E7%9A%84%E5%AE%9E%E7%8E%B0%E6%96% ...

随机推荐

  1. .NET C# Json序列化与反序列化——Newtonsoft.Json学习笔记

    Newtonsoft.Json,一款.NET中开源的Json序列化和反序列化类库(介绍及下载地址:http://json.codeplex.com/). /// <summary>    ...

  2. web翻译——插件

    很多时候,可能我们web项目中需要的只是机械式的翻译,并不需要什么利用xml或者js json等等实现逼真翻译,那样工作量太大.这时候可能你就需要这几款小工具来帮助你.当然,如果 对翻译或者你的项目外 ...

  3. 【Selenium+Python Webdriver】报错之:TypeError: user_login() missing 1 required positional argument: 'self'

    先贴一下源码: base.py文件如下: from selenium import webdriver class Page(object): ''' 页面基础类,用于所有页面的继承 ''' rb_u ...

  4. ASP.NET动态网站制作(2)--css(1)

    前言:这节课主要讲关于css的相关内容. 重点:1.css(Cascading Style Sheet)叠层样式表,做网页的外观,是用来控制网页样式并允许将样式信息与网页内容分离的一种标记性语言. 2 ...

  5. 【剑指Offer学习】【面试题58:二叉树的下一个结点】

    题目:给定一棵二叉树和当中的一个结点.怎样找出中序遍历顺序的下一个结点?树中的结点除了有两个分别指向左右子结点的指针以外,另一个指向父节点的指针. 解题思路 假设一个结点有右子树.那么它的下一个结点就 ...

  6. php总结7——文件函数库、序列化数据、文件包含

    7.1 文件函数库 php用来操作文件的 1) fopen    代开文件或URL 格式:resource fopen(string $filename, string $mode) 'r' 只读方式 ...

  7. [证书服务器 第二篇] 基于OpenSSL 在 CentOS6 系统上 搭建自签证书服务,并应用于Web容器

    第一部分:概述 .. 第二部分:环境准备 1 操作系统 CentOS 6.x 2 安装openssl yum install -y openssl 3 安装jdk 从官网下载JDK http://ww ...

  8. 【linux】如何给sudo的root设置环境变量

    如果系统不能通过root登陆,而是需要使用其他用户sudo的方式登陆root,那么root的环境变量很难设置,修改/etc/profile也没有用.可以通过下面这个方式解决 修改sudoer的配置文件 ...

  9. UML类图几种关系的总结 ---(转载)

    在UML类图中,常见的有以下几种关系:泛化(Generalization),  实现(Realization),关联(Association),聚合(Aggregation),组合(Compositi ...

  10. JDBC超时原理与设置

    抄录自网上,因为担心以后找不到,因此抄录之.感谢分享的大神! 英文原版:http://www.cubrid.org/blog/dev-platform/understanding-jdbc-inter ...