Celery分布式任务队列快速入门
本节内容
一 Celery介绍和基本使用 |
需求场景
1. 对100台命令执行一条批量命令,命令执行需要很长时间,但是不想让主程序等着结果返回,而是给主程序返回一个任务ID,task_id
主程序过一段时间根据task_id,获取执行结果即可,再命令执行期间,主程序 可以继续做其他事情
2. 定时任务,比如每天检测一下所有的客户资料,发现是客户的生日,发个祝福短信
解决方案
1. 逻辑view 中启一个进程
父进程结束,子进程跟着结束,子进程任务没有完成,不符合需求
父进程结束,等着子进程结束,父进程需等着结果返回,不符合需求
小结:该方案解决不了阻塞问题,即需要等待
2. 启动 subprocess,任务托管给操作系统执行
实现task_id,实现异步,解决阻塞
小结:大批量高并发,主服务器会出现问题,解决不了并发
3. celery
celery提供多子节点,解决并发问题
celery介绍
celery是一个基于python开发的分布式异步消息队列,轻松实现任务的异步处理
celery在执行任务时需要一个消息中间件来接收和发送任务消息,以及存储任务结果,一般使用RabbitMQ 或 Redis
celery优点
简单:熟悉celery的工作流程后,配置使用简单
高可用:当任务执行失败或执行过程中发生连接中断,celery会自动尝试重新执行任务
快速:一个单进程的celery每分钟可处理上百万个任务
灵活:几乎celery的各个组件都可以被扩展及自定制
celery基本工作流程
其中中间队列用于分配任务以及存储执行结果
celery安装及使用
1. 安装python模块
pip3 install celery
pip3 install redis
2. 安装redis服务
wget http://download.redis.io/releases/redis-3.2.8.tar.gz
tar -zxvf redis-3.2.8.tar.gz
cd redis-3.2.8
make src/redis-server # 启动redis 服务
3. 创建一个celery application 用来定义任务列表
创建一个任务 tasks.py
from celery import Celery app = Celery('TASK',
broker='redis://localhost',
backend='redis://localhost') @app.task
def add(x,y):
print("running...",x,y)
return x+y
4. 启动celery worker 来开始监听并执行任务
celery -A tasks worker --loglevel=info
tasks 任务文件名,worker 任务角色,--loglevel=info 任务日志级别
5. 调用任务
打开另外终端,进入命令行模式,调用任务
6. celery常用接口
tasks.add(4,6) ---> 本地执行
tasks.add.delay(3,4) --> worker执行
t=tasks.add.delay(3,4) --> t.get() 获取结果,或卡住,阻塞
t.ready()---> False:未执行完,True:已执行完
t.get(propagate=False) 抛出简单异常,但程序不会停止
t.traceback 追踪完整异常
补充:如何使用第三方工具
1. 导入第三方包,如 from celery import Celery
2. 实例化第三方类,如 app = Celery(......)
3. 实例化的对象去关联执行任务的方法,如 @app.task
4. 分区角色 worker 执行任务,broker分配任务
二 项目中使用Celery |
1. 项目目录结构
project
|-- __init__.py
|-- celery.py # 配置文档
|-- tasks.py # 任务函数
|-- tasks2.py # 任务函数
2. 项目文件
project/celery.py
# from celery import Celery 默认当前路径,更改为绝对路径(当前路径有个celery.py文件啦)
from __future__ import absolute_import, unicode_literals
from celery import Celery app = Celery('project',
broker='redis://localhost',
backend='redis://localhost',
include=['project.tasks','project.tasks2']) # 配置文件和任务文件分开了,可以写多个任务文件 # app 扩展配置
app.conf.update(
result_expires=3600,
) if __name__ == '__main__':
app.start()
celery.py作用相当于配置文件
project/tasks.py
from __future__ import absolute_import, unicode_literals
from .celery import app @app.task
def add(x, y):
return x + y @app.task
def mul(x, y):
return x * y
project/tasks.py
from __future__ import absolute_import, unicode_literals
from .celery import app @app.task
def hello():
return 'Hello World'
3. 启动项目worker
celery -A project worker -l info
其中 project 为项目名
另启终端,与project同目录进入python3
celery multi start w1 -A project -l info
celery multi start w2 -A project -l info
celery multi start w3 -A project -l info celery multi restart w1 -A project -l info
celery multi stop w1 w2 w3 # 任务立刻停止
celery multi stopwait w1 w2 w3 # 任务执行完,停止
三 Celery定时任务 |
project
|-- __init__.py
|-- celery.py # 配置文件
|-- periodic_task.py # 定时任务文件
脚本celery.py
from __future__ import absolute_import, unicode_literals
from celery import Celery app = Celery('project',
broker='redis://localhost',
backend='redis://localhost',
include=['project.periodic_task',]) app.conf.update(
result_expires=3600,
) if __name__ == '__main__':
app.start()
脚本periodic_task.py
from __future__ import absolute_import, unicode_literals
from .celery import app
from celery.schedules import crontab @app.on_after_configure.connect
def setup_periodic_tasks(sender, **kwargs):
# 每10s调用 test('hello')
sender.add_periodic_task(10.0, test.s('hello'), name='add every 10') # 每20s调用 test('world')
sender.add_periodic_task(20.0, test.s('world'), expires=10) # 每周一早上7:30 执行 test('Happy Mondays!')
sender.add_periodic_task(
crontab(hour=7, minute=30, day_of_week=1), # 可灵活修改
test.s('Happy Mondays!'),
) @app.task
def test(arg):
print(arg)
celery -A project worker -l info
celery -A project.periodic_task beat -l debug
也可以在配置文件celery.py 里添加定时任务
app.conf.beat_schedule = {
'add-every-30-seconds': {
'task': 'project.tasks.add',
'schedule': 30.0,
'args': (16, 16)
},
}
app.conf.timezone = 'UTC'
每周1的早上7.30执行project.tasks.add任务
还有更多定时配置方式如下:
Example | Meaning |
crontab() |
每分钟执行 |
crontab(minute=0,hour=0) |
每天0点执行 |
crontab(minute=0,hour='*/3') |
每3小时执行: midnight, 3am, 6am, 9am, noon, 3pm, 6pm, 9pm. |
|
同上 |
crontab(minute='*/15') |
每15分钟执行 |
crontab(day_of_week='sunday') |
周天的每分钟执行 |
|
同上 |
|
周三、五,3-4 am, 5-6 pm, and 10-11 pm,每10分钟执行 |
crontab(minute=0,hour='*/2,*/3') |
每小时/2和每小时/3,执行 |
crontab(minute=0, hour='*/5') |
每小时/5,执行 |
crontab(minute=0, hour='*/3,8-17') |
每小时/3,8am-5pm,执行 |
crontab(0,0,day_of_month='2') |
Execute on the second day of every month. |
|
Execute on every even numbered day. |
|
Execute on the first and third weeks of the month. |
|
Execute on the eleventh of May every year. |
|
Execute on the first month of every quarter. |
四 Celery与Django结合 |
LearnCelery
|-- app1
|-- tasks.py
|-- models.py
|-- app2
|-- tasks.py
|-- models.py
|-- LearnCelery
|-- __init__.py
|-- celery.py
|-- settings.py
2. 脚本代码
LearnCelery/app/tasks.py # 必须叫这个名字
from __future__ import absolute_import, unicode_literals
from celery import shared_task
import time # 所有的app都可以调用
@shared_task
def add(x, y):
time.sleep(10)
return x + y @shared_task
def mul(x, y):
time.sleep(10)
return x * y
LearnCelery/LearnCelery/__init__.py
from __future__ import absolute_import, unicode_literals # This will make sure the app is always imported when
# Django starts so that shared_task will use this app.
from .celery import app as celery_app __all__ = ['celery_app']
LearnCelery/LearnCelery/celery.py
from __future__ import absolute_import, unicode_literals
import os
from celery import Celery # 单独脚本调用Django内容时,需配置脚本的环境变量
os.environ.setdefault('DJANGO_SETTINGS_MODULE', 'mysite.settings') app = Celery('mysite') # CELERY_ 作为前缀,在settings中写配置
app.config_from_object('django.conf:settings', namespace='CELERY') # 到Django各个app下,自动发现tasks.py 任务脚本
app.autodiscover_tasks() @app.task(bind=True)
def debug_task(self):
print('Request: {0!r}'.format(self.request))
LearnCelery/LearnCelery/settings.py
# For celery
CELERY_BROKER_URL = 'redis://localhost'
CELERY_RESULT_BACKEND = 'redis://localhost'
3. 启动celery
celery -A LearnCelery worker -l debug
urlpatterns = [
url(r'^celery_call/$', views.celery_call),
url(r'^celery_res/$', views.celery_res),
]
五 Django中使用计划任务 |
pip3 install django-celery-beat
INSTALLED_APPS = [
....
'django_celery_beat',
]
3. 数据库迁移
python manage.py migrate
4. 启动 celery beat
celery -A LearnCelery beat -l info -S django
定时任务存到数据库里,启动beat定时取任务放到队列里执行
5. admin管理
启动celery beat和worker,会发现每隔2秒,beat会发起一个任务消息让worker执行tasks任务
注意,经测试,每添加或修改一个任务,celery beat都需要重启一次,要不然新的配置不会被celery beat进程读到
Celery分布式任务队列快速入门的更多相关文章
- Celery 分布式任务队列快速入门
Celery 分布式任务队列快速入门 本节内容 Celery介绍和基本使用 在项目中如何使用celery 启用多个workers Celery 定时任务 与django结合 通过django配置cel ...
- Celery 分布式任务队列快速入门 以及在Django中动态添加定时任务
Celery 分布式任务队列快速入门 以及在Django中动态添加定时任务 转自 金角大王 http://www.cnblogs.com/alex3714/articles/6351797.html ...
- 【转】Celery 分布式任务队列快速入门
Celery 分布式任务队列快速入门 本节内容 Celery介绍和基本使用 在项目中如何使用celery 启用多个workers Celery 分布式 Celery 定时任务 与django结合 通过 ...
- day21 git & github + Celery 分布式任务队列
参考博客: git & github 快速入门http://www.cnblogs.com/alex3714/articles/5930846.html git@github.com:liyo ...
- Celery ---- 分布式队列神器 ---- 入门
原文:http://python.jobbole.com/87238/ 参考:https://zhuanlan.zhihu.com/p/22304455 Celery 是什么? Celery 是一个由 ...
- Celery 分布式任务队列入门
一.Celery介绍和基本使用 Celery 是一个 基于python开发的分布式异步消息任务队列,通过它可以轻松的实现任务的异步处理, 如果你的业务场景中需要用到异步任务,就可以考虑使用celery ...
- celery --分布式任务队列
一.介绍 celery是一个基于python开发的分布式异步消息任务队列,用于处理大量消息,同时为操作提供维护此类系统所需的工具. 它是一个任务队列,专注于实时处理,同时还支持任务调度.如果你的业务场 ...
- Celery -- 分布式任务队列 及实例
Celery 使用场景及实例 Celery介绍和基本使用 在项目中如何使用celery 启用多个workers Celery 定时任务 与django结合 通过django配置celery perio ...
- celery分布式任务队列的使用
一.Celery介绍和基本使用 Celery 是一个 基于python开发的分布式异步消息任务队列,通过它可以轻松的实现任务的异步处理, 如果你的业务场景中需要用到异步任务,就可以考虑使用celery ...
随机推荐
- mysql 表映射为java bean 手动生成。
在日常工作中,一般是先建表.后建类.当然也有先UML构建类与类的层级关系,直接生成表.(建模)这里只针对先有表后有类的情况.不采用代码生成器的情况. 例如: 原表结构: ),)) BEGIN ); ) ...
- 【学习】数据处理基础知识(基本功能)【pandas】
本章介绍pandas的重要功能,只记录一些重点内容 1.重新索引 pandas对象的一个重要方法是reindex,其作用是创建一个适应用新索引的新对象 #重新索引 obj = pd.Series([4 ...
- mysql实现IP与整形互转
- 尚硅谷springboot学习33-整合mybatis
引入mybatis依赖(还要引入mysql和jdbc依赖) <dependency> <groupId>org.mybatis.spring.boot</groupId& ...
- 安装Caffe纪实
第一章 引言 在ubuntu16.04安装caffe,几乎折腾了一个月终于成功;做一文章做纪要,以便日后查阅.总体得出的要点是:首先,每操作一步,必须知道如何检验操作的正确性;笔者的多次失误是因为配置 ...
- 通过adb启动app应用
由于某些原因,我需要自动启动雷电模拟器里面的一个应用.(利用Windows任务计划) 怎么自启动雷电模拟器就不用说了,很简单. 自启动app我倒是不熟悉,我没用安卓方面的知识.再官网论坛上面查到了相关 ...
- html背景图星际导航图练习
html <body> <div class="box1"> <div></div> ...
- flume知识点总结
首先介绍一下在flume中常用的一个数据格式,以及使用该格式的优缺点: 从flume写数据到hdfs中的时候,使用二进制格式相对于使用纯文本来说是一种更好的选择,因为大多数二进制格式都有一些方法指明 ...
- 使用ibatis时 sql中 in 的参数赋值(转)
转:http://www.cnblogs.com/sunzhenchao/archive/2012/12/03/2799365.html 一.问题描述: 1.在使用ibatis执行下面的sql: up ...
- Linux权限赋予远程连接MySQL
1.mysql -u root -p (root)用户名 2.mysql>GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY 'r ...