Celery

1.什么是Celery

Celery是一个简单、灵活且可靠的,处理大量消息的分布式系统

专注于实时处理的异步任务队列

同时也支持任务调度

Celery架构

Celery的架构由三部分组成,消息中间件(message broker),任务执行单元(worker)和任务执行结果存储(task result store)组成。

消息中间件(broker)(任务箱)

Celery本身不提消息中间件,

但是可以方便的和第三方提供的消息中间件集成。包括,RabbitMQ, Redis等等

任务执行单元(任务工人)

Worker是Celery处理任务的执行单元,worker并发的运行在分布式的系统节点中。

任务结果存储(任务结果储存)

Task result store用来存储Worker执行的任务的结果,Celery支持以不同方式存储任务的结果,包括AMQP, redis等

版本支持情况

Celery version 4.0 runs on
      Python ❨2.7, 3.4, 3.5❩
      PyPy ❨5.4, 5.5❩
  This is the last version to support Python 2.7, and from the next version (Celery 5.x) Python 3.5 or newer is required.

  If you’re running an older version of Python, you need to be running an older version of Celery:

      Python 2.6: Celery series 3.1 or earlier.
      Python 2.5: Celery series 3.0 or earlier.
      Python 2.4 was Celery series 2.2 or earlier.

  Celery is a project with minimal funding, so we don’t support Microsoft Windows.de Please don’t open any issues related to that platform.

2.使用场景(能干什么)

异步任务:将耗时操作任务提交给Celery去异步执行,比如发送短信/邮件、消息推送、音视频处理等等

定时任务:定时执行某件事情,比如每天数据统计

3.Celery的安装配置

pip install celery

消息中间件:RabbitMQ/Redis

app=Celery('任务名',backend='xxx',broker='xxx')

4.Celery执行异步任务

基本使用

1 创建项目celerytest

2 创建py文件:celery_app_task.py(名字无所谓)

import celery
import time
#
消息中间件
broker='redis://127.0.0.1:6379/2' 不加密码  使用redis的第2个库,

结果存储
backend='redis://:123456@127.0.0.1:6379/1'  使用redis的第一个库
broker='redis://:123456@127.0.0.1:6379/2'

第一个参数,给celery命个名,可以任意名
cel=celery.Celery('test',backend=backend,broker=broker)

执行任务
@cel.task
def add(x,y):
   return x+y

3 创建py文件:add_task.py,包工头添加任务

from celery_app_task import add
ret = add(3,4)
print(ret) 同步提交

异步提交
这句话只是把add任务提交到消息中间件了,必须请工人干活才可以,就是执行
result = add.delay(4,5)
print(result.id)

创建py文件:run.py,执行任务,或者使用命令执行:celery worker -A celery_app_task -l info

注:windows下:celery worker -A celery_app_task -l info -P eventlet(启动工人干活,得到结果)

from celery_app_task import cel
if __name__ == '__main__':
   cel.worker_main()
   # cel.worker_main(argv=['--loglevel=info')

创建py文件:result.py,查看任务执行结果

from celery.result import AsyncResult
from celery_app_task import cel

async = AsyncResult(id="e919d97d-2938-4d0f-9265-fd8237dc2aa3", app=cel)
id 为提交的任务唯一id

当为True时,表示任务完成
if async.successful():
   result = async.get()
   print(result)
   # result.forget() # 将结果删除
   
elif async.failed():
   print('执行失败')
   
elif async.status == 'PENDING':
   print('任务等待中被执行')
   
elif async.status == 'RETRY':
   print('任务异常后正在重试')
   
elif async.status == 'STARTED':
   print('任务已经开始被执行')

执行 add_task.py,添加任务,并获取任务ID

执行 run.py ,或者执行命令:celery worker -A celery_app_task -l info

执行 result.py,检查任务状态并获取结果

多任务结构

pro_cel
   ├── celery_task     # celery相关文件夹,包
   │   ├── celery.py   # celery连接和配置相关文件,必须叫这个名字
   │   └── tasks1.py    # 所有任务函数
   │ └── tasks2.py    # 所有任务函数
   ├── check_result.py # 检查结果
   └── send_task.py    # 触发任务

celery.py

from celery import Celery

cel = Celery('celery_demo',
            broker='redis://127.0.0.1:6379/1',
            backend='redis://127.0.0.1:6379/2',
            # 包含以下两个任务文件,去相应的py文件中找任务,对多个任务做分类
            include=['celery_task.tasks1',
                     'celery_task.tasks2'
                    ])

# 时区
cel.conf.timezone = 'Asia/Shanghai'
# 是否使用UTC
cel.conf.enable_utc = False

tasks1.py

import time
from celery_task.celery import cel

@cel.task
def test_celery(res):
   time.sleep(5)
   return "test_celery任务结果:%s"%res

tasks2.py

import time
from celery_task.celery import cel
@cel.task
def test_celery2(res):
   time.sleep(5)
   return "test_celery2任务结果:%s"%res

check_result.py

from celery.result import AsyncResult
from celery_task.celery import cel

async = AsyncResult(id="08eb2778-24e1-44e4-a54b-56990b3519ef", app=cel)

if async.successful():
   result = async.get()
   print(result)
   # result.forget() # 将结果删除,执行完成,结果不会自动删除
   # async.revoke(terminate=True) # 无论现在是什么时候,都要终止
   # async.revoke(terminate=False) # 如果任务还没有开始执行呢,那么就可以终止。
elif async.failed():
   print('执行失败')
elif async.status == 'PENDING':
   print('任务等待中被执行')
elif async.status == 'RETRY':
   print('任务异常后正在重试')
elif async.status == 'STARTED':
   print('任务已经开始被执行')

send_task.py

from celery_task.tasks1 import test_celery(任务的名字)
from celery_task.tasks2 import test_celery2(任务的名字)

# 立即告知celery去执行test_celery任务,并传入一个参数
result = test_celery.delay('第一个的执行')
print(result.id)
result = test_celery2.delay('第二个的执行')
print(result.id)

添加任务(执行send_task.py),开启work:celery worker -A celery_task -l info -P eventlet,

celery_task是包的名字

检查任务执行结果(执行check_result.py)

集成到django中,只要将包直接复制,粘贴到django项目中就可以

5.Celery执行定时任务

设定时间让celery执行一个任务

add_task.py

from celery_app_task import add
from datetime import datetime

# 方式一
# v1 = datetime(2019, 2, 13, 18, 19, 56)
# print(v1)
# v2 = datetime.utcfromtimestamp(v1.timestamp()) 当前时间转成utc时间
# print(v2)
# result = add.apply_async(args=[1, 3], eta=v2)
定时任务用apply_async方法
# print(result.id)

# 方式二
ctime = datetime.now()
# 默认用utc时间
utc_ctime = datetime.utcfromtimestamp(ctime.timestamp())
from datetime import timedelta

time_delay = timedelta(seconds=10)
timedelta 取10s之后的时间对象

task_time = utc_ctime + time_delay

# 使用apply_async并设定时间
result = add.apply_async(args=[4, 3], eta=task_time)
print(result.id)

类似于contab的定时任务(定时执行任务)

多任务结构中celery.py修改如下

from datetime import timedelta
from celery import Celery
from celery.schedules import crontab

cel = Celery('tasks', broker='redis://127.0.0.1:6379/1', backend='redis://127.0.0.1:6379/2', include=[
   'celery_task.tasks1',
   'celery_task.tasks2',
])
cel.conf.timezone = 'Asia/Shanghai'
cel.conf.enable_utc = False

cel.conf.beat_schedule = {
   # 名字随意命名
   'add-every-10-seconds': {
       # 执行tasks1下的test_celery函数
       'task': 'celery_task.tasks1.test_celery',
       # 每隔2秒执行一次
       # 'schedule': 1.0,
       # 'schedule': crontab(minute="*/1"),
       'schedule': timedelta(seconds=2),
       # 传递参数
       'args': ('test',)
  },
   # 'add-every-12-seconds': {
   #     'task': 'celery_task.tasks1.test_celery',
   #     每年4月11号,8点42分执行
   #     'schedule': crontab(minute=42, hour=8, day_of_month=11, month_of_year=4),
   #     'schedule': crontab(minute=42, hour=8, day_of_month=11, month_of_year=4),
   #     'args': (16, 16)
   # },
}

启动一个beat(提交任务到消息中间件):celery beat -A celery_task -l info

启动work执行:celery worker -A celery_task -l info -P eventlet

6.Django中使用Celery(一般不用)

安装包

celery==3.1.25
django-celery==3.1.20

在项目目录下创建celeryconfig.py

import djcelery
djcelery.setup_loader()
CELERY_IMPORTS=(
   'app01.tasks',
)
#有些情况可以防止死锁
CELERYD_FORCE_EXECV=True
# 设置并发worker数量
CELERYD_CONCURRENCY=4
#允许重试
CELERY_ACKS_LATE=True
# 每个worker最多执行100个任务被销毁,可以防止内存泄漏
CELERYD_MAX_TASKS_PER_CHILD=100
# 超时时间
CELERYD_TASK_TIME_LIMIT=12*30

在app01目录下创建tasks.py

from celery import task
@task
def add(a,b):
   with open('a.text', 'a', encoding='utf-8') as f:
       f.write('a')
   print(a+b)

视图函数views.py

from django.shortcuts import render,HttpResponse
from app01.tasks import add
from datetime import datetime
def test(request):
   # result=add.delay(2,3)
   ctime = datetime.now()
   # 默认用utc时间
   utc_ctime = datetime.utcfromtimestamp(ctime.timestamp())
   from datetime import timedelta
   time_delay = timedelta(seconds=5)
   task_time = utc_ctime + time_delay
   result = add.apply_async(args=[4, 3], eta=task_time)
   print(result.id)
   return HttpResponse('ok')

settings.py


INSTALLED_APPS = [
  ...
   'djcelery',
   'app01'
]

...

from djagocele import celeryconfig
BROKER_BACKEND='redis'
BOOKER_URL='redis://127.0.0.1:6379/1'
CELERY_RESULT_BACKEND='redis://127.0.0.1:6379/2'

celery知多少的更多相关文章

  1. celery简介

    目录 Celery简介 Celery架构 中间件选择 Celery序列化 简单项目 Celery简介 celery userguide 知乎大神解释celery Celery(芹菜)是基于Python ...

  2. celery在Django中的集成使用

    继上回安装和使用Redis之后,看看如何在Django中使用Celery.Celery是Python开发分布式任务列队的处理库.可以异步分布式地异步处理任务,也可定时执行任务等等.通常我们可以在Dja ...

  3. 使用celery时要注意的任务调用形式

    因为之前,一直用django和celery紧密集成,不分家. 所以使用时参考了网上的配置之后,没有变更过. 最近,和洪军想用k8s的pod重新规划系统构架时,这个问题才又浮了出来. 只是我们的task ...

  4. 面试前必须要知道的21道Redis面试题

    1.使用redis有哪些好处? 速度快,因为数据存在内存中,类似于HashMap,HashMap的优势就是查找和操作的时间复杂度都是O(1) 支持丰富数据类型,支持string,list,set,so ...

  5. [转帖]知新之--12-factors

    知新之--12-factors https://blog.csdn.net/weixin_34233421/article/details/85819756 12-factors I. 基准代码 一份 ...

  6. Celery的常用知识

    什么是Clelery   Celery是一个简单.灵活且可靠的,处理大量消息的分布式系统.专注于实时处理的异步任务队列.同时也支持任务调度. Celery的架构由三部分组成,消息中间件(message ...

  7. [源码解析] 并行分布式框架 Celery 之 worker 启动 (2)

    [源码解析] 并行分布式框架 Celery 之 worker 启动 (2) 目录 [源码解析] 并行分布式框架 Celery 之 worker 启动 (2) 0x00 摘要 0x01 前文回顾 0x2 ...

  8. [源码解析] 分布式任务队列 Celery 之启动 Consumer

    [源码解析] 分布式任务队列 Celery 之启动 Consumer 目录 [源码解析] 分布式任务队列 Celery 之启动 Consumer 0x00 摘要 0x01 综述 1.1 kombu.c ...

  9. [源码解析] 并行分布式任务队列 Celery 之 EventDispatcher & Event 组件

    [源码解析] 并行分布式任务队列 Celery 之 EventDispatcher & Event 组件 目录 [源码解析] 并行分布式任务队列 Celery 之 EventDispatche ...

随机推荐

  1. 外部读取Excel的两种方法

    1.使用Epplus读取 下载地址为https://epplus.codeplex.com/,下载文件后引用Epplus.dll文件. 这个类库读取Excel方便快捷,但是它只能读取.xlsx类型的文 ...

  2. laravel controller重写

    <?php namespace Boss\Http\Controllers; use Illuminate\Foundation\Bus\DispatchesJobs; use Illumina ...

  3. 数据库相关文章转载(2) MySQL自带的性能压力测试工具mysqlslap详解

    PS:今天一同事问我有木有比较靠谱的mysql压力测试工具可用.其实mysql自带就有一个叫mysqlslap的压力测试工具,还是模拟的不错的.下面举例说说.mysqlslap是从5.1.4版开始的一 ...

  4. python30 excel修改模块xlutils

    xlrd只读,xlwt只写,xlutils模块则将读写功能结合起来.https://pypi.org/project/xlutils/ 修改excel通过xlutils的copy函数将<clas ...

  5. 7、Python文件操作工具 openpyxl 工具 2

    创建一个工作簿 使用openpyxl没有必要先在系统中新建一个.xlsx,我们需要做的只需要引入Workbook这个类,接着开始调用它. >>> from openpyxl impo ...

  6. centos虚拟机安装,配置静态ip可以访问网络

    centos安装过程中需要注意几个问题 1.选择安装的软件 默认选择的是mininal,应该选择GNEME Desktop 安装的过程中可以设置network 配置linux网络命令 具体配置 退出键 ...

  7. [转]CentOS 7忘记root密码解决办法

    转自:http://www.linuxidc.com/Linux/2016-08/134034.htm  亲测可用! CentOS 7 root密码的重置方式和CentOS 6完全不一样,CentOS ...

  8. UVa 10735 - Euler Circuit(最大流 + 欧拉回路)

    链接: https://uva.onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem& ...

  9. git 如何忽略文件以及使用.gitignore 不生效的解决办法

    (1) git 如何忽略文件 在git中如果想忽略掉某个文件,不让这个文件提交到版本库中,可以使用修改根目录中 .gitignore 文件的方法(如无,则需自己手工建立此文件).这个文件每一行保存了一 ...

  10. keras学习笔记2

    1.keras的sequential模型需要知道输入数据的shape,因此,sequential的第一层需要接受一个关于输入数据shape的参数,后面的各个层则可以自动的推导出中间数据的shape,因 ...