Python中Celery 的基本用法以及Django 结合 Celery 的使用和实时监控进程

celery是什么

　　1 celery是一个简单，灵活且可靠的，处理大量消息的分布式系统

　　2 专注于实时处理的异步任务队列

　　3 同时也支持任务调度

执行流程

Celery 基本使用

tasks.py

import time
from celery import Celery

# 消息中间件
broker = 'redis://localhost:6379/1'

# 存取任务执行的结果
backend = 'redis://localhost:6379/2'

app = Celery('my_task',broker=broker,backend=backend)

@app.task
def add(x,y):
    print('enter call func......')
    time.sleep(4)
    return x+y

app.py

import time
from tasks import add

if __name__ == '__main__':
    print('start task')
    result = add.delay(2,3)
    print(result)

启动 worker - —A 表示指定celery 实例位置

celery worker -A tasks -l INFO

result.ready  # 是否执行完成

result.get()    # 获取执行的结果

终端celery 打印结果　

Celery 配置文件

目录结构如下

celery_app/celeryconfig.py

BROKER_URL = 'redis://localhost:6379/1'
CELERY_RESULT_BACKEND = 'redis://localhost:6379/2'
CELERY_TIMEZONE = 'Asia/Shanghai' # 指定时区

# 导入指定模块

CELERY_IMPORTS = (
    'celery_app.task1',
    'celery_app.task2'

)

celery_app/__init__.py

from celery import Celery

app = Celery('demo')
app.config_from_object('celery_app.celeryconfig') #通过celery实例加载配置

celery_app/task1.py

from celery_app import app
import time

@app.task
def add(x,y):
    print('enter call func......')
    time.sleep()
    return x+y

celery_app/task2.py

from celery_app import app
import time

@app.task
def multiply(x,y):
    print('enter call func......')
    time.sleep()
    return x*y

app.py

from celery_app.task1 import add
from celery_app.task2 import multiply

if __name__ == '__main__':
    print('start task')
    result1 = add.delay(,)
    result2 = multiply.delay(,)
    print('end')

启动worker

celery worker -A celery_app -l INFO

执行app.py

worker控制台打印

Celery 定时任务

在celery 4.10中有一个时区的bug在这里我用的是4.0.2

celery_app/celerycongig.py 增加以下代码

实现每隔3s执行一次task1，每天在23:33执行task2

from datetime import timedelta
from celery.schedules import crontab

# 配置定时任务列表
CELERYBEAT_SCHEDULE = {

    "task1":{
        "task": "celery_app.task1.add",
        "schedule": timedelta(seconds=3), # 每3S执行一次
        'args': (2,8)
    },
    "task2": {
        "task": "celery_app.task2.multiply",
        "schedule": crontab(hour=23,minute=33), # 每天23:33执行
        'args': (4, 5)
    }
}

完整配置代码

from datetime import timedelta
from celery.schedules import crontab

BROKER_URL = 'redis://localhost:6379/1'
CELERY_RESULT_BACKEND = 'redis://localhost:6379/2'

# 导入指定模块

CELERY_IMPORTS = (
    'celery_app.task1',
    'celery_app.task2'

)

CELERY_TIMEZONE = 'Asia/Shanghai'

# 配置定时任务列表
CELERYBEAT_SCHEDULE = {

    "task1":{
        "task": "celery_app.task1.add",
        ), # 每3S执行一次
        ,)
    },
    "task2": {
        "task": "celery_app.task2.multiply",
        ,minute=), # 每天23:33执行
        , )
    }
}

运行beat 发送定时任务

celery beat -A celery_app -lNFO

启动worker

celery worker -A celery_app -l INFO

用一条命令来启动 beat 和worker

celery -B -A celery_app worker -l INFO

在Django中使用 Celery

安装依赖

pip install django-celery

创建django项目

django-admin startproject immoc

创建一个cource的app

python manage.py startapp course

在setiing.py中注册cource和djcelery应用

INSTALLED_APPS = (
    'django.contrib.admin',
    'django.contrib.auth',
    'django.contrib.contenttypes',
    'django.contrib.sessions',
    'django.contrib.messages',
    'django.contrib.staticfiles',
　　 'djcelery',
    'course'
)

在应用couse下创建tasks.py 任务文件

import time

from celery import shared_task

@shared_task()
def course_task():
    print('start_cource')
    time.sleep(4)
    print('end_cource')

在immoc/immoc下创建celeryconfig.py 配置celery

from datetime import timedelta

import djcelery
from celery.schedules import crontab

djcelery.setup_loader()

# 定义队列
CELERY_QUEUES = {
    'beat_tasks':{
        'exchange':"beat_tasks",
        'exchange_type':"direct",
        'binding_key':'beat_tasks'
    },
    "work_queue":{
        'exchange':'work_queue',
        'exchange_type':"direct",
        'binding_key':"work_queue"
    }

}

# 指定默认的队列
CELERY_DEFAULT_QUEUE = 'work_queue'

# 有些情况下可以防止死锁

CELERYD_FORCE_EXECV = True

# 设置并发的worker数
CELERYD_CONCURRENCY = 

# 允许重试
CELERY_ACKS_LATE = True

# 每个worker执行100个任务就销毁，防止内存泄露
CELERYD_MAX_TASKS_PER_CHILD =

# 单个任务最大的运行时间
CELERYD_TASK_TIME_LIMIT = *

CELERY_TIMEZONE = 'Asia/Shanghai'

# 配置定时任务列表
CELERYBEAT_SCHEDULE = {

    "task1":{
        "task": "couse.tasks.course_task",
        ), # 每3S执行一次'options': {
            "queue": "work_queue"
        }
    }
}

在settings.py中加载配置

# 配置celery
from .celeryconfig import *
BROKER_BACKEND='redis'
BROKER_URL = 'redis://localhost:6379/1'
CELERY_RESULT_BACKEND = 'redis://localhost:6379/2'

启动worker

python manage.py celery worker -l INFO

运行定时任务beat

python manage.py celery beat -l INFO

在django中调用任务

immoc/views.py

from django.shortcuts import render

# Create your views here.
from course.tasks import CourseTask
from django.views.generic import View
from django.http import JsonResponse

class DoView(View):
    """注册"""

    def get(self, request):
        """对应get请求方式，提供注册页面"""
        # 执行任务
        print('start request')
        # res = CourseTask.delay()
        res = CourseTask.apply_async(args=('hello',),queue='work_queue')
        print(res)
        print('end request')
        return JsonResponse({'name':'zhang'})

配置路由

from django.conf.urls import include, url
from django.contrib import admin
from course.views import DoView

urlpatterns = [
    url(r'^admin/', include(admin.site.urls)),
    url(r'^do/$', DoView.as_view(),name='do'),
]

访问

http://127.0.0.1:8000/do/

worker输出结果

使用 django_celery_results 存取 celery 结果

安装

pip install django_celery_results

注册到django app中

INSTALLED_APPS = (
　　''''
    'django_celery_results'
　　''''
)

配置存放到django数据库中，存取的格式为 json （settings.py）

CELERY_TASK_SERIALIZER = 'json'
CELERY_RESULT_SERIALIZER = 'json'
CELERY_ACCEPT_CONTENT = ['json']
CELERY_TASK_ACKS_LATE = True
CELERY_RESULT_BACKEND = 'django-db'

　　注意 CELERY_RESULT_BACKEND 是celery 存放的结果，这里因为我是存取到django 的数据库中所以值为 django-db ，可以直接操作 django_celery_results_taskresult 进行查询，

要是选择存放在 redis 中的话，需要到 redis 中获取结果

生成数据表

python manage.py migrate

异步的任务结果会自动的存取到 django_celery_results_taskresult 表中

启动 worker 　

python manage.py celery worker -l INFO

可能会出现一下报错信息

    from .celeryconfig import *
  File "/home/python/Desktop/tiantianshengxian_onliyone/dailyfresh_13/dailyfresh_13/celeryconfig.py", line 8, in <module>
    from djcelery.management.commands import celery
  File "/home/python/.virtualenvs/django_py3/lib/python3.5/site-packages/djcelery/management/commands/celery.py", line 11, in <module>
    class Command(CeleryCommand):
  File "/home/python/.virtualenvs/django_py3/lib/python3.5/site-packages/djcelery/management/commands/celery.py", line 15, in Command
    base.get_options() +
TypeError: can only concatenate tuple (not "NoneType") to tuple

解决方法把 djcelery.management.commands.celery import Command 中的 options 注释掉即可

简单测试

from django_celery_results.models import TaskResult

tasks= course_task.delay()
tasks.task_id

result=TaskResult.objects.get(task_id=tasks.task_id)
result.status

监控工具 Flower 的使用

在 django中使用Flwor

安装

 pip install flower==0.9

启动worker

python manage.py celery worker -l INFO

运行flower

python manage.py celery flower

运行定时任务

python manage.py celery beat -l INFO

在浏览器输入

http://127.0.0.1:5555/

可以对任务实时监控　　

对登陆的用户进行basic_auth认证

python manage.py celery flower --bic_auth=name:zhangbiao

Supervisor部署celery

官方网站

http://supervisord.org/

supervisor是一个非常优秀的进程管理工具

安装

 pip3 install git+https://github.com/Supervisor/supervisor

新建一个目录conf 把 supervisor 配置文件重定向到conf目录下

mkdir conf
echo_supervisord_conf > conf/supervisord.conf

开启进程管理界面把conf/supervisord_conf中的22和23行的分号去掉

把下面的分号也去掉改为（把当前目录下的所有以.ini结尾的配置文件都包含进来）

在immoc下创建logs目录

mkdir logs

在conf下创建 supervisor_celery_worker.ini 的配置文件

[program:immoc-celery-worker]
command= python manage.py celery worker -l INFO
directory=/home/python/Desktop/immoc
environment=PATH='/home/python/.virtualenvs/django_py3/bin'
stdout_logfile=/home/python/Desktop/immoc/logs/celery.worker.log
stderr_logfile=/home/python/Desktop/immoc/logs/celery.worker.log
autostart=true
autorestart=true
startsecs=
stopwatises=
pripority=

启动 supervisor

supervisord -c conf/supervisord.conf

报错信息：
error: <class 'socket.error'>, [Errno 2] No such file or directory: file: <string> line: 1

解决办法：
这个可能有多种原因，可能是已经启动过了也可能是没权限，解决步骤如下：
　　1. 先要确认是否已经启动过了：’ps -ef | grep supervisord’
　　2. 如果有的话先kill掉
　　3. 运行下面命令：

sudo touch /var/run/supervisor.sock
sudo chmod 777 /var/run/supervisor.sock

　　4. 再尝试重新启动：

supervisord -c /etc/supervisord.conf(如果没有文件找个别人的配置拷贝过来或者运行echo_supervisord_conf > /conf/supervisord.conf)

在浏览器输入

http://127.0.0.1:9001

在config目录下创建supervisor_celery_beat.ini

[program:immoc-celery-beat]
command= python manage.py celery beat -l INFO
directory=/home/python/Desktop/immoc
environment=PATH='/home/python/.virtualenvs/django_py3/bin'
stdout_logfile=/home/python/Desktop/immoc/logs/celery.beat.log
stderr_logfile=/home/python/Desktop/immoc/logs/celery.beat.log
autostart=true
autorestart=true
startsecs=10
stopwatises=60
pripority=997

在终端输入把supervisor_celery_beat.ini 添加到supervisor进程组中

supervisorctl
update

查看状态有两个进程运行

添加flower进程

在conf下创建supervisor_celery_flower.ini

[program:immoc-celery-flower]
command= python manage.py celery flower
directory=/home/python/Desktop/immoc
environment=PATH='/home/python/.virtualenvs/django_py3/bin'
stdout_logfile=/home/python/Desktop/immoc/logs/celery.flower.log
stderr_logfile=/home/python/Desktop/immoc/logs/celery.flower.log
autostart=true
autorestart=true
startsecs=
stopwatises=
pripority=

在终端输入把supervisor_celery_flower.ini 添加到supervisor进程组中

updata
status

刷新页面

进入flwor查看

http://127.0.0.1:5555/

可以把uwsgi等进程配置在conf中进行管理