celery 调用scrapy

　　我的环境： celery 3.1.25 python 3.6.9 window10

celery tasks 代码如下，其中 QuotesSpider 是我的scrapy项目爬虫类名称

from celery_app import app

from scrapy.crawler import CrawlerProcess

from scrapy.utils.project import get_project_settings

from tutorial.spiders.quotes import QuotesSpider

def crawl_run():

    scope = 'all'

    process = CrawlerProcess(settings=get_project_settings())

    process.crawl(QuotesSpider, scope)

    process.start()

    process.join()

@app.task(queue='default')

def execute_task():

    return crawl_run()


后面发现这样写重复做定时任务的时候会报错，报reactor不能重启的问题，改成下面这样就解决了，这个类要放在和项目scrapy.cfg同级目录下

from crawler.tutorial.crawler.tutorial.spiders.quotes import QuotesSpider

from scrapy.utils.project import get_project_settings

import scrapy.crawler as crawler

from crochet import setup

setup()

import os

class Scraper():

    def crawl_run(self):

        spider = QuotesSpider()

        settings = get_project_settings()

        runner = crawler.CrawlerRunner(settings)

        runner.crawl(spider, 'all')

        runner.join()

if __name__ == '__main__':

    scraper = Scraper()

    scraper.crawl_run()

celery 调用scrapy的更多相关文章

解决django或者其他线程中调用scrapy报ReactorNotRestartable的错误
官网中关于ReactorNotRestartable的错误描述(摘自:https://twistedmatrix.com/documents/16.1.0/api/twisted.internet.e ...
SSH框架调用scrapy爬虫
毕设刚答辩完毕,不用担心查重了,所以补一篇毕设的内容. 毕设是图片搜索网站,使用python爬虫获取图片资源,再由javaweb管理使用图片的信息和图片,大部分实现起来十分简单,也不好意思炫耀.但是有 ...
Celery 和 Redis 入门
Celery 是一个广泛应用于网络应用程序的任务处理系统. 它可以在以下情况下使用: 在请求响应周期中做网络调用.服务器应当立即响应任何网络请求.如果在请求响应周期内需要进行网络调用,则应在周期外完成 ...
[Python爬虫] scrapy爬虫系列 <一>.安装及入门介绍
前面介绍了很多Selenium基于自动测试的Python爬虫程序,主要利用它的xpath语句,通过分析网页DOM树结构进行爬取内容,同时可以结合Phantomjs模拟浏览器进行鼠标或键盘操作.但是,更 ...
用Scrapy爬虫下载图片(豆瓣电影图片)
用Scrapy爬虫的安装和入门教程,这里有,这篇链接的博客也是我这篇博客的基础. 其实我完全可以直接在上面那篇博客中的代码中直接加入我要下载图片的部分代码的,但是由于上述博客中的代码已运行,已爬到快九 ...
Scrapy的shell命令（转）
scrapy python MrZONT 2015年08月29日发布 ...
python爬虫scrapy框架——人工识别登录知乎倒立文字验证码和数字英文验证码(2)
操作环境:python3 在上一文中python爬虫scrapy框架--人工识别知乎登录知乎倒立文字验证码和数字英文验证码(1)我们已经介绍了用Requests库来登录知乎,本文如果看不懂可以先看之前 ...
解读Scrapy框架
Scrapy框架基础:Twsited Scrapy内部基于事件循环的机制实现爬虫的并发.原来: url_list = ['http://www.baidu.com','http://www.baidu ...
scrapy相关通过设置 FEED_EXPORT_ENCODING 解决 unicode 中文写入json文件出现`\uXXXX`
0.问题现象爬取 item: 2017-10-16 18:17:33 [scrapy.core.scraper] DEBUG: Scraped from <200 https://www.hu ...

随机推荐

vue模板语法下集
1. 样式绑定 1.1 class绑定使用方式:v-bind:class="expression" expression的类型:字符串.数组.对象 1.2 style绑定 v-b ...
交换机配置——Cisco（思科）-交换机初始化配置
一.实验目的:完成一台交换机的初始化配置,并且可以用telnet登录二.拓扑图如下: 三.实验步骤 1.创建一台交换机(S1)和一台主机(PC1) 2.先给PC1主机设置IP地址: 3.S1配置: ...
CDQ分治学习思考
先挂上个大佬讲解,sunyutian1998学长给我推荐的mlystdcall大佬的[教程]简易CDQ分治教程&学习笔记还有个B站小姐姐讲解的概念https://www.bilibili.c ...
2019暑假集训 windy数
题目描述 Windy 定义了一种 Windy 数:不含前导零且相邻两个数字之差至少为2的正整数被称为 Windy 数. Windy 想知道,在A和B之间,包括A和B,总共有多少个 Windy 数? 输 ...
使用matplotlib绘制常用图表(2)-常用图标设置
一.使用subplots绘制子图 import numpy as np from matplotlib import pyplot as plt %matplotlib inline x = np.a ...
动态DP教程
目录前言开始更进一步前言最后一届NOIPTG的day2T3对于动态DP的普及起到了巨大的作用.然而我到现在还不会开始 SP1716 GSS3 - Can you answer these ...
费马小定理证明（copy的，自己捋清楚）
费马小定理:假如p是质数,且gcd(a,p)=1,那么 a^(p-1)≡1(mod p) 证明(copy的百度百科,加点自己的解释) 引理1．若a,b,c为任意3个整数,m为正整数,且(m,c)=1 ...
[CSP-S模拟测试]:二叉搜索树（DP+贪心）
题目传送门(内部题99) 输入格式第一行一个整数$n$,第二行$n$个整数$x_1\sim x_n$. 输出格式一行一个整数表示答案. 样例样例输入: 58 2 1 4 3 样例输出: 数据范围 ...
MERGE INTO 解决大数据量复杂操作更新慢的问题
现我系统中有一条复杂SQL,由于业务复杂需要关联人员的工作离职三个表,并进行分支判断,再计算人员的字段信息,由于人员多,分支多,计算复杂等原因,一次执行需要5min,容易卡死,现在使用MERGE IN ...
PHP 封装POD 类
使用POD的过程 //1.造DSN:驱动名:dbname=数据库名;host=服务器地址 $dsn = "mysql:dbname=mydb;host=localhost"; // ...

celery 调用scrapy

celery 调用scrapy的更多相关文章

随机推荐

热门专题