scrapyd使用教程

1. 安装服务器：

pip install scrapyd

启动： scrapyd

访问：127.0.0.1:6800

2. 安装客户端

pip install scrapyd-client

3. 进入爬虫项目根目录：找到

scrapy.cfg 文件修改如下

[settings]

default = blog.settings

[deploy:zwb]

url = http://localhost:6800/

project = blog

4. 发布项目

scrapyd-deploy target -p prject

这里target 为你的服务器命令，prject是你项目的名字，发布项目之前我们的scrapyd.cfg必须修改，上面我们已经修改过了，

因此我的命令是：scrapyd-deploy zwb -p blog

scrapyd-deploy <target> -p <project> --version <version>

4.2 启动爬虫

curl http://localhost:6800/schedule.json -d project=blog -d spider=demo

4.3 停止爬虫

curl http://localhost:6800/cancel.json -d project=blog -d job=demo

blog：你爬虫项目的名字，demo：你爬虫的名字

参考文档：https://www.jianshu.com/p/f0077adb74bb

https://www.jianshu.com/p/f815f91949f2

scrapyd使用教程的更多相关文章

scrapyd和scrapyd-client使用教程
原文地址:http://blog.wiseturtles.com/posts/scrapyd.html Tags scrapyd scrapy scrapyd-client By crazygit O ...
Scrapy 爬虫使用指南完全教程
scrapy note command 全局命令: startproject :在 project_name 文件夹下创建一个名为 project_name 的Scrapy项目. scrapy sta ...
第三百七十二节，Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目
第三百七十二节,Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目 scrapyd模块是专门用于部署scrapy项目的,可以部署和管理scrapy项目下载地址:h ...
Scrapyd发布爬虫的工具
Scrapyd Scrapyd是部署和运行Scrapy.spider的应用程序.它使您能够使用JSON API部署(上传)您的项目并控制其spider. Scrapyd-client Scrapyd- ...
基于scrapyd爬虫发布总结
一.版本情况 python以丰富的三方类库取得了众多程序员的认可,但也因此带来了众多的类库版本问题,本文总结的内容是基于最新的类库版本. 1.scrapy版本:1.1.0 D:\python\Spid ...
五十一 Python分布式爬虫打造搜索引擎Scrapy精讲—scrapyd部署scrapy项目
scrapyd模块是专门用于部署scrapy项目的,可以部署和管理scrapy项目下载地址:https://github.com/scrapy/scrapyd 建议安装 pip3 install s ...
手把手教你如何利用 HeroKu 免费获取一个 Scrapyd 集群
手把手教你如何利用 HeroKu 免费获取一个 Scrapyd 集群本文原始地址:https://sitoi.cn/posts/48724.html 准备环境一个 GitHub 的账号一个 He ...
Scrapy 教程(二)-操作流程
scrapy 是个爬虫框架,是由python编写的,用法类似 django 框架. 创建工程在开始爬虫之前,先创建工程 scrapy startproject projectname 目录结构如下图 ...
【python3】基于scrapyd + scrapydweb 的可视化部署
一.部署组件概览该部署方式适用于 scrapy项目.scrapy-redis的分布式爬虫项目需要安装的组件有: 1.scrapyd 服务端 [运行打包后的爬虫代码](所有的爬虫机器都要安 ...

随机推荐

Centos7 yum install chrome
一.配置 yun 源 vim /etc/yum.repos.d/google-chrome.repo [google-chrome] name=google-chrome baseurl=http:/ ...
koa 基础（七）错误处理中间件
1.错误处理中间件 app.js /** * 错误处理中间件 */ // 引入模块 const Koa = require('koa'); const router = require('koa-ro ...
搭建Java服务器，并且实现远程安全访问linux系统
1.通过ssh实现安全远程访问linux系统 ssh :secure shell 加密: 1. 对称加密 (加密密钥与解密密钥相同) des ...
dpkg软件包管理
要想得心应手管理Ubuntu软件包,就必须熟悉其中最重要的软件包管理程序dpkg工具是Ubuntu软件包管理工具的基础.使用dpkg工具可以实现软件包的安装.卸载.查询.编译.打包等功能. dpkg( ...
javascript字符串转数字
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
mysql知识点汇集
1.将两个表字段类型一致的数据合并到一个新表的命令. INSERT into new_table(user_name,password,age) SELECT user_name,password,a ...
JavaScript中的bind,call和apply函数的用法和区别
一直没怎么使用过JavaScript中的bind,call和apply, 今天看到一篇比较好的文章,觉得讲的比较透彻,所以记录和总结如下首先要理解的第一个概念,JavaScript中函数调用的方式, ...
接入上一篇SSM框架整合示例
需要创建相应的包与文件夹 Book数据表作为本示例数据搭建项目开始首先有bean后 private int id; private String name; private int cnt; 第一 ...
"并发用户数量"的正确英文表示
并发用户数量the number of concurrent users 最佳并发用户数量the optimum number of concurrent users 最大并发用户数量 the max ...
react和vue配置本地代理
React 在react中配置开发环境下的本地代理相对比较简单,直接在package.json文件中修改即可. 但是这样做有其局限性,如果开发中代理多个接口的时候将无法满足需求,我们需要的是下面这种的 ...

scrapyd使用教程

scrapyd使用教程的更多相关文章

随机推荐

热门专题