一次scrapy成功停止的信息

2017-11-05 18:52:42 [scrapy.core.engine] INFO: Closing spider (finished)
2017-11-05 18:52:42 [scrapy.statscollectors] INFO: Dumping Scrapy stats:
{'downloader/exception_count': 1,
'downloader/exception_type_count/twisted.internet.error.TCPTimedOutError': 1,
'downloader/request_bytes': 13663857,
'downloader/request_count': 41889,
'downloader/request_method_count/GET': 41889,
'downloader/response_bytes': 935922909,
'downloader/response_count': 41888,
'downloader/response_status_count/200': 41776,
'downloader/response_status_count/301': 25,
'downloader/response_status_count/404': 87,
'dupefilter/filtered': 5335,
'finish_reason': 'finished',
'finish_time': datetime.datetime(2017, 11, 5, 10, 52, 42, 779396),
'item_scraped_count': 41346,
'log_count/DEBUG': 83237,
'log_count/INFO': 49,
'request_depth_max': 1,
'response_received_count': 41533,
'retry/count': 1,
'retry/reason_count/twisted.internet.error.TCPTimedOutError': 1,
'scheduler/dequeued': 41886,
'scheduler/dequeued/disk': 41886,
'scheduler/enqueued': 41886,
'scheduler/enqueued/disk': 41886,
'start_time': datetime.datetime(2017, 11, 5, 10, 10, 13, 465263)}
2017-11-05 18:52:42 [scrapy.core.engine] INFO: Spider closed (finished)

一次scrapy成功停止的信息的更多相关文章

scrapy 知乎用户信息爬虫
zhihu_spider 此项目的功能是爬取知乎用户信息以及人际拓扑关系,爬虫框架使用scrapy,数据存储使用mongo,下载这些数据感觉也没什么用,就当为大家学习scrapy提供一个例子吧.代码地 ...
45.更新一下scrapy爬取工商信息爬虫代码
这里是完整的工商信息采集代码,不过此程序需要配合代理ip软件使用.问题:1.网站对ip之前没做限制,但是采集了一段时间就被检测到设置了反爬,每个ip只能访问十多次左右就被限制访问.2.网站对请求头的检 ...
Scrapy实践----获取天气信息
scrapy是一个非常好用的爬虫框架,它是基于Twisted开发的,Twisted又是一个异步网络框架,既然它是异步的,那么执行起来肯定会很快,所以scrapy的执行速度也不会慢的! 如果你还没没有学 ...
【bug】使用微信分享SDK，配置成功但分享信息异常
使用微信JSD做H5分享功能时,显示配置成功,但分享出去的信息并不是配置中的信息.(p.s. ios 分享后只有一个当前的链接,androd连分享的图标都没有), 最终找的的原因是:分享的链接中,参数 ...
scrapy爬取用户信息 ---崔志才
这个实例还是值得多次看的其流程图如下,还是有一点绕的. 总结: 1 Requst(rul=' xxx ',callback= ' '),仅仅发起某个网页的访问请求,没啥了.剩下的交给回调函数 2 ...
No module named scrapy 成功安装scrapy，却无法import的解决方法
今天本来准备写一个Python的爬虫,然而使用pip安装了Scrapy之后,却无论如何也无法import,显示的结果总是ImportError: No module named Scrapy.网上查阅 ...
网络爬虫之scrapy爬取某招聘网手机APP发布信息
1 引言过段时间要开始找新工作了,爬取一些岗位信息来分析一下吧.目前主流的招聘网站包括前程无忧.智联.BOSS直聘.拉勾等等.有段时间时间没爬取手机APP了,这次写一个爬虫爬取前程无忧手机APP岗位 ...
[jQuery] 通过ajax保存到服务器,成功显示信息.
保存数据到服务器,成功时显示信息. jQuery 代码: $.ajax({ type: "POST", url: "some.php", data: " ...
Python爬虫从入门到放弃（十七）之 Scrapy框架中Download Middleware用法
这篇文章中写了常用的下载中间件的用法和例子.Downloader Middleware处理的过程主要在调度器发送requests请求的时候以及网页将response结果返回给spiders的时候,所以 ...

随机推荐

SQLServer中sql for xml path 的用法
我们通常需要获取一个多行的某个字段拼出的字符串,我们可以使用for xml path进行处理:下面将介绍for xml path的具体用法: 创建测试表&插入测试数据在数据库中新增测试表 C ...
mv
mv命令是move的缩写,可以用来移动文件或者将文件改名,这也是个常用命令,经常用来备份文件或者目录. 1.命令格式: mv [选项] 源文件或目录目标文件或目录 2.命令功能: 视mv命令中第 ...
vs2017 Mariadb/mysql之旅
记录vs2017使用 ef6+mysql的开发填坑之旅.我的环境 vm+centos7+ docker-ce+mariadb+vs2017 总的原则是MySql.Data.Entity 要和 mys ...
docker 部署 flask（三）高级编写及生成镜像，安装requirements.txt
简介: 上一篇,我写了如何使用别人的docker基础镜像,生成我们的docker镜像. 也就最基本的flask,没有别的库(包)支持.连数据库支持都没有. 也就让大家了解一下怎么生成镜像而已. 本篇介 ...
初识数据库、初识MySQL
一.为什么要用数据库 # 1.将文件和程序存在一台机器上是很不合理的. # 2.操作文件是一件很麻烦的事. 所以就出现了一个新的概念 —— 数据库你可以理解为数据库是一个可以在一台机器上独立工作 ...
div 内图片垂直居中
vertical-align属性适用于 line-block: <div class="title"> <img src="img_p1_title.p ...
Python3虚拟环境安装:virtualenv、virtualenvwralpper
一:通过pip3(因python2和3共存,前文修改过pip3软连接,pip3可以安装到python3)安装virtualenv,pip3 install virtuale 二:建立虚拟环境文件目录 ...
win10下安装scala流程及问题
第一步:Java 设置检测方法前文已说明,这里不再描述. 如果还为安装,可以参考我们的Java 开发环境配置. 接下来,我们可以从 Scala 官网地址 http://www.scala-lang. ...
安装google 框架
使用 root exporer很方便 su cp /sdcard/google/busybox /data/local/tmp chmod 0755 /data/local/tmp/busybo ...
201621123001 《Java程序设计》第13周学习总结
1. 本周学习总结以你喜欢的方式(思维导图.OneNote或其他)归纳总结多网络相关内容. 通过IP地址和端口号可以进行建立Socket对象,然后进行通信使用Socket的一般步骤: 建立Sock ...

一次scrapy成功停止的信息

一次scrapy成功停止的信息的更多相关文章

随机推荐

热门专题