最近在工作中写了很多 scrapy_redis 分布式爬虫,但是回想 scrapy 与 scrapy_redis 两者区别的时候,竟然,思维只是局限在了应用方面,于是乎,搜索了很多相关文章介绍,这才搞懂内部实现的原理. 首先我们从整体上来讲 scrapy是一个Python爬虫框架,爬取效率极高,具有高度定制性,但是不支持分布式.而scrapy-redis一套基于redis数据库.运行在scrapy框架之上的组件,可以让scrapy支持分布式策略,Slaver端共享Master端redis数据库里