Spiders: 负责处理所有的response,从这里面分析提取数据,获取Item字段所需要的数据,并将需要跟进的URL提交给引擎,再次进入到Scheduler调度器中 Engine: 框架的核心,负责Spider.ItemPipeline.Downloader.Scheduler中间的通讯,信号.数据的传递等 Scheduler: 它负责接受引擎发送过来的requests请求,并按照一定的方式进行整理队列,当引擎需要的时候,交还给引擎 Downloader: 负责下载Engine发送过来的所…