Scrapy 框架的介绍 Scrapy 是一个基于Twisted的异步处理框架,是纯Python实现的爬虫框架,其架构清晰模块之间的耦合成都低,可扩展性极强,可以灵活完成各种需求.我们只需要定制开发几个模块就可以轻松实现一个爬虫. 1. 架构介绍 它可以分为如下几个部分. Engine 引擎,处理整个系统的数据流处理,触发事务,是整个框架的核心. Item 项目,它定义了爬取结果的数据结构,爬取的数据会被赋值成该Item对象. Scheduler 调度器,接受引擎发过来的请求并将其加入队列中,…