Scrapy,Python开发的一个web抓取框架. 1,引言 Python即时网络爬虫启动的目标是一起把互联网变成大数据库.单纯的开放源代码并不是开源的全部,开源的核心是“开放的思想”,聚合最好的想法.技术.人员,所以将会参照众多领先产品,比如,Scrapy,ScrapingHub,Import.io等. 本文简单讲解一下Scrapy的架构.没错,通用提取器gsExtractor就是要集成到Scrapy架构中. 请注意,本文不想复述原文内容,而是为了开源Python爬虫的发展方向找参照,而且以