Scrapy概念图 这里有很多py文件,分别与Scrapy的各个模块对应 superspider是一个爬虫项目 spider1.py则是一个创建好的爬虫文件,爬取资源返回url和数据 items.py可以在里面预先定义要爬取的字段,并导入到其他模块,在爬虫解析页面时仅能使用已定义的这些字段 middlewares.py里面可以编写有关爬虫中间件和下载中间件的内容 pipelines.py则是提取数据的一个部分,编写有关数据处理的代码,接受由spider传过来的数据 settings.py里面是一…