我们学习了从网页中爬取信息的方法,这只是爬虫最典型的一种应用,除此之外,下载文件也是实际应用中很常见的一种需求,例如使用爬虫爬取网站中的图片.视频.WORD文档.PDF文件.压缩包等. 1.FilesPipeline 和 ImagesPipeline Scrapy 框架内部提供了两个 Item Pipeline,专门用于下载文件和图片: (1)FilesPipeline (2)ImagesPipeline 我们将这两个 Item Pipeline 看做特殊的下载器,用户使用时只需要通过一个特殊字…