做为一个爬虫,最头疼的问题就是你的ip被封,想要在Scrapy领域无限制畅游,做好伪装是第一步,于是乎,抓取代理IP成了很多教程的开始部分.这里我说一下代理scrapy中代理ip,仅供大家借鉴! 代理ip使用分为下面几个步骤: 1.从网上抓取代理ip(网上很容易搜到很多免费的ip可以供大家使用) 2.验证ip的有效性(免费的ip并不都是那么好用的,所有要大家去验证是否可用socket) 3.存储ip(有很多方式存储,可以存在文本文档中,也可以存在数据库中,为了方便使用我一般都存在数据库当中) 4…