今天一个网友问爬虫知识,自己把许多小细节都忘了,很惭愧,所以这里写一下大概的步骤,主要是自己巩固一下知识,顺便复习一下.(scrapy框架有一个好处,就是可以爬取https的内容) [爬取的是杨子晚报,这里就以此为例,创建scrapy爬虫 网址:http://www.yangtse.com/] 第一步:安装scrapy框架 (这里不做详细介绍了,要是安装遇到问题的朋友们,可以参考下面链接 http://www.cnblogs.com/wj-1314/p/7856695.html) 第二步:创建s