python爬虫,顾名思义是爬取信息的.大数据时代,信息的获取是非常关键的,它甚至能决定一个公司大发展的方向与未来,互联网就好像一张大网,人们想要获取信息就要从这张大网里爬取,这种手段也可以称为搜索引擎,百度搜狗等属于广义爬虫,姑且这么叫吧,广义爬虫可以在各大网站的允许范围内进行限制性的信息获取,但是这种广义爬虫远远不能满足信息的获取要求,并不能按照人们的意愿来搜索,于是自定义的爬虫应运而生,姑且叫做狭义爬虫,它突破了网站的robots协议规定,即不遵守限制性获取网站的信息获取,可以任意的进行信…