一.爬虫基本操作 有些网站和其他网站是有关系(链接),全球的网站就相当于一个蜘蛛网,我们放一只蜘蛛在上面爬,一定能够把网爬个遍.那么如果我们要爬取互联网上内容我们就相当于放一只蜘蛛在上面. 爬虫分为 定向爬虫:只爬这一类网站,有针对性(基本上做的都是定向的) 非定向爬虫:没有目的性,没有针对性,所有链接都爬取 爬虫:就是去某个URL获取指定的内容 发送http请求:http://www.baidu.com 基于正则表达式获取内容 Python实现:(爬取汽车之家的小实例,获取一个新闻的标题) i…