1. 使用excel(简单使用) 数据- 自网站-导入 2.you-get python爬虫入门 1.环境配置 python,request,lxml 2.原理 爬虫的框架如下: 1.挑选种子URL:2.将这些URL放入待抓取的URL队列:3.取出待抓取的URL,下载并存储进已下载网页库中.此外,将这些URL放入待抓取URL队列,进入下一循环:4.分析已抓取队列中的URL,并且将URL放入待抓取URL队列,从而进入下一循环. 爬虫的基本流程: 简单的说,我们向服务器发送请求后,会得到返回的页面,…