初学爬虫,学习一下三方库的使用以及简单静态网页的分析.就跟着视频写了一个爬取豆瓣Top250排行榜的爬虫. 网页分析 我个人感觉写爬虫最重要的就是分析网页,找到网页的规律,找到自己需要内容所在的地方,细化到他在哪个div里面,在哪个class里面,在哪个a标签里面. 从上面的图中可以看出,有很多信息.包括电影名.英文名.简介.评价.评价人数.相关信息 当我们打开控制台,可以看到电影的链接.图片的链接. 可以看到电影名在一个span里面.概况在一个p标签里面.评价在一个div里面的一个span中等…