一、项目名称

抓取MM131美女写真图片，并将这些图片下载到本地指定文件夹。

共有6种类型的美女图片：

性感美女
清纯美眉
美女校花
性感车模
旗袍美女
明星写真

抓取后的效果图如下，每个图集是一个独立的文件夹：

二、项目目的

抓取美女写真图片，能有啥目的，纯粹是为了技术，顺便养养眼，不行吗？

另外，可以分析不同图片类型的图集数量、图片数量，以此来判断什么类型的图片最受欢迎。

三、项目要求

成功抓取到图片，并将图片进行重命名后保存到指定的文件夹，文件夹使用图集的名称
开始下载后，要有下载进度的提示，当前已下载图集数、剩余图集数、正在下载第几张图片，类似这样：

也可以增加一些其他功能，例如，请求多长时间获取不到结果时，该怎么办，这个我没写，留给大家自由发挥了
分析不同图片类型的图集数量、图片数量，以此来判断什么类型的图片最受欢迎，这个我没做，留给大家，前面会做了，这个就很简单了

四、步骤

声明一下，这个是我自己的思路，一定不是最好的，大家可以有更好的思路，欢迎交流。

步骤1：写一个函数，用于获取某一个图片类型每一页的页面链接，如清纯美眉，共31页，需要将每一页的页面链接拿到，

要拿到每一页的链接，需要知道链接的规则，以及一共有多少页，如下图标红处，如何知道某个图片类型共有多少页呢？

也就是怎么把 list_1_31.html 中的 31 拿到呢？

步骤2：写一个函数，用于获取某一个页面的全部图集链接，如清纯美眉第一页，拿到这个页面的所有的图集链接，

注意看每一个图集的链接，有什么统一的规则

步骤3：写一个函数，用于将某一图集的所有图片保存下来，如清纯美眉第一个第一个图集，把这个图集的所有图片都保存下来，

注意看每一个图集的图片链接，有什么规则

步骤4：开始执行以上的函数，验证是否得到想要的结果。

建议，仔细研究一下不同图片类型的页面链接、图集链接之间的相同点和不同点，然后构思写代码。不要一次性全部下载，在写每一个函数时，传入一个具体的链接进行测试，保证每个函数都满足要求后，再批量下载。

五、如何使用

Python3 版本
已安装程序需要的库，如 requests、BeautifulSoup、os、time

六、版权声明

图片版本由其官方网址持有，抓取图片仅供技术交流使用，切勿商用。

本项目来自GitHub，由于MM131换了域名，so我更新了一下

原文章：https://www.jianshu.com/p/e4a3bf1f95ab

项目地址：https://github.com/HuanGeNet/grab_beautiful_girls_pictures

【Python爬虫程序】抓取MM131美女图片，并将这些图片下载到本地指定文件夹。的更多相关文章

Python爬虫实战---抓取图书馆借阅信息
Python爬虫实战---抓取图书馆借阅信息原创作品,引用请表明出处:Python爬虫实战---抓取图书馆借阅信息前段时间在图书馆借了很多书,借得多了就容易忘记每本书的应还日期,老是担心自己会违约 ...
Python爬虫实现抓取腾讯视频所有电影【实战必学】
2019-06-27 23:51:51 阅读数 407 收藏更多分类专栏: python爬虫前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问 ...
【转】Python爬虫：抓取新浪新闻数据
案例一抓取对象: 新浪国内新闻(http://news.sina.com.cn/china/),该列表中的标题名称.时间.链接. 完整代码: from bs4 import BeautifulSou ...
Python爬虫：抓取新浪新闻数据
案例一抓取对象: 新浪国内新闻(http://news.sina.com.cn/china/),该列表中的标题名称.时间.链接. 完整代码: from bs4 import BeautifulSou ...
Python爬虫，抓取淘宝商品评论内容!
作为一个资深吃货,网购各种零食是很频繁的,但是能否在浩瀚的商品库中找到合适的东西,就只能参考评论了!今天给大家分享用python做个抓取淘宝商品评论的小爬虫! 思路我们就拿"德州扒鸡&qu ...
summernote图片上传功能保存到服务器指定文件夹+php代码+java方法
1.summernote富文本编辑器 summernote是一款基于bootstrap的富文本编辑器,是一款十分好用的文本编辑器,还附带有图片和文件上传功能. 那么在我们网站中想吧这个图片上传到服务器 ...
python爬虫数据抓取方法汇总
概要:利用python进行web数据抓取方法和实现. 1.python进行网页数据抓取有两种方式:一种是直接依据url链接来拼接使用get方法得到内容,一种是构建post请求改变对应参数来获得web返 ...
python爬虫批量抓取ip代理
使用爬虫抓取数据时,经常要用到多个ip代理,防止单个ip访问太过频繁被封禁.ip代理可以从这个网站获取:http://www.xicidaili.com/nn/.因此写一个python程序来获取ip代 ...
利用Nodejs & Cheerio & Request抓取Lofter美女图片
还是参考了这篇文章: http://cnodejs.org/topic/54bdaac4514ea9146862abee 另外有上面文章 nodejs抓取网易公开课的一些经验. 代码如下,注意其中用到 ...

随机推荐

nodemon:无法将“nodemon”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。
主要问题还是你的终端(也就是你的nodemon命令执行的地方没有这个环境) 解决方法:设置全局的nodemon,在终端执行 npm install -g nodemon
Django学习笔记3
From the last two parts, we know, by using the HttpResponse we can return text to the web page, and ...
JDBC——ResultSet结果集对象
ResultSet结果集对象,封装结果.它是怎么做到封装结果的呢? 游标,类似指针索引最初指在“列名”上,要取到数据就需要让游标向下移动移动后就指向了第一行数据,然后通过一些方法把第一行的每一列都取出 ...
3_time
3. Time and order What is order and why is it important? What do you mean "what is order"? ...
python中os.sep的作用以及sys._getframe().f_back.f_code.co_xxx的含义
https://blog.csdn.net/gufenchen/article/details/98338552
使用Python发送、订阅消息
使用Python发送.订阅消息使用插件 paho-mqtt 官方文档:http://shaocheng.li/post/blog/2017-05-23 Paho 是一个开源的 MQTT 客户端项目, ...
[P4550] 收集邮票 - 概率期望,dp
套路性地倒过来考虑,设\(f[i]\)表示拥有了\(i\)种票子时还需要多少次购买,\(g[i]\)表示还需要多少钱推\(g[i]\)递推式时注意把代价倒过来(反正总数一定,从顺序第\(1\)张开始 ...
C++学习书籍评价
1.C++程序设计-现代方法本书非常适合学习了C语言基础,想跨步到C++学习的同学,前20章都是C基础的回顾,简直不要太简单,后面的课后习题花了半个小时做完了,没怎么出错,嗯,我的C语言基础还是可以 ...
[AtCoder]Grand Contest 028
A Two Abbreviations 题意:给定两个串,长度为\(N\)的\(A\)和长度为\(M\)的\(B\),一个串\(S\)被称为好的,当且仅当:这个串的长度\(L\)能被\(N,M\)整除 ...
HTML 5的革新——语义化标签(一)
HTML 5的革新之一:语义化标签一节元素标签. 在HTML 5出来之前,我们用div来表示页面章节,但是这些div都没有实际意义.(即使我们用css样式的id和class形容这块内容的意义).这些标 ...

【Python爬虫程序】抓取MM131美女图片，并将这些图片下载到本地指定文件夹。