使用工具：

Python 3.6

pycharm

主要内容：

1、系统分析目标网页

2、html标签数据解析方法（xpath）

3、海量图片数据一键保存

爬虫的一般思路：

1、确定爬取的url路径，headers参数

2、发送请求 -- requests 模拟浏览器发送请求，获取响应数据

3、析数据 -- parsel 转化为Selector对象，Selector对象具有xpath的方法，能够对转化的数据进行处理

4、保存数据

代码如下：

import requests

import parsel

# 1、确定爬取的url路径，headers参数

base_url = 'https://www.umei.cc/meinvtupian/meinvxiezhen/'

headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.122 Safari/537.36'}

# 2、发送请求 -- requests 模拟浏览器发送请求，获取响应数据

response = requests.get(base_url, headers=headers)

response.encoding = response.apparent_encoding  # 自动识别响应对象的编码

html = response.text

# print(html)

# 3、解析数据 -- parsel  转化为Selector对象，Selector对象具有xpath的方法，能够对转化的数据进行处理

# 3、1 转换数据类型

parse = parsel.Selector(html)

# 3、2 解析数据

href_list = parse.xpath('//div[@class="TypeList"]/ul/li/a/@href').extract()

# print(href_list)

for href in href_list:

    # print(href)

    # 再次发送图片请求

    href_data = requests.get(href, headers=headers).text

    # 解析图片数据

    img = parsel.Selector(href_data)

    img_src = img.xpath('//div[@class="ImageBody"]/p/a/img/@src').extract_first()

    # print(img_src)

    # 发送图片的url

    img_data = requests.get(img_src, headers=headers).content

    # 4、保存数据

    # 1、准备文件名

    file_name = img_src.split('/')[-1]

    # print(file_name)

    # 3、保存文件

    with open('img\\' + file_name, 'wb') as f:

        print('正在保存文件：{}'.format(file_name))

        f.write(img_data)

效果如下：

如果你处于想学Python或者正在学习Python，Python的教程不少了吧，但是是最新的吗？说不定你学了可能是两年前人家就学过的内容，在这小编分享一波2020最新的Python教程。获取方式，私信小编 “ 资料 ”，即可免费获取哦！

python爬取优美图库海量图片，附加代码，一键爬取的更多相关文章

scrapy关键字爬取百度图库（一）
刚入门学习python的菜鸟,如有错误,还望指教爬取百度图库需要知道百度图库的加载方式是通过下拉加载的,所以我们需要分析Ajax请求来爬取每一页的数据信息表述不清直接上图片图片一是刷新页面后加载 ...
python爬爬爬之单网页html页面爬取
python爬爬爬之单网页html页面爬取作者:vpoet mail:vpoet_sir@163.com 注:随意copy 不用告诉我 #coding:utf-8 import urllib2 Re ...
Python爬虫入门教程 2-100 妹子图网站爬取
妹子图网站爬取---前言从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写爬图片这一件事情.希望可以做好. 为了写好爬虫,我们 ...
python爬虫实战（六）--------新浪微博（爬取微博帐号所发内容，不爬取历史内容）
相关代码已经修改调试成功----2017-4-13 详情代码请移步我的github:https://github.com/pujinxiao/sina_spider 一.说明 1.目标网址:新浪微博 ...
python网络爬虫之解析网页的BeautifulSoup(爬取电影图片)[三]
目录前言一.BeautifulSoup的基本语法二.爬取网页图片扩展学习后记前言本章同样是解析一个网页的结构信息在上章内容中(python网络爬虫之解析网页的正则表达式(爬取4k动漫图 ...
Java爬虫一键爬取结果并保存为Excel
Java爬虫一键爬取结果并保存为Excel 将爬取结果保存为一个Excel表格官方没有给出导出Excel 的教程这里我就发一个导出为Excel的教程导包因为个人爱好我喜欢用Gradle所以这 ...
Python post请求模拟登录淘宝并爬取商品列表
一.前言大概是一个月前就开始做淘宝的爬虫了,从最开始的用selenium用户配置到selenium模拟登录,再到这次的post请求模拟登录.一共是三篇博客,记录了我爬取淘宝网的经历.期间也有朋友向我 ...
（转）Python网络爬虫实战：世纪佳缘爬取近6万条数据
又是一年双十一了,不知道从什么时候开始,双十一从“光棍节”变成了“双十一购物狂欢节”,最后一个属于单身狗的节日也成功被攻陷,成为了情侣们送礼物秀恩爱的节日. 翻着安静到死寂的聊天列表,我忽然惊醒,不行 ...
python 分别用python2和python3伪装浏览器爬取网页内容
python网页抓取功能非常强大,使用urllib或者urllib2可以很轻松的抓取网页内容.但是很多时候我们要注意,可能很多网站都设置了防采集功能,不是那么轻松就能抓取到想要的内容. 今天我来分享下 ...

随机推荐

PyTorch1.2.0版本来啦！居然还有全套视频！让你快速熟练掌握深度学习框架！
[翻到文末, 还能让你看尽CV和NLP完整技术路径以及前沿+经典论文篇目,助你构建深度学习知识框架] 今年8月!PyTorch 1.2.0 版本来啦!! 据我们了解,在学术领域,特别是CV/NLP方向 ...
mavlink协议移植问题
mavlink协议移植问题 mavlink源代码是一个代码库,使用的时候只需要将mavlink.h头文件包含到工程项目中即可. mavlink通信协议是无状态的连接,一般采用心跳消息跟踪系统是否存在. ...
Cplex教育版申请
任何人:直接在公众号"毒书彼记" ,“资源下载” 板块下载: 如果你的学校没有购买cplex软件没那么,你就不可以下载教育版的cplex软件,如过下载免费板,它的功能会有一些限制 ...
Scala环境及IDEA配置
Scala环境及IDEA配置 1 语言介绍他已经出生15年了,就像明星一样,谁都不可能一开始就人气爆棚粉丝无数,得慢慢混. 成功原因:完全兼容java代码. 身世介绍 Scala在2004年正式问世 ...
Git版本控制 Git、github,gitlab相关操作
目录关于版本控制版本管理工具集中式管理分布式管理 git版本管理 git介绍软件安装 Git工作状态原理流程步骤 git基本操作对文件进行修改分支共享仓库创建共享仓库: 共享仓库上 ...
Azure安装win2016的服务器，并下载安装mysql数据库心得
随便写写第一部分:新建虚拟机创建win2016服务器这部分内容跟着微软云提示操作即可, 基本步骤:创建一堆名字,选择一个地区的服务器,配置一些基本信息,然后azure就会自动创建虚拟机并安装你选择 ...
Scala学习系列（一）——Scala为什么是大数据第一高薪语言
为什么是Scala 虽然在大数据领域Java的使用更普及,Python也有后来居上的势头,但Scala一直有着不可动摇的地位.我们熟悉的Spark,Kafka,Flink都是由Scala完成了其核心代 ...
MySQL 解析 json 数组（mysql在5.7开始支持json解析）
1.函数 JSON_EXTRACT 表数据格式: 查询结果: sql 语句: -- ---------------------------- -- Table structure for json ...
PTA数据结构与算法题目集(中文) 7-42整型关键字的散列映射 (25 分)
PTA数据结构与算法题目集(中文) 7-42整型关键字的散列映射 (25 分) 7-42 整型关键字的散列映射 (25 分) 给定一系列整型关键字和素数P,用除留余数法定义的散列函数将关键字映射 ...
安装elasticsearch-head（源码安装方式）
gitHub 地址 https://github.com/mobz/elasticsearch-head 克隆到本地进行npm 安装运行 git clone git://github.com/mob ...

python爬取优美图库海量图片，附加代码，一键爬取