python3爬取高清壁纸(2)

上次只是爬取一个专辑的图片，这次要爬取一整个页面的所有专辑的图片。

在上次的代码的基础上进行修改就行了，从专辑的索引页面开始，爬取该页面上所有的专辑的链接，再套用上次的代码就行了。

若要爬取多个页面只需在外围套上一个循环就可以了。

代码如下：

import requests

import re

from bs4 import BeautifulSoup

import os

#爬取的网站：http://www.win4000.com/wallpaper_detail_54520.html

def Get_image_url(url):

    #传入页面的URL，得到所有图片所在的标签和图册的名字，并返回

    Res = requests.get(url)

    Soup = BeautifulSoup(Res.text,'lxml')

    Name = Soup.select('h1')[0].string

    Tag = 'img[title=\"' + Name + '\"]'

    Image = Soup.select(Tag)

    return Image,Name

def Download_Image(Image_url):

    #传入图片的URL，将图片保存在本地

    Image = requests.get(Image_url,stream=True)

    #将链接的最后一个字符串最为图片的名字

    name = Image_url.split('/')[-1]

    #白村图片

    with open(name,'wb') as f:

        f.write(Image.content)

def Get_index_image(Url):

    Res = requests.get(Url)

    Reg = r'<a href="(.+?)" title=.+? target='

    Reg = re.compile(Reg)

    Image = re.findall(Reg,Res.text)

    Image = set(Image)

    Image = [i for i in Image if len(i) > 49]

    return Image

def main(url):

    #主调函数

    #url = "http://www.win4000.com/wallpaper_detail_54520.html"

    [Image,Name] = Get_image_url(url)

    #print(Name,Image)

    #保存当前目录

    path = os.getcwd()

    #创建保存图片的目录

    if (not os.path.exists(Name)):

        os.mkdir(Name)

        os.chdir(path + '/' + Name)

        for I in Image:

            Download_Image(I['src'])

        #返回之前的目录

        os.chdir(path)

        print(Name+'\n')

    else:

        print(Name + " 已经下载过了")

if __name__ == '__main__':

    Main_Url = "http://www.win4000.com/wallpaper_192_0_0_1.html"

    Url = Get_index_image(Main_Url)

    for u in Url:

        main(u)

    print("下载完成！")

python3爬取高清壁纸(2)的更多相关文章

python3爬取高清壁纸(1)
这次爬取的目标是:美桌网首页 > 桌面壁纸 > 卡通动漫类别下的壁纸. 我们先随机选取一个专辑来爬(http://www.win4000.com/wallpaper_detail_545 ...
Python 爬取高清桌面壁纸
今天写了一个脚本用来爬取ZOL桌面壁纸网站的高清图片: 链接:http://desk.zol.com.cn/1920x1080/ 本程序只爬了美女板块的图片,若要下载其他板块,只需修改程序中的&quo ...
python 爬取王者荣耀高清壁纸
代码地址如下:http://www.demodashi.com/demo/13104.html 一.前言打过王者的童鞋一般都会喜欢里边设计出来的英雄吧,特别想把王者荣耀的英雄的高清图片当成电脑桌面 ...
别人用钱，而我用python爬虫爬取了一年的4K高清壁纸
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取htt ...
Nginx+uWSGI+Python+Django构建必应高清壁纸站
写在前面做这个网站的初衷是因为,每次打开必应搜索搜东西的时候都会被上面的背景图片吸引,我想必应的壁纸应该是经过专业人员精选出来的,我甚至会翻看以前的历史图片,唯一美中不足的是必应的首页只能查看最多7 ...
python3爬取网页
爬虫 python3爬取网页资源方式(1.最简单: import'http://www.baidu.com/'print2.通过request import'http://www.baidu.com' ...
python3爬取女神图片，破解盗链问题
title: python3爬取女神图片,破解盗链问题 date: 2018-04-22 08:26:00 tags: [python3,美女,图片抓取,爬虫, 盗链] comments: true ...
Python3 爬取微信好友基本信息，并进行数据清洗
Python3 爬取微信好友基本信息,并进行数据清洗 1,登录获取好友基础信息: 好友的获取方法为get_friends,将会返回完整的好友列表. 其中每个好友为一个字典列表的第一项为本人的账号信息 ...
android 高清壁纸设置慢
由于项目的需要最近在解决一个 bug 在1080p 的手机上面设置壁纸会很慢慢,慢的原因是和壁纸的大小有关,壁纸越大,时间直越长,一般1080 p 的壁纸大概有10M左右, 所以通过文件流来保 ...

随机推荐

SSM开发健康信息管理系统
Spring+Spring MVC+MyBatis基于MVC架构的个人健康信息管理系统采用ssm框架,包含健康档案.健康预警(用户输入数据,系统根据范围自动判断给出不同颜色箭头显示). 健康分析. ...
连接数据库的工具JdbcUtil
public class JdbcUtil { private static String driver=null;//驱动 private static String url=null;//连接地址 ...
Flink架构，源码及debug
序工作中用Flink做批量和流式处理有段时间了,感觉只看Flink文档是对Flink ProgramRuntime的细节描述不是很多, 程序员还是看代码最简单和有效.所以想写点东西,记录一下,如果能 ...
暂停后保存sql server profiler的跟踪结果
Sass和Scss
Sass:https://www.sass.hk/ Sass是什么 Sass 是一款强化 CSS 的辅助工具,它在 CSS 语法的基础上增加了变量 (variables).嵌套 (nested rul ...
Goland 2019下载和安装（带破解补丁和汉化包）
Goland 简介 Goland 是由 JetBrains 公司开发的一个新的商业 IDE,旨在为 Go 开发者提供的一个符合人体工程学的新的商业 IDE.Goland 整合了 IntelliJ 平台 ...
Docker 镜像仓库为什么要分库分权限？
先说一个事故案例: 场景:某大型互联网电商公司,使用一个镜像仓库管理所有Docker镜像.开发者打出的镜像上传到唯一的镜像库,测试通过后,运维环境的 Kubernetes 直接从这个库里拉取镜像,所有 ...
mysql建立索引类型及索引建立的原则
索引类型:Unique(唯一索引,一般为主键),Normal(一般索引,普通字段,可做组合索引),索引方法:BTREE 1．选择唯一性索引唯一性索引的值是唯一的,可以更快速的通过该索引来确定某条记录 ...
react-绑定this并传参的三种方式
绑定this并传参的三种方式在事件中绑定this并传参: <input type="button" value="在事件中绑定this并传参" onCl ...
java读取解析application.yml
java读取解析application.yml 不用依赖spring容器,可单独使用. bug已修改... 第一步.首先要2个jar  ...

python3爬取高清壁纸(2)

python3爬取高清壁纸(2)的更多相关文章

随机推荐

热门专题