实战爬取某网站图片-Python

直接上代码

 1 #!/usr/bin/python

 2 # -*- coding: UTF-8 -*-

 3 from bs4 import BeautifulSoup

 4 import requests

 5 import sys

 6 import os

 7

 8 #获取图集id

 9 try:

10     headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36 Edg/92.0.902.55"}

11     html = requests.get('https://www.tujigu.com/', headers=headers)

12     html.encoding = 'utf-8-sig'

13     soup = BeautifulSoup(html.text,"html.parser").find_all('p',class_='biaoti')

14     dict = {}

15     for i in soup:

16         id_url = i.find('a')['href']

17         id = id_url[25:len(id_url)-1]

18         name_str = i.find('a').contents[0]

19         name = name_str.replace(" ", "")

20         dict.update({id:name})

21 except:

22     print("获取id和name失败")

23     sys.exit()

24

25

26 for id,name in dict.items():

27     #创建目录

28     path= r"C:\Users\ATRAY\Documents\Downloads\{}".format(name)

29     folder = os.path.exists(path)

30     if not folder:

31         os.makedirs(path)

32     else:

33         print ("创建目录失败")

34     #下载图片

35     num = 1

36     while True:

37         picture_url="https://tjg.gzhuibei.com/a/1/{}/{}.jpg".format(id,num)

38         picture=requests.get(picture_url,headers=headers)

39         if picture.status_code == 200:

40             with open(path + "\{}.jpg".format(num),"wb") as code:

41                 code.write(picture.content)

42             num = num + 1

43         else:

44             print("以下载{}写真{}张".format(name,num - 1))

45             break

实战爬取某网站图片-Python的更多相关文章

Java爬虫实践--爬取CSDN网站图片为例
实现的效果,自动在工程下创建Pictures文件夹,根据网站URL爬取图片,层层获取.在Pictures下以网站的层级URL命名文件夹,用来装该层URL下的图片.同时将文件名,路径,URL插入数据库, ...
python3 urllib爬取wallhalla网站图片
点我去我的github上看源码简单使用静态方法爬取https://wallhalla.com/网站的图片参考: https://blog.csdn.net/cquptcmj/article/det ...
实战爬取拷背漫画-Python
一.抓包获取链接以爬取<前科者>为例获取搜索链接 https://api.copymanga.com/api/v3/search/comic?limit=5&q=前科者 ...
scrapy入门实战-爬取代理网站
入门scrapy. 学习了有这几点 1.如何使用scrapy框架对网站进行爬虫: 2.如何对网页源代码使用xpath进行解析: 3.如何书写spider爬虫文件,对源代码进行解析: 4.学会使用scr ...
使用nodejs+http(s)+events+cheerio+iconv-lite爬取2717网站图片数据到本地文件夹
源代码如下: //(node:9240) Warning: Setting the NODE_TLS_REJECT_UNAUTHORIZED environment variable to '0' ...
python3爬取动态网站图片
思路: 1.图片放在<image>XXX</image>标签中 2.利用fiddler抓包获取存放图片信息的js文件url 3.利用requests库获取html内容,然后获取 ...
Scrapy 爬取某网站图片
1. 创建一个 Scrapy 项目,在命令行或者 Pycharm 的 Terminal 中输入: scrapy startproject imagepix 自动生成了下列文件: 2. 在 imagep ...
python爬取某个网站的图片并保存到本地
python爬取某个网站的图片并保存到本地 #coding:utf- import urllib import re import sys reload(sys) sys.setdefaultenco ...
初识python 之爬虫：爬取某网站的壁纸图片
用到的主要知识点:requests.get 获取网页HTMLetree.HTML 使用lxml解析器解析网页xpath 使用xpath获取网页标签信息.图片地址request.urlretrieve ...

随机推荐

Mysql 主键的操作
主键:primary key ,主要的键.一张表只能有一个字段可以使用对应的键,用来唯一的约束字段里面的数据,数据不能重复,这种键称之为主键,一张表只能最多有一个主键. 一.增加主键方法一:在 ...
powerpoint2013去掉图片背景，转存png
1.打开powerpoint,点击菜单栏的[插入],如图: 2.点击『图像』,如图: 3.上传图片,如图: 4.上传的图片不是png的,现在需要去掉白色背景,保存成png,选中图片,点击菜单栏的『格式 ...
Springboot：单元测试@FixMethodOrder注解指定测试方法的执行顺序
我们在写JUnit测试用例时,有时候需要按照定义顺序执行我们的单元测试方法,比如如在测试数据库相关的用例时候要按照测试插入.查询.删除的顺序测试.如果不按照这个顺序测试可能会出现问题,比如删除方法在前 ...
ABP Framework 为什么好上手，不好深入？探讨最佳学习姿势！
离写上一篇经验总结 ABP Framework 研习社经验总结(6.28-7.2) ,已经过去两周. ABP Framework 研习社(QQ群:726299208) 最近一周,又迎来了很多新伙伴,成 ...
单点登录(SSO)实现原理（转）
简介单点登录是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统的保护资源,若用户在某个应用系统中进行注销登录,所有的应用系统都不能再直接访问保护资源,像一些知名的大型网站,如:淘 ...
CQOI 2021 游记
CQOI 2021 游记 Stage -1 $\texttt{NOIP}$ 考的比较爆炸所以觉得自己没啥指望了. Stage 0
[刘阳Java]_ResourceBundleViewResolver视图解析器_第7讲
ResourceBundleViewResolver是根据proterties文件来找对应的视图来解析"逻辑视图".该properties文件默认是放在classpath路径下的v ...
前端开发入门到进阶第三集【Jsonp】
/* $.ajax({ type : "get", url : "${loginInfo.SSO_BASE_URL }/user/token/" + token ...
Lesson2 Thirteen equals one
Lesson2 Thirteen equals one equal ['i:kwəl] v. 等于 He equaled the world record. Nobody equals him i ...
Leetcode：530. 二叉搜索树的最小绝对差
Leetcode:530. 二叉搜索树的最小绝对差 Leetcode:530. 二叉搜索树的最小绝对差 Talk is cheap . Show me the code . /** * Definit ...

实战爬取某网站图片-Python

实战爬取某网站图片-Python的更多相关文章

随机推荐

热门专题