用python简便地抓取刘昊然的写真（17行代码）

17行python代码抓取刘昊然图片之家的写真

用python来爬取网页信息是很简便的。因为它有很多库来帮助我们实现我们想要的功能。本实验用到的库有：requests和bs4中的BeautifulSoup。这两个库的安装过程如下：

#按住win+R，打开cmd，然后依次输入：

pip install bs4

pip install requests

在windows下爬取的话，还要检查自己是否安装了lxml。如果没安装，也可以直接用pip安装：

pip install lxml

安装好库之后呢，就可以开始爬取刘昊然的写真啦。

首先找到图片之家中刘昊然壁纸的网址：http://www.tupianzj.com/mingxing/xiezhen/liuhaoran/

由上面网址，我们可以翻译它的信息：http：//图片之家/明星/写真/刘昊然

所以，如果你要抓取其他的明星写真，只需要改变一下网址的最后一个就可以啦！
打开网址，右键，点击“检查”，然后你就可以看到这个网页的源代码啦。然后分析源代码，发现图片都存在下图的1中，而图片的存放格式都如下图的2、3那样：
找到规律后，我们就可以敲代码啦：

#导入库

from bs4 import BeautifulSoup

import requests

#给定网址

URL = "http://www.tupianzj.com/mingxing/xiezhen/liuhaoran/"

#抓取该URL的内容

html = requests.get(URL).text

#解析html，并存放在soup中

soup = BeautifulSoup(html, 'lxml')

#找到上面说的图中1的位置，因为图片都在它之中

img_ul = soup.find_all('div', {"id": "main"})

#创建img文件夹来存放抓取到的图片

import os

os.makedirs('./img/',exist_ok=True)

#由上图的2、3可知道图片的具体位置是在’img src‘中，所以先把所有的img找出来，再一一访问

imgs = ul.find_all('img')

#一一访问图片并下载

for img in imgs:

    url = img['src']

    r = requests.get(url, stream=True)

    image_name = url.split('/')[-1]

    with open('./img/%s' % image_name, 'wb') as f:

        for chunk in r.iter_content(chunk_size=128):#以128字节大小存放

            f.write(chunk)

    print('Saved %s' % image_name)

Saved 9-1P31G623590-L.jpg

Saved 9-1P3131419500-L.jpg

Saved 9-1P3031414430-L.jpg

Saved 9-1P3021543180-L.jpg

Saved 9-1P3021123440-L.jpg

Saved 9-1P22G043450-L.jpg

Saved 9-1P1291JR50-L.jpg

Saved 9-1P1221131480-L.jpg

Saved 9-1P1051036070-L.jpg

Saved 9-1P1051001240-L.jpg

Saved 9-1G219115I70-L.jpg

Saved 9-1G1151100100-L.jpg

Saved 9-1G0301436130-L.jpg

Saved 9-1G0041543170-L.png

Saved 9-1FZ91523210-L.png

Saved 9-1FHG13P60-L.png

Saved 9-1F5201911020-L.jpg

Saved 16-1612191430140-L.jpg

Saved 16-160P11A0460-L.jpg

Saved 9-16062G41001227.jpg

Saved 16-1605301305090-L.jpg

Saved 16-16051Q442070-L.jpg

Saved 16-16051Q416050-L.jpg

Saved 16-1605161012270-L.jpg

Saved 16-1604131Z0240-L.jpg

Saved 9-16012Q120410-L.jpg

Saved 9-151224200S00-L.jpg

至此，图片抓取完啦，打开img文件夹看看：

看，图片都下载到这啦。随便点开一张：

帅帅的刘昊然！

用python简便地抓取刘昊然的写真（17行代码）的更多相关文章

测试开发Python培训：抓取新浪微博抓取数据-技术篇
测试开发Python培训:抓取新浪微博抓取数据-技术篇 poptest是国内唯一一家培养测试开发工程师的培训机构,以学员能胜任自动化测试,性能测试,测试工具开发等工作为目标.在poptest的se ...
测试开发Python培训：抓取新浪微博评论提取目标数据-技术篇
测试开发Python培训:抓取新浪微博评论提取目标数据-技术篇在前面我分享了几个新浪微博的自动化脚本的实现,下面我们继续实现新的需求,功能需求如下: 1,登陆微博 2,抓取评论页内容3,用正则表 ...
如何利用Python网络爬虫抓取微信朋友圈的动态（上）
今天小编给大家分享一下如何利用Python网络爬虫抓取微信朋友圈的动态信息,实际上如果单独的去爬取朋友圈的话,难度会非常大,因为微信没有提供向网易云音乐这样的API接口,所以很容易找不到门.不过不要慌 ...
Python爬虫实战---抓取图书馆借阅信息
Python爬虫实战---抓取图书馆借阅信息原创作品,引用请表明出处:Python爬虫实战---抓取图书馆借阅信息前段时间在图书馆借了很多书,借得多了就容易忘记每本书的应还日期,老是担心自己会违约 ...
用python实现的抓取腾讯视频所有电影的爬虫
1. [代码]用python实现的抓取腾讯视频所有电影的爬虫 # -*- coding: utf-8 -*-# by awakenjoys. my site: www.dianying.atim ...
利用Python网络爬虫抓取微信好友的签名及其可视化展示
前几天给大家分享了如何利用Python词云和wordart可视化工具对朋友圈数据进行可视化,利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,以及利用Python网络爬虫抓取微信好友的所 ...
利用Python网络爬虫抓取微信好友的所在省位和城市分布及其可视化
前几天给大家分享了如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例,感兴趣的小伙伴可以点击链接进行查看.今天小编给大家介绍如何利用Python网络爬虫抓取微信好友的省位和城市,并且将 ...
如何利用Python网络爬虫抓取微信好友数量以及微信好友的男女比例
前几天给大家分享了利用Python网络爬虫抓取微信朋友圈的动态(上)和利用Python网络爬虫爬取微信朋友圈动态——附代码(下),并且对抓取到的数据进行了Python词云和wordart可视化,感兴趣 ...
Python爬虫实现抓取腾讯视频所有电影【实战必学】
2019-06-27 23:51:51 阅读数 407 收藏更多分类专栏: python爬虫前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问 ...

随机推荐

zend studio 10.6.2 字体大小设置
如果汉化的:窗体-->常规-->外观-->颜色和字体-->基本-->文字字体点击编辑如果未汉化:Window->Preferences->General ...
Cmake实现样例
多目录工程的CmakeLists.txt编写(自动添加多目录下的文件) http://www.cnblogs.com/chengxuyuancc/p/5347646.html 实现类似于vs中工程的C ...
【BZOJ】2018: [Usaco2009 Nov]农场技艺大赛（暴力）
http://www.lydsy.com/JudgeOnline/problem.php?id=2018 精度问题我也是醉了.. #include <cstdio> #include &l ...
HDU 5326(2015多校3)-Work(dfs)
题目地址:pid=5326">HDU 5326 题意:给一张有向图n个点.n - 1(....输入n-1)条边. A指向B代表A管理B.然后能够间接管理,比方A管理B,B管理C.则A管 ...
【R】均值假设检验
p_value<-function(cdf,x,parament=numeric(0),side=0) { n<-length(parament) p<-switch(n+1, cd ...
linux系统web项目运行环境搭建
允许本地访问端口:iptables -P OUTPUT ACCEPT MySQL数据库安装1.yum install mysql 2.yum install mysql-server 3.删除MySQ ...
mui 子页面切换父页面底部导航
在父页面中新增方法: function switchTab(tab){ plus.webview.hide(activeTab); activeTab= tab; plus.webview.show( ...
asscert断言的几种方法
一.什么是断言执行完测试用例后,最后一步是判断测试结果是通过还是失败,在自动化脚本中一般把这种生成测试结果的方法叫做断言它用来检查一个条件,如果它为真,则不做任何事,如果它为假,则会跑出Asser ...
java字符串、时间大小比较
package mytest; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util ...
深入理解 Java 垃圾回收机制(转)
一.垃圾回收机制的意义 Java语言中一个显著的特点就是引入了垃圾回收机制,使c++程序员最头疼的内存管理的问题迎刃而解,它使得Java程序员在编写程序的时候不再需要考虑内存管理.由于有个垃圾回收机制 ...

用python简便地抓取刘昊然的写真（17行代码）

17行python代码抓取刘昊然图片之家的写真

用python简便地抓取刘昊然的写真（17行代码）的更多相关文章

随机推荐

热门专题