Python 爬虫：煎蛋网妹子图

使用 Headless Chrome 替代了 PhatomJS。

图片保存到指定文件夹中。

 import requests

 from bs4 import BeautifulSoup

 from selenium import webdriver

 from selenium.webdriver.chrome.options import Options

 chrome_options = Options()

 chrome_options.add_argument('--headless')

 chrome_options.add_argument('--disable-gpu')

 driver = webdriver.Chrome(chrome_options=chrome_options)

 dir = 'C:/spider-download/jandan-girls/'

 img_urls = []

 page_urls = ["http://jandan.net/ooxx/page-{}#comments".format(str(i)) for i in range(5, 6)]

 def GetImgUrl(u):

     driver.get(u)

     html = driver.page_source

     soup = BeautifulSoup(html, 'lxml')

     images = soup.select('a.view_img_link')

     for i in images:

         t = i.get('href')

         if str('gif') in str(t):

             pass

         else:

             img_url = 'http:' + t

             img_urls.append(img_url)

 def DownloadImg():

     n = 1

     for i in img_urls:

         print('第 ' + str(n) + ' 张 ... ', end='')

         with open(dir + i[-20:], 'wb') as f:

             f.write(requests.get(i).content)

         print('OK!')

         n = n + 1

 for u in page_urls:

     GetImgUrl(u)

 print('*** 开始下载 ***')

 DownloadImg()

 print('*** 下载完成 ***')

Python 爬虫：煎蛋网妹子图的更多相关文章

python3爬虫.4.下载煎蛋网妹子图
开始我学习爬虫的目标 ----> 煎蛋网通过设置User-Agent获取网页,发现本该是图片链接的地方被一个js函数代替了于是全局搜索到该函数 function jandan_load_im ...
[Python爬虫]煎蛋网OOXX妹子图爬虫（1）——解密图片地址
之前在鱼C论坛的时候,看到很多人都在用Python写爬虫爬煎蛋网的妹子图,当时我也写过,爬了很多的妹子图片.后来煎蛋网把妹子图的网页改进了,对图片的地址进行了加密,所以论坛里面的人经常有人问怎么请求的 ...
项目: python爬虫福利煎蛋网妹子图
嘿嘿嘿! 嘿嘿嘿! 福利一波, 之前看小甲鱼的python教学视频的时候, 看到上面教的爬虫, 爬美女图片的, 心很痒痒, 但是不知道为啥, 按照视频一个字一个字敲的代码,总是报错, 有一天花了一下 ...
python 爬虫煎蛋网
import urllib.request import os from urllib import error import re import base64 def url_open(url): ...
python3爬虫爬取煎蛋网妹纸图片（上篇）
其实之前实现过这个功能,是使用selenium模拟浏览器页面点击来完成的,但是效率实际上相对来说较低.本次以解密参数来完成爬取的过程. 首先打开煎蛋网http://jandan.net/ooxx,查看 ...
手把手教你用Python爬虫煎蛋妹纸海量图片
我们的目标是用爬虫来干一件略污事情最近听说煎蛋上有好多可爱的妹子,而且爬虫从妹子图抓起练手最好,毕竟动力大嘛.而且现在网络上的妹子很黄很暴力,一下接受太多容易营养不量,但是本着有人身体就比较好的套路 ...
python3爬虫爬取煎蛋网妹纸图片（下篇）2018.6.25有效
分析完了真实图片链接地址,下面要做的就是写代码去实现了.想直接看源代码的可以点击这里大致思路是:获取一个页面的的html---->使用正则表达式提取出图片hash值并进行base64解码--- ...
Python Scrapy 爬取煎蛋网妹子图实例（一）
前面介绍了爬虫框架的一个实例,那个比较简单,这里在介绍一个实例爬取煎蛋网妹子图,遗憾的是上周煎蛋网还有妹子图了,但是这周妹子图变成了随手拍, 不过没关系,我们爬图的目的是为了加强实战应用,管 ...
Python爬虫入门教程 18-100 煎蛋网XXOO图片抓取
写在前面很高兴我这系列的文章写道第18篇了,今天写一个爬虫爱好者特别喜欢的网站煎蛋网http://jandan.net/ooxx,这个网站其实还是有点意思的,网站很多人写了N多的教程了,各种方式的都 ...

随机推荐

Android 开发中,as或者idea对gradle的使用
原文:Android 开发中,as或者idea对gradle的使用本文属于转载收藏,侵删,出处:私人博客 ---------------------------------------------- ...
Android进程间通信-AIDL实现原理
Android进程间通信基于Proxy(代理)与Stub(桩或存根)的设计模式(如图1-1所示).其中,Proxy将特殊性接口转换成通用性接口,Stub将通用性接口转换成特殊性接口,二者之间的数据转换 ...
Google C++测试框架系列入门篇：第二章开始一个新项目
上一篇:Google C++测试框架系列入门篇:第一章介绍:为什么使用GTest? 原始链接:Setting up a New Test Project 词汇表版本号:v_0.1 开始一个新项目 ...
【转载】Chrome使用自定义协议打开本地程序并运行IE打开网页
部分内容转载自: http://blog.sina.com.cn/s/blog_e2b8213a0102wqby.html 项目中遇到某需求:chorme要运行IE并打开网页.解决方案之一就是通过自定 ...
abp(net core)+easyui+efcore仓储系统——创建应用服务（五）
abp(net core)+easyui+efcore仓储系统目录 abp(net core)+easyui+efcore仓储系统——ABP总体介绍(一) abp(net core)+easyui+e ...
webstrom sass 关于arguments 和 Output paths to refresh 设置
第一种设置: Arguments:--no-cache --update -t expanded $FileName$:$FileNameWithoutExtension$.css Output pa ...
论文研读Unet++
Unet++: A Nested U-Net Architecture for Medical Image Segmentation Unet++ 论文地址这里仅进行简要介绍,可供读者熟悉其结构与特 ...
如何为linux服务器配置DNS解析?
本文建立在已经搭建好DNS服务器时,为linux机器配置DNS服务器的三种方式. IP地址是网络上标识站点的数字地址,为了方便记忆,采用域名来代替IP地址标识站点地址.DNS(域名解析)就是域名到IP ...
Django迁移数据库报错
Django迁移数据库报错 table "xxx" already exists错误 django在migrate时报错django migrate error: table 'x ...
kuberbetes基础概念
部署了一大堆,来了解一下K8S一些基本的概念. 1.Node Node作为集群中的工作节点,运行真正的应用程序,在Node上Kubernetes管理的最小运行单元是Pod.Node上运行着Kubern ...

Python 爬虫：煎蛋网妹子图

Python 爬虫：煎蛋网妹子图的更多相关文章

随机推荐

热门专题