项目: python爬虫福利煎蛋网妹子图

嘿嘿嘿! 嘿嘿嘿! 福利一波, 之前看小甲鱼的python教学视频的时候, 看到上面教的爬虫, 爬美女图片的, 心很痒痒, 但是不知道为啥, 按照视频一个字一个字敲的代码,总是报错, 有一天花了一下午的时间, 一个字母一个字母对过去, 发现没有错, 就是爬不下来- -. 后来在交流群里问大神, 大神们,说代码时间太久不能用了, 然后就放弃了, 后来一段时间后又捡起来了. 在这首先感谢我们组组长的指点, 同时还得感谢崔庆才大佬的教程.

老版本的源代码就不发了, 之所以不能爬, 是因为出现在网页渲染的问题,导致,F12 的检查元素看的代码, 和网页源代码有点区别. 在下面的代码里. 用到了 selenium 的一个第三方的包, 关于这个包的安装,和教程,可以去看 https://www.cnblogs.com/BigFishFly/p/6380024.html 这个博客,崔庆才的教程写的还好,如果不懂,可以来找我, 我有视频哈哈哈.

好了不多说了, 福利来了- - 准备来波图片的- - 但是太刺激了 - - 哈哈哈鼻血直流!!!

 from selenium import webdriver

 import urllib.request

 import os

 os.mkdir('0o')

 os.chdir('0o')

 url = 'http://jandan.net/ooxx'

 true = True

 i =

 while true:

     driver = webdriver.Chrome()

     driver.get(url)

     html = driver.page_source

     html = str(html)

     a = html.find('img src="')

     b = html.find('.jpg', a, a + )

     img_dizhi = []

     while a != -:

         if b != -:

             b = html.find('.jpg', a, a + )

             img_dizhi.append(html[a + :b + ])

         else:

             b = a +

         a = html.find('img src=', b)

     for each in img_dizhi:

         if each == '':

             continue

         filename = each.split('/')[-]

         response = urllib.request.urlopen(each)

         mm_img = response.read()

         with open(filename, 'wb') as f:

             f.write(mm_img)

     page =

     page -= i

     page = str(page)

     url = 'http://jandan.net/ooxx/page-' + page + '#comments'

     i -=

     driver.close()

     if i == :

         true =False

项目: python爬虫福利煎蛋网妹子图的更多相关文章

Python 爬虫：煎蛋网妹子图
使用 Headless Chrome 替代了 PhatomJS. 图片保存到指定文件夹中. import requests from bs4 import BeautifulSoup from sel ...
python3爬虫.4.下载煎蛋网妹子图
开始我学习爬虫的目标 ----> 煎蛋网通过设置User-Agent获取网页,发现本该是图片链接的地方被一个js函数代替了于是全局搜索到该函数 function jandan_load_im ...
python学习笔记（12）--爬虫下载煎蛋网图片
说明: 1. 这个其实是在下载漫画之前写的,比那个稍微简单点,之前忘放到博客备份了. 2. 不想说啥了,总结放到漫画那个里面吧! import urllib.request import re imp ...
python3爬虫爬取煎蛋网妹纸图片（上篇）
其实之前实现过这个功能,是使用selenium模拟浏览器页面点击来完成的,但是效率实际上相对来说较低.本次以解密参数来完成爬取的过程. 首先打开煎蛋网http://jandan.net/ooxx,查看 ...
python3爬虫爬取煎蛋网妹纸图片（下篇）2018.6.25有效
分析完了真实图片链接地址,下面要做的就是写代码去实现了.想直接看源代码的可以点击这里大致思路是:获取一个页面的的html---->使用正则表达式提取出图片hash值并进行base64解码--- ...
Python 爬虫入门(二)——爬取妹子图
Python 爬虫入门听说你写代码没动力?本文就给你动力,爬取妹子图.如果这也没动力那就没救了. GitHub 地址: https://github.com/injetlee/Python/blob ...
Python 爬虫入门之爬取妹子图
Python 爬虫入门之爬取妹子图来源:李英杰链接: https://segmentfault.com/a/1190000015798452 听说你写代码没动力?本文就给你动力,爬取妹子图.如果 ...
Python 爬取煎蛋网妹子图片
#!/usr/bin/env python # -*- coding: utf-8 -*- # @Date : 2017-08-24 10:17:28 # @Author : EnderZhou (z ...
python爬取煎蛋网图片
``` py2版本: #-*- coding:utf-8 -*-#from __future__ import unicode_literimport urllib,urllib2,timeimpor ...

随机推荐

RHEL启动错误：Kernel panic - not syncing:Attempted to kill init!解决方案
Virtual Box虚拟机启动RHEL系统报错,错误信息如下: 解决方案: 在GRUB引导界面按下e键,进入下图所示界面. 选择第二项,按下e键,进入编辑状态在结尾追加enforcing=0,按下 ...
[BJWC2012]冻结分层图最短路
昨晚飞行路线之后,这道题就应该能一眼切了题目当然也不难,跑一遍分层图最短路即可 Code: #include<cstring> #include<algorithm> #in ...
[洛谷P1343]地震逃生
题目大意:有n个点m条单向边,每条边有一个容量.现有x人要分批从1走到n,问每批最多能走多少人,分几批运完(或输出无法运完). 解题思路:一看就是网络流的题目.每批最多能走多少人,即最大流.分几批运完 ...
maven+spring-data-jpa环境搭建
转自http://www.cnblogs.com/007sx/p/5658194.html 首先看一下项目结构: 所用到的jar(pom.xml): <project xmlns="h ...
Redis-Sentinel原理及配置详解【转】
https://www.cnblogs.com/zhoujinyi/p/5570024.html
js闭包实例展示
准确来说,闭包是基于正常的垃圾回收处理机制下的.也就是说,一般情况一个函数(函数作用域)执行完毕,里面声明的变量会全部释放,被垃圾回收器回收.但闭包利用一个技巧,让作用域里面的变量,在函数执行完之后依 ...
紫书习题 10-7 UVa 10539（long long + 素数筛）
注意要开long long 如果int * int会炸那么久改成long long * int #include<cstdio> #include<vector> #incl ...
Git 如何把master的内容更新到分支
Background: 当有人对master进行更新之后,你想让已经创建的分支内容更新到master的最新状态, bpan@5CG7022BM2 MINGW64 /d/GitRep/JIRA_Exte ...
IDEA创建maven项目之后无法编写java类
在创建Maven web项目之后无法再java文件夹下面创建java类,这里我可以教一下大家选择你的文件夹,鼠标点击右键,出现下图所显示的,你可以按照下图所显示的步骤进行操作
android CoordinatorLayout使用
一.CoordinatorLayout有什么作用 CoordinatorLayout作为“super-powered FrameLayout”基本实现两个功能: 1.作为顶层布局 2.调度协调子布局 ...

项目: python爬虫 福利 煎蛋网妹子图

项目: python爬虫 福利 煎蛋网妹子图的更多相关文章

随机推荐

热门专题

项目: python爬虫福利煎蛋网妹子图

项目: python爬虫福利煎蛋网妹子图的更多相关文章