python批量下载图片3

import urllib.request

import os

def url_open(url):

    req = urllib.request.Request(url)

    req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.134 Safari/537.36')

    response = urllib.request.urlopen(url)

    html = response.read()

    return html

def get_page(url):

    html =  url_open(url).decode('utf-8')

    a = html.find('current-comment-page') + 23

    b = html.find(']',a)

    return html[a:b]

def find_imgs(url):

    html = url_open(url).decode('utf-8')

    img_addrs = []

    a = html.find('img src=')

    while a!=-1:

        b = html.find('.jpg',a,a+255)

        if b != -1:

            img_addrs.append(html[a+9:b+4])

        else:

            b = a + 9

        a = html.find('img src=',b)

    return img_addrs

def save_imgs(folder,img_addrs):

     for each in img_addrs:

          filename = each.split('/')[-1]

          urllib.request.urlretrieve(each,filename,None)

def download_mm(folder='OOXX',pages=10):

    #os.mkdir(folder)

    os.chdir(folder)

    url = "http://konachan.com/post?tags=rating%3Asafe"

    page_num = int(2)

    for i in range(pages):

        page_num += i

        print(i)

        page_url = 'http://konachan.com/post?page=' + str(page_num) + '&tags=rating%3Asafe'

        print(page_url)

        img_addrs = find_imgs(page_url)

        save_imgs(folder,img_addrs)

if __name__=='__main__':

    download_mm()

和

import urllib.request

import os

def url_open(url):

    req = urllib.request.Request(url)

    req.add_header('User-Agent', 'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.134 Safari/537.36')

    response = urllib.request.urlopen(url)

    html = response.read()

    return html

def get_page(url):

    html =  url_open(url).decode('utf-8')

    a = html.find('current-comment-page') + 23

    b = html.find(']',a)

    return html[a:b]

def find_imgs(url):

    html = url_open(url).decode('utf-8')

    img_addrs = []

    a = html.find('img src=')

    while a!=-1:

        b = html.find('.jpg',a,a+255)

        if b != -1:

            img_addrs.append(html[a+9:b+4])

        else:

            b = a + 9

        a = html.find('img src=',b)

    return img_addrs

def save_imgs(folder,img_addrs):

     for each in img_addrs:

          filename = each.split('/')[-1]

          with open(filename,'wb')as f:

                img = url_open(each)

                f.write(img)
　　　　　　　　　 f.close()                                              #每次存储之后都要close()否则存储的只是一个图

def download_mm(folder='OOXX',pages=10):

    os.mkdir(folder)

    os.chdir(folder)

    url = "http://konachan.com/post?tags=rating%3Asafe"

    page_num = int(2)

    for i in range(pages):

        page_num += i

        print(i)

        page_url = 'http://konachan.com/post?page=' + str(page_num) + '&tags=rating%3Asafe'

        print(page_url)

        img_addrs = find_imgs(page_url)

        save_imgs(folder,img_addrs)

if __name__=='__main__':

    download_mm()

python批量下载图片3的更多相关文章

用python批量下载图片
一写爬虫注意事项网络上有不少有用的资源, 如果需要合理的用爬虫去爬取资源是合法的,但是注意不要越界,前一阶段有个公司因为一个程序员写了个爬虫,导致公司200多个人被抓,所以先进入正题之前了解下什么 ...
python——批量下载图片
前言批量下载网页上的图片需要三个步骤: 获取网页的URL 获取网页上图片的URL 下载图片例子 from html.parser import HTMLParser import urllib.r ...
python批量下载图片的三种方法
一是用微软提供的扩展库win32com来操作IE: win32com可以获得类似js里面的document对象,但貌似是只读的(文档都没找到). 二是用selenium的webdriver: sele ...
python 批量下载图片
#coding=utf-8import re,sysimport urllib def getHtml(url): page = urllib.urlopen(url) html = page.rea ...
python批量下载图片
从数据库拿了一批图片地址,需要一张一张的把图片下载下来,自从有了python,想到能省事就琢磨如何省事. 代码如下: import urllib.requestf=open("E:\999\ ...
【Python】nvshens按目录批量下载图片爬虫1.00(单线程版)
# nvshens按目录批量下载图片爬虫1.00(单线程版) from bs4 import BeautifulSoup import requests import datetime import ...
用Python批量下载DACC的MODIS数据
本人初次尝试用Python批量下载DACC的MODIS数据,记下步骤,提醒自己,数据还在下载,成功是否未知,等待结果中...... 若有大佬发现步骤有不对之处,望指出,不胜感激. 1.下载Python ...
Python批量修改图片格式和尺寸
Python批量修改图片格式和尺寸备注: 1.导入了PIL库,是处理图片用的,很强大; 2.导入了的win32库,是判断隐藏文件用的,我们的项目需要删除隐藏文件,不需要的可以直接找到删除. 3.导入 ...
scrapy操作mysql/批量下载图片
1.操作mysql items.py meiju.py 3.piplines.py 4.settings.py -------------------------------------------- ...

随机推荐

flask - 1
from flask import Flask app = Flask(__name__) @app.route('/') def hello_world(): return 'Hello, Worl ...
Win7下搭建Zigbee开发环境
操作系统:64位Win7 芯片类型:Texas Instruments的CC2530 软件平台:IAR v8.10 Zigbee协议栈:ZStack-CC2530-2.5.1a CP2102 USB ...
linux基本操作1
ctrl + alt + T 打开命令行 -根目录下home中为用户建的文件夹 cd 加目录名称转到当前目录 .当前目录..上级目录 ls 当前目录下的文件ls -l 显示当前目录下文件的权限 mkd ...
oracle 导入导出语句
imp USERID/PSD@SID file='D:\1.dmp' full=y statistics=none exp USERID/PSD@SID file='D:\1.dmp' tables= ...
【HDU 4300 Clairewd’s message】
Clairewd is a member of FBI. After several years concealing in BUPT, she intercepted some important ...
Linux(CentOS)用split命令分割文件
在 Linux 里,稍加不注意有可能会产生很大体积的日志文件,哪怕几百M,拖下来分析也很浪费时间,这个时候,如果可以把文件切割成 N 个小文件,拿最后一个文件就可以看到最近的日志了.有一些手段,比如用 ...
POJ - 1017 贪心训练
Packets Time Limit: 1000MS Memory Limit: 10000K Total Submissions: 59725 Accepted: 20273 Descrip ...
Windows下查看某个端口被哪个服务占用
1.查看某个端口是否被占用打开命令行,输入:netstat -ano | findstr "3306" 2.查看端口被哪个服务占用 tasklist | findstr “PID ...
JS中二维数组的声明
var myarr=new Array(); //先声明一维 for(var i=0;i<2;i++){ //一维长度为2 myarr[i]=new Array(); //再声明二维 for(v ...
node搭建文件服务器
python可以在目录下python -m http.server 8080来启动一个静态文件服务器,使用node实现一个运行node fileServer.js D:\lanFeature 即可将 ...

python批量下载图片3

python批量下载图片3的更多相关文章

随机推荐

热门专题