django 多线程下载图片
example1:
- from multiprocessing.dummy import Pool as ThreadPool #多线程
- import time
- import urllib2
- urls = [
- 'http://www.python.org',
- 'http://www.python.org/about/',
- 'http://www.onlamp.com/pub/a/python/2003/04/17/metaclasses.html',
- 'http://www.python.org/doc/',
- ]
- # 单线程
- start = time.time()
- results = map(urllib2.urlopen, urls)
- print 'Normal:', time.time() - start
- # 多线程
- start2 = time.time()
- # 开4个 worker,没有参数时默认是 cpu 的核心数
- pool = ThreadPool(4)
- # 在线程中执行 urllib2.urlopen(url) 并返回执行结果
- results2 = pool.map(urllib2.urlopen, urls)
- pool.close()
- pool.join()
- print 'Thread Pool:', time.time() - start2
example2:
- #!/usr/bin/env python
- # coding=utf-8
- import os
- import random
- import requests
- from cStringIO import StringIO
- from PIL import Image
- from multiprocessing.dummy import Pool as ThreadPool
- class Labelcode(object):
- def __init__(self, path='images'):
- self.base_path = os.path.dirname(__file__)
- print 'self.base_path', self.base_path
- totalImg = [os.path.join(self.base_path, path, fname) for fname in os.listdir(os.path.join(self.base_path, path))]
- finished = [fname for fname in totalImg if fname.find('_')>1]
- self.unfinished = [fname for fname in totalImg if fname not in finished]
- self.label_msg = {} # 当前信息
- self.label_msg['totalCnt'] = len(totalImg)
- self.label_msg['finishedCnt']= len(finished)
- if self.unfinished:
- self.label_msg['fname'] = random.choice(self.unfinished)
- else:
- self.label_msg['fname'] = 'no img exists'
- def get_label_img(self, fname=None, result=''):
- """
- 标注相关验证码图片,并返回当前信息
- """
- print self.base_path
- print '---'*30
- if fname in self.unfinished and len(result)>1:
- newName = '%s/images/%s_%s.jpg' % (self.base_path, result, fname.split('/')[-1].split('.')[0])
- if os.path.exists(fname):
- os.rename(fname, newName) # 更新名字
- self.unfinished.remove(fname)
- self.label_msg['finishedCnt'] += 1
- self.label_msg['fname'] = random.choice(self.unfinished)
- if self.unfinished:
- self.label_msg['fname'] = random.choice(self.unfinished)
- return self.label_msg
- def download_img(self, img_url=None, web_name=None, cnt=1000):
- """
- 多线程下载图片
- """
- res = {'totalCnt': cnt, 'finishedCnt':0}
- if not img_url:
- return res
- def get_html((img_ur, idx)):
- try:
- img = StringIO(requests.get(img_url).content)
- img = Image.open(img).convert('RGB')
- img.save('%s/images/%s/%d.jpg' % (self.base_path, web_name, idx))
- res['finishedCnt'] += 1
- except Exception as e:
- print (e)
- web_name = web_name.strip().lower()
- cnt = int(cnt) if cnt else 0
- img_urls = []
- pool = ThreadPool(10) # 同时开启 10 个线程
- for i in range(cnt):
- img_urls.append((img_url, i+500)) # 插入需要下载的url
- if not os.path.exists('%s/images/%s' % (self.base_path, web_name)):
- os.makedirs('%s/images/%s' % (self.base_path, web_name))
- pool.map(get_html, img_urls)
- pool.close()
- pool.join()
- return res
- if __name__ == '__main__':
- test = Labelcode()
- url = 'https://passport.360.cn/captcha.php?m=create&app=i360&scene=login&userip=n7ASHVefL%2FAiu7j%2BPntTvQ%3D%3D&level=default&sign=c5d208'
- print test.download_img(url, '', 10)
django 多线程下载图片的更多相关文章
- 多线程下载图片,滑动tableView崩溃--资源抢夺问题
最近练习使用NSoperation模拟SDWebImage下载图片,发生了崩溃的问题,还专门写博客记录这件事情: http://www.cnblogs.com/tufei7/p/7074030.htm ...
- android 多线程下载图片
很多时候我们需要在Android设备上下载远程服务器上的图片进行显示,今天Android123整理出两种比较好的方法来实现远程图片的下载. 方法一.直接通过Android提供的Http类访问远程服 ...
- 多线程下载图片,同步下载http://www.importnew.com/15731.html
package mutiDownload; import java.io.IOException; import java.io.InputStream; import java.io.RandomA ...
- SDWebImage 在多线程下载图片时防止错乱的策略
在我们使用sd的时候,对tableView 上cell得图片进行异步下载的时候会遇到这样一个问题: 由于cell的重用机制,在我们加载出一个cell的时候imageView数据源开启一个下载任务并返 ...
- curl多线程下载类
<?php /** * curl多线程下载类 */class MultiHttpRequest{ public $urls = array (); private $res = array () ...
- iOS多线程自定义operation加载图片 不重复下载图片
摘要:1:ios通过抽象类NSOperation封装了gcd,让ios的多线程变得更为简单易用: 2:耗时的操作交给子线程来完成,主线程负责ui的处理,提示用户的体验 2:自定义operati ...
- php中ob_get_contents、curl_multi_init、curl_init多线程下载远程图片并保存记录
php中三种方式测试图片下载效率 原文共24张不同图,每张大小在500K以上 使用时注意调整传入数组格式以及需要下载时保存地址的路径格式等 这三种方式无需额外安装扩展,方便快捷易操作[虽然效率看结果没 ...
- Python爬虫之多线程下载豆瓣Top250电影图片
爬虫项目介绍 本次爬虫项目将爬取豆瓣Top250电影的图片,其网址为:https://movie.douban.com/top250, 具体页面如下图所示: 本次爬虫项目将分别不使用多线程和使 ...
- [Xcode 实际操作]八、网络与多线程-(22)使用GCD多线程技术异步下载图片
目录:[Swift]Xcode实际操作 本文将演示如何使用使用GCD多线程技术异步下载图片. Grand Central Dispatch(GCD) 是 Apple 开发的一个多核编程的较新的解决方法 ...
随机推荐
- windows10下安装mysql-8.0.15-winx64以及连接服务器过程中遇到的一些问题
一.下载安装配置mysql-8.0.15 1.官网(https://dev.mysql.com/downloads/mysql/)下载zip包 2.解包到我的D:\mysql目录下 3.为mysql配 ...
- Oracle获取当前年、月、日的方法
Oracle获取当前年.月.日的方法 Oracle 获取当前年.月.日 1.//oracle中extract()函数从oracle 9i中引入,用于从一个date或者interval类型中截取到特定的 ...
- Visual Basic 2017 操作Excel和word【2】持续更新……
1.控制台程序创建Excel,并设置状态栏显示“Hello World”文本 Module Module1 Private exitXL As Boolean = False Dim WithEven ...
- mysql装完计算机管理里面没mysql服务怎么解决(转)
mysql装完计算机管理里面没mysql服务怎么解决 2017年07月04日 09:32:51 XC_Echizen 阅读数:7335 标签: mysql计算机mysql服务找不到mysql服务 更多 ...
- 剑指offer题库
1.题目描述 在一个二维数组中,每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序.请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数. 思路: 因为矩阵的 ...
- Problem B: 平面上的点和线——Point类、Line类 (II)
Description 在数学上,平面直角坐标系上的点用X轴和Y轴上的两个坐标值唯一确定,两点确定一条线段.现在我们封装一个“Point类”和“Line类”来实现平面上的点的操作. 根据“append ...
- 复制目录及其子目录下所有文件DOC
echo 开始同步代码 set src_home=F:\work\sign\Bonade-Sign set dest_home=F:\work\testGit\sign5\Bonade-Sign se ...
- Java 获取class method parameter name
package org.rx.util; import org.objectweb.asm.*; import java.io.IOException; import java.io.InputStr ...
- 2017年3月30日15:00:19 fq以后的以后 动态代理
代理与继承,组合不同的是,继承是继承父类特性,组合是拼装组合类的特性,代理是使用代理类的指定方法并可以做自定义. 静态类是应用单个类,当代理的类数量较多时可用动态代理,动态代理在概念上很好理解 htt ...
- Linux 应用——常用函数(usual function)
main函数: 新建testmain.c #include <sys/types.h>#include <sys/stat.h>#include <fcntl.h> ...