python多线程下载

# -*- coding=utf-8 -*-

import sys

import os

import os.path

import time

import urllib.request, urllib.parse, urllib.error

from threading import Thread

local_proxies = {}

class ThreadDownComplete:

    def __init__(self, down_loaded):

        self.down_loaded = down_loaded

class ThreadDown(Thread, urllib.request.FancyURLopener):

    def __init__(self, thread_name, url, filename, ranges=0, proxies={}):

        Thread.__init__(self, name=thread_name)

        urllib.request.FancyURLopener.__init__(self, proxies)

        self.name = thread_name

        self.url = url

        self.filename = filename

        self.ranges = ranges

        self.down_loaded = 0

        self.url_handler = None

        self.one_time_size = 16384  # 16kByte/time

        self.data_start_point = self.ranges[0]

        self.data_end_point = self.ranges[1]

        self.down_start_time = int(time.time())

        self.recent_down_time = int(time.time())

        self.stop = False

        self.complete = False

        self.download_loan = self.data_end_point - self.data_start_point

        try:

            self.down_loaded = os.path.getsize(self.filename)

        except OSError:

            self.down_loaded = 0

        self.start_point = self.data_start_point + self.down_loaded

        if not self.complete_check():

            self.data_check()

    def start_reset(self):

        try:

            os.remove(self.filename)

        except:

            pass

        self.down_loaded = 0

        self.complete = False

        self.stop = False

        self.start_point = self.data_start_point

    def data_check(self):

        if self.start_point > self.data_end_point:

            print("Part %s has been down_loaded over.\n" % self.filename)

            self.start_reset()

    def flow_check(self):

        if self.down_loaded > self.download_loan + 1:

            self.stop = False

            return False

        return True

    def complete_check(self):

        if self.down_loaded == self.download_loan + 1:

            self.complete = True

            self.stop = True

            return True

        return False

    def down(self):

        try:

            return self.url_handler.read(self.one_time_size)

        except:

            return ''

    def __run(self):

        print("task %s will down_load from %d to %d" % (self.name, self.start_point, self.data_end_point))

        self.addheader("Range", "bytes=%d-%d" % (self.start_point, self.data_end_point))

        self.url_handler = self.open(self.url)

        data = self.down()

        while not self.stop and not self.complete:

            if data:

                self.recent_down_time = int(time.time())

                file_handler = open(self.filename, 'ab+')

                file_handler.write(data)

                file_handler.close()

                self.down_loaded += len(data)

            if self.complete_check():

                break

            if not self.flow_check():

                break

            data = self.down()

    def run(self):

        if self.complete:

            return

        self.__run()

        self.complete_check()

        while not self.stop and not self.complete:

            self.start_reset()

            self.__run()

            self.complete_check()

def get_file_size(url, proxies={}):

    url_handler = urllib.request.urlopen(url)

    return int(url_handler.info()['Content-Length'])

def split_blocks(total_size, block_number):

    block_size = int(total_size / block_number)

    ranges = []

    for i in range(0, block_number - 1):

        ranges.append((i * block_size, (i + 1) * block_size - 1))

    ranges.append(((block_number - 1) * block_size, total_size - 1))

    return ranges

def is_live(tasks):

    for index, task in enumerate(tasks):

        if isinstance(task, ThreadDownComplete):

            continue

        if int(time.time()) - task.recent_down_time > 8:

            thread_name = task.name

            filename = task.filename

            ranges = task.ranges

            url = task.url

            task.stop = True

            tasks[index] = start_down_thread(thread_name, url, filename, ranges)

            return True

        if task.complete:

            tasks[index] = ThreadDownComplete(task.down_loaded)

        if task.is_alive():

            return True

    return False

def start_down_thread(thread_name, url, filename, ranges):

    task = ThreadDown(thread_name, url, filename, ranges)

    task.setDaemon(True)

    task.start()

    return task

def log(msg):

    sys.stdout.write(msg)

    sys.stdout.flush()

def down_load(url, output, blocks=6, proxies=local_proxies):

    down_file_size = get_file_size(url, proxies)

    ranges = split_blocks(down_file_size, blocks)

    thread_name = ["thread_%d" % i for i in range(0, blocks)]

    filename = [output + "_%d" % i for i in range(0, blocks)]

    tasks = []

    for i in range(0, blocks):

        tasks.append(start_down_thread(thread_name[i], url, filename[i], ranges[i]))

    while is_live(tasks):

        down_loaded = sum([task.down_loaded for task in tasks])

        process = down_loaded / float(down_file_size) * 100

        log("\rfilesize:%d down_loaded:%d Completed:%.2f%%" % (down_file_size, down_loaded, process))

        time.sleep(0.01)

    file_handler = open(output, 'wb+')

    for i in filename:

        f = open(i, 'rb')

        file_handler.write(f.read())

        f.close()

        try:

            os.remove(i)

            pass

        except:

            pass

    file_handler.close()

    if os.path.getsize(output) == down_file_size:

        log("\nCompleted\n")

    else:

        log("\nError\n")

    sys.exit(0)

if __name__ == '__main__':

    _url = "http://dldir1.qq.com/qqfile/qq/QQ7.9Light/14308/QQ7.9Light.exe"

    down_load(_url, os.path.basename(_url), blocks=30, proxies={})

python多线程下载的更多相关文章

python多线程下载文件
从文件中读取图片url和名称,将url中的文件下载下来.文件中每一行包含一个url和文件名,用制表符隔开. 1.使用requests请求url并下载文件 def download(img_url, i ...
python多线程下载ts文件
# -*- coding: utf-8 -*- """ Created on Wed Aug 22 15:56:19 2018 @author: Administrato ...
python多线程下载网页图片并保存至特定目录
#!python3 #multidownloadXkcd.py - Download XKCD comics using multiple threads. import requests impor ...
python线程使用场景多线程下载
http://blog.xiayf.cn/2015/09/11/parallelism-in-one-line http://python.jobbole.com/84327/ http://www. ...
PYTHON文件多线程下载
其实,在一般的文件编程中,这有两个概念要说明: 第一是,下载一个大文件,将这个大文件多为多线程. 第二是,下载N多小文件,将每个线程指定下载多个小文件. 现在实现的是多线程下载一个大文件. 今天完成了 ...
Python之FTP多线程下载文件之分块多线程文件合并
Python之FTP多线程下载文件之分块多线程文件合并欢迎大家阅读Python之FTP多线程下载系列之二:Python之FTP多线程下载文件之分块多线程文件合并,本系列的第一篇:Python之FTP ...
Python之FTP多线程下载文件之多线程分块下载文件
Python之FTP多线程下载文件之多线程分块下载文件 Python中的ftplib模块用于对FTP的相关操作,常见的如下载,上传等.使用python从FTP下载较大的文件时,往往比较耗时,如何提高从 ...
python爬取快手视频多线程下载
就是为了兴趣才搞的这个,ok 废话不多说直接开始. 环境: python 2.7 + win10 工具:fiddler postman 安卓模拟器首先,打开fiddler,fiddler作为htt ...
python多线程爬虫+批量下载斗图啦图片项目（关注、持续更新）
python多线程爬虫项目() 爬取目标:斗图啦(起始url:http://www.doutula.com/photo/list/?page=1) 爬取内容:斗图啦全网图片使用工具:requests ...

随机推荐

WPF:获取控件内的子项
一.界面内容(部分:仅供参考) <Window> <Window.Resources>  <XmlDataProvider x:Key ...
删除ecshop登录后台看到的系统信息
登陆ecshop后台,默认打开在页面顶部会出现个系统信息,显示操作系统,数据库版本,以及安装日期系统版本号.部分客户问到怎么删除,这里最模板提供ecshop教程告诉大家方法. 找到admin\temp ...
AtomicInteger类保证线程安全的用法
J2SE 5.0提供了一组atomic class来帮助我们简化同步处理.基本工作原理是使用了同步synchronized的方法实现了对一个long, integer, 对象的增.减.赋值(更新)操作 ...
Unity-Animator深入系列---剪辑播放后位置预判(Animator.Target)
回到 Animator深入系列总目录 animator.SetTarget(...);可以在播放前预判剪辑播放后的位置,但只限于人形动画参数1是预判的关节,参数2是映射的剪辑时间调用后通过targ ...
lua中奇葩用法
th> a=torch.zeros(,) [.0001s] th> a [torch.DoubleTensor of size 1x5] [.0002s] th> a[] [torc ...
ubuntu中rar与unrar用法详解
本文转载:http://helloklzs.iteye.com/blog/1139993 安装: sudo apt-get install rar 这样就可以安装了删除是以下语句 sudo apt- ...
Adding Value To Combo List at Runtime in Oracle Forms
You want to add a value in Combo List item in Oracle Forms, by typing it in combo list box text area ...
How To Use RUN_PRODUCT In Oracle Forms
Run_Product is used to run Oracle Reports (RDF/REP files) in Oracle Forms. It invokes one of the sup ...
面向对象--类库、委托、is和as运算符、泛型集合
类库: 其实就是一堆类文件,只是看不到这些类的源代码,保密性好. 优点:保密性好缺点:如果这个方法不好用,使用者无法自己去更改它. 给的大多是dll文件.使用方法:引用右键,添加引用,浏览,选择到相 ...
[51NOD1065] 最小正子段和（STL，前缀和）
题目链接:http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1065 估计没人这么做吧-用一个set维护前缀和,但是set的l ...

python多线程下载

python多线程下载的更多相关文章

随机推荐

热门专题