引出

首先需要了解的是threadpool 的用途,他更适合于用到一些大量的短任务合集,而非一些时间长的任务,换句话说,适合大量的CPU密集型短任务,那些消耗时间较长的IO密集型长任务适合用协程去解决。

目前,python 标准库(特指python2.X)中的threadpool模块是在 multiprocessing.pool.threadpool,或者multiprocessing.dummy.ThreadPool(dummy模块是针对threading 多线程的进一步封装)。该模块有个缺点就是在所有线程执行完之前无法强制退出。实现原理大同小异:实例化pool的时候会创建指定数目的线程,把task 传给一个task-queue,线程会读取task-queue 的task,没有就阻塞,读取到后就执行,并将结果交给一个result-queue。

除了标准库中的threadpool,还有一些使用比较多的threadpool,以下展开。

pip 中的 ThreadPool

安装简单:pip install threadpool
使用如下:

  1. 1
    2
    3
    4
  1. pool = ThreadPool(poolsize) # 定义线程池,指定线程数量
    requests = makeRequests(some_callable, list_of_args, callback) # 调用makeRequests创建了要开启多线程的函数,以及函数相关参数和回调函数
    [pool.putRequest(req) for req in requests] # 所有要运行多线程的请求扔进线程池
    pool.wait() # 等待所有线程完成后退出

原理类似,源码解读可以参考python——有一种线程池叫做自己写的线程池 ,该博客还给出了对其的一些优化。

自己定制 threadpool

根据需要的功能定制适合自己的threadpool 也是一种常见的手段,常用的功能比如:是否需要返回线程执行后的返回值,线程执行完之后销毁还是阻塞等等。以下为自己经常用的的一个比较简洁的threadpool,感谢@kaito-kidd提供,源码:

  1. 1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57
    58
    59
    60
    61
    62
    63
    64
    65
    66
    67
    68
    69
    70
    71
    72
    73
    74
    75
    76
    77
    78
    79
    80
    81
    82
    83
    84
    85
    86
    87
    88
    89
    90
    91
    92
    93
    94
    95
    96
    97
    98
    99
    100
    101
    102
    103
    104
    105
  1. # coding: utf8
  2.  
  3. """
    线程池,用于高效执行某些任务。
    """
  4.  
  5. import Queue
    import threading
  6.  
  7. class Task(threading.Thread):
  8.  
  9. """ 任务 """
  10.  
  11. def __init__(self, num, input_queue, output_queue, error_queue):
    super(Task, self).__init__()
    self.thread_name = "thread-%s" % num
    self.input_queue = input_queue
    self.output_queue = output_queue
    self.error_queue = error_queue
    self.deamon = True
  12.  
  13. def run(self):
    """run
    """
    while 1:
    try:
    func, args = self.input_queue.get(block=False)
    except Queue.Empty:
    print "%s finished!" % self.thread_name
    break
    try:
    result = func(*args)
    except Exception as exc:
    self.error_queue.put((func.func_name, args, str(exc)))
    else:
    self.output_queue.put(result)
  14.  
  15. class Pool(object):
  16.  
  17. """ 线程池 """
  18.  
  19. def __init__(self, size):
    self.input_queue = Queue.Queue()
    self.output_queue = Queue.Queue()
    self.error_queue = Queue.Queue()
    self.tasks = [
    Task(i, self.input_queue, self.output_queue,
    self.error_queue) for i in range(size)
    ]
  20.  
  21. def add_task(self, func, args):
    """添加单个任务
    """
    if not isinstance(args, tuple):
    raise TypeError("args must be tuple type!")
    self.input_queue.put((func, args))
  22.  
  23. def add_tasks(self, tasks):
    """批量添加任务
    """
    if not isinstance(tasks, list):
    raise TypeError("tasks must be list type!")
    for func, args in tasks:
    self.add_task(func, args)
  24.  
  25. def get_results(self):
    """获取执行结果集
    """
    while not self.output_queue.empty():
    print "Result: ", self.output_queue.get()
  26.  
  27. def get_errors(self):
    """获取执行失败的结果集
    """
    while not self.error_queue.empty():
    func, args, error_info = self.error_queue.get()
    print "Error: func: %s, args : %s, error_info : %s" \
    % (func.func_name, args, error_info)
  28.  
  29. def run(self):
    """执行
    """
    for task in self.tasks:
    task.start()
    for task in self.tasks:
    task.join()
  30.  
  31. def test(i):
    """test """
    result = i * 10
    return result
  32.  
  33. def main():
    """ main """
    pool = Pool(size=5)
    pool.add_tasks([(test, (i,)) for i in range(100)])
    pool.run()
  34.  
  35. if __name__ == "__main__":
    main()

阅读原文

python-- python threadpool 的前世今生的更多相关文章

  1. python --- Python中的callable 函数

    python --- Python中的callable 函数 转自: http://archive.cnblogs.com/a/1798319/ Python中的callable 函数 callabl ...

  2. Micro Python - Python for microcontrollers

    Micro Python - Python for microcontrollers MicroPython

  3. 从Scratch到Python——python turtle 一种比pygame更加简洁的实现

    从Scratch到Python--python turtle 一种比pygame更加简洁的实现 现在很多学校都开设了Scratch课程,学生可以利用Scratch创作丰富的作品,然而Scratch之后 ...

  4. 从Scratch到Python——Python生成二维码

    # Python利用pyqrcode模块生成二维码 import pyqrcode import sys number = pyqrcode.create('从Scratch到Python--Pyth ...

  5. [Python]Python 使用 for 循环的小例子

    [Python]Python 使用 for 循环的小例子: In [7]: for i in range(5): ...: print "xxxx" ...: print &quo ...

  6. [python]python 遍历一个list 的小例子:

    [python]python 遍历一个list 的小例子: mlist=["aaa","bbb","ccc"]for ss in enume ...

  7. [Python]Python日期格式和字符串格式相互转换

    由字符串格式转化为日期格式的函数为: datetime.datetime.strptime() 由日期格式转化为字符串格式的函数为: datetime.datetime.strftime() # en ...

  8. [python]Python 字典(Dictionary) update()方法

    update() 函数把字典dict2的键/值对更新到dict里.如果后面的键有重复的会覆盖前面的语法dict.update(dict2) dict = {'Name': 'Zara', 'Age': ...

  9. 『Python』 ThreadPool 线程池模板

    Python 的 简单多线程实现 用 dummy 模块 一句话就可以搞定,但需要对线程,队列做进一步的操作,最好自己写个线程池类来实现. Code: # coding:utf-8 # version: ...

  10. python 添加 threadpool

    操作系统: Ubuntu 10.04 python安装依赖的软件包: python 出现 ImportError: No module named ** 我这里出现了: ImportError: No ...

随机推荐

  1. free - 显示系统内存信息

    free - Display amount of free and used memory in the system 显示系统中空闲和已使用内存的数量 格式: free [options] opti ...

  2. 提高用git下载代码时的成功率

    在用git clone下载一些比较大的仓库时,经常会遇到由于仓库体积过大,网络也不稳定,导致下了半截就中断了,可以参考如下的下载方法. 先用创建一个空目录,然后用git init初始化,然后用git ...

  3. Istio技术与实践06:史上最全!Istio安装参数介绍

    一. CertManage Istio-1.0版本新加入的组件,利用ACME为Istio签发证书 Key Default Value Description certmanager.enabled T ...

  4. ShareSDK For Unity集成

    Mob ShareSDK Android - V2.7.10 iOS - V3.5.0 Mob下载:https://github.com/MobClub/New-Unity-For-ShareSDK ...

  5. 详解Eureka 缓存机制

    原文:https://www.cnblogs.com/yixinjishu/p/10871243.html 引言 Eureka是Netflix开源的.用于实现服务注册和发现的服务.Spring Clo ...

  6. Mysql的安装与环境的配置

    Mysql的安装与环境的配置 这里以Mysql5.5为例: (1)双击安装包,点击next (2)选择自定义,点击Next (3)修改路径,点击Next (4)选择精确配置,点击Next (5)选择开 ...

  7. 【PHP】系统部署

    1.MySql数据库,单独创建用户和数据库 使用MySql-Front导入,避免使用Navicat导入 2.httpd-vhosts.conf配置 文件位于:D:\Xampp\apache\conf\ ...

  8. spark运行时加载配置文件(hive,hdfs)

    文章为转载,如有版权问题,请联系,谢谢! 转自:https://blog.csdn.net/piduzi/article/details/81636253 适合场景:在运行时才确定用哪个数据源 imp ...

  9. MapReduce如何调优

    Map阶段优化 1.在代码书写时优化,如尽量避免在map端创建变量等,因为map端是循环调用的,创建变量会增加内存的消耗,尽量将创建变量放到setup方法中 2.配置调优,可以在集群配置和任务运行时进 ...

  10. Type Encodings

    https://developer.apple.com/library/content/documentation/Cocoa/Conceptual/ObjCRuntimeGuide/Articles ...