python线程池ThreadPoolExecutor与进程池ProcessPoolExecutor

python中ThreadPoolExecutor(线程池)与ProcessPoolExecutor(进程池)都是concurrent.futures模块下的，主线程(或进程)中可以获取某一个线程(进程)执行的状态或者某一个任务执行的状态及返回值。

通过submit返回的是一个future对象，它是一个未来可期的对象，通过它可以获悉线程的状态

ThreadPoolExecutor(线程池)

通过submit函数提交执行的函数到线程池中，done()判断线程执行的状态：

 import time

 from concurrent.futures import ThreadPoolExecutor

 def get_thread_time(times):

     time.sleep(times)

     return times

 # 创建线程池  指定最大容纳数量为4

 executor = ThreadPoolExecutor(max_workers=4)

 # 通过submit提交执行的函数到线程池中

 task1 = executor.submit(get_thread_time, (1))

 task2 = executor.submit(get_thread_time, (2))

 task3 = executor.submit(get_thread_time, (3))

 task4 = executor.submit(get_thread_time, (4))

 print("task1:{} ".format(task1.done()))

 print("task2:{}".format(task2.done()))

 print("task3:{} ".format(task3.done()))

 print("task4:{}".format(task4.done()))

 time.sleep(2.5)

 print('after 2.5s {}'.format('-'*20))

 done_map = {

     "task1":task1.done(),

     "task2":task2.done(),

     "task3":task3.done(),

     "task4":task4.done()

 }

 # 2.5秒之后，线程的执行状态

 for task_name,done in done_map.items():

     if done:

         print("{}:completed".format(task_name))

result：

task1:False

task2:False

task3:False

task4:False

after 2.5s --------------------

task1:completed

task2:completed

初始状态4个task都是未完成状态，2.5秒后task1和task2执行完成，task3和task由于是sleep(3) sleep(4)所以仍然是未完成的sleep状态

通过wait()判断线程执行的状态：

wait(fs, timeout=None, return_when=ALL_COMPLETED)，wait接受3个参数，fs表示执行的task序列；timeout表示等待的最长时间，超过这个时间即使线程未执行完成也将返回；return_when表示wait返回结果的条件，默认为ALL_COMPLETED全部执行完成再返回：

 import time

 from concurrent.futures import (

     ThreadPoolExecutor, wait

 )

 def get_thread_time(times):

     time.sleep(times)

     return times

 start = time.time()

 executor = ThreadPoolExecutor(max_workers=4)

 task_list = [executor.submit(get_thread_time, times) for times in [1, 2, 3, 4]]

 i = 1

 for task in task_list:

     print("task{}:{}".format(i, task))

     i += 1

 print(wait(task_list, timeout=2.5))

wait在2.5秒后返回线程的状态，result：

task1:<Future at 0x7ff3c885f208 state=running>

task2:<Future at 0x7ff3c885fb00 state=running>

task3:<Future at 0x7ff3c764b2b0 state=running>

task4:<Future at 0x7ff3c764b9b0 state=running>

DoneAndNotDoneFutures(
done={<Future at 0x7ff3c885f208 state=finished returned int>, <Future at 0x7ff3c885fb00 state=finished returned int>}, 
not_done={<Future at 0x7ff3c764b2b0 state=running>, <Future at 0x7ff3c764b9b0 state=running>})

可以看到在timeout 2.5时，task1和task2执行完毕，task3和task4仍在执行中

通过map返回线程的执行结果：

 import time

 from concurrent.futures import ThreadPoolExecutor

 def get_thread_time(times):

     time.sleep(times)

     return times

 start = time.time()

 executor = ThreadPoolExecutor(max_workers=4)

 i = 1

 for result in executor.map(get_thread_time,[2,3,1,4]):

     print("task{}:{}".format(i, result))

     i += 1

map(fn, *iterables, timeout=None)，第一个参数fn是线程执行的函数；第二个参数接受一个可迭代对象；第三个参数timeout跟wait()的timeout一样，但由于map是返回线程执行的结果，如果timeout小于线程执行时间会抛异常TimeoutError。

import time

from concurrent.futures import ThreadPoolExecutor

def get_thread_time(times):

    time.sleep(times)

    return times

start = time.time()

executor = ThreadPoolExecutor(max_workers=4)

i = 1

for result in executor.map(get_thread_time,[2,3,1,4]):

    print("task{}:{}".format(i, result))

    i += 1

map的返回是有序的，它会根据第二个参数的顺序返回执行的结果：

task1:2

task2:3

task3:1

task4:4

as_completed返回线程执行结果：

 import time

 from collections import OrderedDict

 from concurrent.futures import (

     ThreadPoolExecutor, as_completed

 )

 def get_thread_time(times):

     time.sleep(times)

     return times

 start = time.time()

 executor = ThreadPoolExecutor(max_workers=4)

 task_list = [executor.submit(get_thread_time, times) for times in [2, 3, 1, 4]]

 task_to_time = OrderedDict(zip(["task1", "task2", "task3", "task4"],[2, 3, 1, 4]))

 task_map = OrderedDict(zip(task_list, ["task1", "task2", "task3", "task4"]))

 for result in as_completed(task_list):

     task_name = task_map.get(result)

     print("{}:{}".format(task_name,task_to_time.get(task_name)))

task1、task2、task3、task4的等待时间分别为2s、3s、1s、4s，通过as_completed返回执行完的线程结果，as_completed(fs, timeout=None)接受2个参数，第一个是执行的线程列表，第二个参数timeout与map的timeout一样，当timeout小于线程执行时间会抛异常TimeoutError。

task3:1

task1:2

task2:3

task4:4

通过执行结果可以看出，as_completed返回的顺序是线程执行结束的顺序，最先执行结束的线程最早返回。

ProcessPoolExecutor

对于频繁的cpu操作，由于GIL锁的原因，多个线程只能用一个cpu，这时多进程的执行效率要比多线程高。

线程池操作斐波拉切：

 import time

 from concurrent.futures import ThreadPoolExecutor

 def fib(n):

     if n < 3:

         return 1

     return fib(n - 1) + fib(n - 2)

 start_time = time.time()

 executor = ThreadPoolExecutor(max_workers=4)

 task_list = [executor.submit(fib, n) for n in range(3, 35)]

 thread_results = [task.result() for task in as_completed(task_list)]

 print(thread_results)

 print("ThreadPoolExecutor time is: {}".format(time.time() - start_time))

result：

[8, 5, 3, 2, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 10946, 46368, 6765, 28657, 17711, 75025, 121393, 196418, 317811, 514229, 832040, 1346269, 2178309, 3524578, 5702887]

ThreadPoolExecutor time is: 4.998981237411499

进程池操作斐波拉切：

 import time

 from concurrent.futures import ProcessPoolExecutor

 def fib(n):

     if n < 3:

         return 1

     return fib(n - 1) + fib(n - 2)

 start_time = time.time()

 executor = ProcessPoolExecutor(max_workers=4)

 task_list = [executor.submit(fib, n) for n in range(3, 35)]

 process_results = [task.result() for task in as_completed(task_list)]

 print(process_results)

 print("ProcessPoolExecutor time is: {}".format(time.time() - start_time))

result:

[2, 3, 5, 8, 13, 21, 34, 55, 89, 144, 233, 377, 610, 987, 1597, 2584, 4181, 6765, 10946, 17711, 75025, 28657, 46368, 196418, 121393, 317811, 514229, 832040, 1346269, 2178309, 3524578, 5702887]

ProcessPoolExecutor time is: 3.3585257530212402

可以看出，对于频繁cpu操作进程是优于线程的，3.3s<4.9s

ProcessPoolExecutor在使用上和ThreadPoolExecutor大致是一样的，它们在futures中的方法也是相同的，但是对于map()方法ProcessPoolExecutor会多一个参数chunksize(ThreadPoolExecutor中这个参数没有任何作用)，chunksize将迭代对象切成块，将其作为分开的任务提交给pool，对于很大的iterables，设置较大chunksize可以提高性能。

python线程池ThreadPoolExecutor与进程池ProcessPoolExecutor的更多相关文章

GIL全局解释器锁、死锁现象、python多线程的用处、进程池与线程池理论
昨日内容回顾僵尸进程与孤儿进程 # 僵尸进程: 所有的进程在运行结束之后并不会立刻销毁(父进程需要获取该进程的资源) # 孤儿进程: 子进程正常运行但是产生该子进程的父进程意外死亡 # 守护进程: ...
CIL锁,GIL与线程池的区别,进程池和线程池,同步与异步
一.GIL锁什么是GIL? 全局解释器锁,是加在解释器上的互斥锁 GC是python自带的内存管理机制,GC的工作原理:python中的内存管理使用的是应用计数,每个数会被加上一个整型的计数器,表示 ...
python 管道、数据共享、进程池
一.管道(Pipe)(了解) (详情参考:https://www.cnblogs.com/clschao/articles/9629392.html) 进程间通信(IPC)方式二:管道(不推荐使用,了 ...
python 管道事件(Event) 信号量进程池(map/同步/异步)回调函数
####################总结######################## 管道:是进程间通信的第二种方式,但是不推荐使用,因为管道会导致数据不安全的情况出现事件:当我运行主进程的 ...
Python之网路编程之进程池及回调函数
一.数据共享 1.进程间的通信应该尽量避免共享数据的方式 2.进程间的数据是独立的,可以借助队列或管道实现通信,二者都是基于消息传递的. 虽然进程间数据独立,但可以用过Manager实现数据共享,事实 ...
Python多进程库multiprocessing中进程池Pool类的使用[转]
from:http://blog.csdn.net/jinping_shi/article/details/52433867 Python多进程库multiprocessing中进程池Pool类的使用 ...
python系列之 - 并发编程(进程池，线程池，协程)
需要注意一下不能无限的开进程,不能无限的开线程最常用的就是开进程池,开线程池.其中回调函数非常重要回调函数其实可以作为一种编程思想,谁好了谁就去掉只要你用并发,就会有锁的问题,但是你不能一直去自己加 ...
Python标准模块--concurrent.futures(进程池,线程池)
python为我们提供的标准模块concurrent.futures里面有ThreadPoolExecutor(线程池)和ProcessPoolExecutor(进程池)两个模块. 在这个模块里他们俩 ...
python 之并发编程（进程池与线程池、同步异步阻塞非阻塞、线程queue）
9.11 进程池与线程池池子使用来限制并发的任务数目,限制我们的计算机在一个自己可承受的范围内去并发地执行任务池子内什么时候装进程:并发的任务属于计算密集型池子内什么时候装线程:并发的任务属于I ...

随机推荐

Vue项目构建开发笔记（vue-lic3.0构建的）
1.router.js里面 { path: '/about', name: 'about', // route level code-splitting // this generates a sep ...
C# 中使用 Excel
using System;using System.Collections.Generic;using System.Text;using System.Reflection;using System ...
Confluence 6 配置草稿保存的时间
这个设置仅仅应用到 Confluence 6.0 及后续版本中,如果你选择禁用(disable )collaborative editing. 当协同编辑被启用后,我们将会保存所有的修改. 当协同编 ...
Confluence 6 Oracle 测试你的数据库连接
在你的数据库设置界面,有一个测试连接(Test connection)按钮可以检查: Confluence 可以连接你的数据库服务器数据库的字符集编码是否正确你的数据库用户是否具有需要的权限你 ...
Confluence 6 升级自定义的站点和空间获得你的自定义布局
我们建议你在对站点进行布局修改的时候,你需要为你修改的 Confluence 站点或空间布局保留所有的修改记录. 如果没有的话,你应该可以通过下面的办法找到你的自定义修改.这个方法将会把你对全部网站和 ...
电子书转换为PDF格式
目录一.mobi 转换 pdf 步骤二.查看转换后的结果目录三.将PDF还原文件名且移出至新目录背景:当我们从网上下载一些电子小说或书籍的时候,一般文件的格式可能是.epub..mobi等.这 ...
Android UiAutomator 快速调试
背景:在Eclipse中不能直接运行Uiautomator工程,所以每次编写一份用例都要进行手动输入命令,很烦.调试起来不仅繁琐还浪费时间.网上找到一份快速调试的代码UiAutomatorHelper ...
nginx常用命令及简单配置
nginx常用命令 nginx -c /usr/local/nginx/conf/nginx.conf 启动nginx(windows下start nginx); nginx -s quit 停止ng ...
【scapy】读取pcap
scapy读取pcap包假设有pcap包test.pcap,读取其中的分层流量信息代码: import scapy_http.http try: import scapy.all as scapy ...
如何编辑PDF文件，怎么使用PDF裁剪页面工具
在编辑PDF文件的时候,往往会有很多的小技巧可以使用,在编辑PDF文件的时候,怎么对文件的页面进行裁剪呢,不会的话,看看下面的文章吧,小编已经为大家整理好了哦. 1.打开运行PDF编辑器,在编辑器中打 ...

python线程池ThreadPoolExecutor与进程池ProcessPoolExecutor

python线程池ThreadPoolExecutor与进程池ProcessPoolExecutor的更多相关文章

随机推荐

热门专题