python 进程池的简单使用方法】的更多相关文章

回到python,用一下python的进程池. 记得之前面试的时候,面试官问:你知道进程池的默认参数吗? 我没有回答上来,后来才知道,是有默认参数的.下面就看看它的默认参数 1. 不加参数 from multiprocessing.pool import Pool from time import sleep def fun(a): sleep(5) print(a) if __name__ == '__main__': p = Pool() # 这里不加参数,但是进程池的默认大小,等于电脑CP…
平常会经常用到多进程,可以用进程池pool来进行自动控制进程,下面介绍一下pool的简单使用. 需要主动是,在Windows上要想使用进程模块,就必须把有关进程的代码写if __name__ == ‘__main__’ :语句的下面,才能正常使用Windows下的进程模块.Unix/Linux下则不需要. Pool类 Pool类可以提供指定数量的进程供用户调用,当有新的请求提交到Pool中时,如果池还没有满,就会创建一个新的进程来执行请求.如果池满,请求就会告知先等待,直到池中有进程结束, 才会…
在写多进程的时候我发现一个问题,用Pool的apply_async(异步非阻塞)的时候传入实例函数会出错,或者说是子进程被跳过似的感觉(python2.7). 但是用python3.7的话没有任何问题. code: # -*- coding:utf-8 -*- import multiprocessing import os import time class A(object): def __init__(self): pass @staticmethod def func(msg): pri…
# -*- coding: utf- -*- """ Created on Thu Mar :: @author: lilide """ #import time import requests from concurrent.futures import ProcessPoolExecutor def fetch_request(url): result = requests.get(url) #print(result.text) retur…
进程池: 每一个进程在启动一个子进程时都会克隆一分数据,并开启额外一份内存空间,如果多次开启子进程,对内存的开销比较大,这里可以通过进程池来控制进程的最大个数,来解决.   进程池中有两个方法: apply #串行 apply_async #并行 回调callback: 可以启动10台机器批量进行数据库备份,每个进程执行完毕后在数据库内写入一条日志,可以使用回调写入,回调是由主进程执行的,所以只进行一次链接就可以并发帮子进程写入日志,而不需要进行重复的链接. # windows下的多进程参数 #…
之前文章对python中进程池的原理.数据流以及应用从代码角度做了简单的剖析,现在让我们回头看看标准库中对进程池的实现都有哪些值得我们学习的地方.我们知道,进程池内部由多个线程互相协作,向客户端提供可靠的服务,那么这些线程之间是怎样做到数据共享与同步的呢?在客户端使用apply/map函数向进程池分配任务时,使用self._taskqueue来存放任务元素,_taskqueue定义为Queue.Queue(),这是一个python标准库中的线程安全的同步队列,它保证通知时刻只有一个线程向队列添加…
之前文章中介绍了python中multiprocessing模块中自带的进程池Pool,并对进程池中的数据结构和各个线程之间的合作关系进行了简单分析,这节来看下客户端如何对向进程池分配任务,并获取结果的. 我们知道,当进程池中任务队列非空时,才会触发worker进程去工作,那么如何向进程池中的任务队列中添加任务呢,进程池类有两组关键方法来创建任务,分别是apply/apply_async和map/map_async,实际上进程池类的apply和map方法与python内建的两个同名方法类似,ap…
python中两个常用来处理进程的模块分别是subprocess和multiprocessing,其中subprocess通常用于执行外部程序,比如一些第三方应用程序,而不是Python程序.如果需要实现调用外部程序的功能,python的psutil模块是更好的选择,它不仅支持subprocess提供的功能,而且还能对当前主机或者启动的外部程序进行监控,比如获取网络.cpu.内存等信息使用情况,在做一些自动化运维工作时支持的更加全面.multiprocessing是python的多进程模块,主要…
进程池 import multiprocessing import time def do_calculation(data): print(multiprocessing.current_process().name + " " + str(data)) time.sleep(3) return data * 2 def start_process(): print ('Starting', multiprocessing.current_process().name) if __n…
当需要创建的子进程数量不多时,可以直接利用multiprocessing中的Process动态成生多个进程,但如果是上百甚至上千个目标,手动的去创建进程的工作量巨大,此时就可以用到multiprocessing模块提供的Pool方法. 初始化Pool时,可以指定一个最大进程数,当有新的请求提交到Pool中时,如果池还没有满,那么就会创建一个新的进程用来执行该请求:但如果池中的进程数已经达到指定的最大值,那么该请求就会等待,直到池中有进程结束,才会用之前的进程来执行新的任务,请看下面的实例: im…
为什么会进行池化? 一切都是为了效率,每次开启进程都会分配一个属于这个进程独立的内存空间,开启进程过多会占用大量内存,系统调度也会很慢,我们不能无限的开启进程. 进程池原来大概如下图 假设有100个任务 ,如果不使用进程池就需要创建100个进程.但是使用进程池假设进程池里有25个进程,那么100个任务 每个都从进程池分配一个进程执行,如果进程池为空就会等待别的任务完成归还进程再分配进程执行任务. 更高级的进程池,会根据任务数量自动收缩和扩充进程池大小,不过python暂时不具备.我猜的原因是因为…
一.multiprocessing模块 multiprocessing模块提供了一个Process类来代表一个进程对象,multiprocessing模块像线程一样管理进程,这个是multiprocessing的核心,它与threading很相似,对多核CPU的利用率会比threading好的多 看一下Process类的构造方法: __init__(self, group=None, target=None, name=None, args=(), kwargs={}) 参数说明: group:…
进程.多进程.进程池 进程总概述 进程 from multiprocessing import Process import os # 子进程要执行的代码 def run_proc(name): print('Run child process %s (%s)...' % (name, os.getpid())) if __name__=='__main__': print('Parent process %s.' % os.getpid()) p = Process(target=run_pr…
本文转至http://www.cnblogs.com/kaituorensheng/p/4465768.html,在其基础上进行了一些小小改动. 在利用Python进行系统管理的时候,特别是同时操作多个文件目录,或者远程控制多台主机,并行操作可以节约大量的时间.当被操作对象数目不大时,可以直接利用multiprocessing中的Process动态成生多个进程,十几个还好,但如果是上百个,上千个目标,手动的去限制进程数量却又太过繁琐,此时可以发挥进程池的功效.Pool可以提供指定数量的进程供用户…
一般我们是通过动态创建子进程(或子线程)来实现并发服务器的,但是会存在这样一些缺点: 1.动态创建进程(或线程)比较耗费时间,这将导致较慢的服务器响应.  2.动态创建的子进程通常只用来为一个客户服务,这样导致了系统上产生大量的细微进程(或线程).进程和线程间的切换将消耗大量CPU时间.  3.动态创建的子进程是当前进程的完整映像,当前进程必须谨慎的管理其分配的文件描述符和堆内存等系统资源,否则子进程可能复制这些资源,从而使系统的可用资源急剧下降,进而影响服务器的性能. 所以呢,就引入了进程池与…
# -*- coding: utf-8 -*-import requests,osfrom lxml import etreeimport multiprocessingfrom retrying import retry# 创建地址池urllist = ["http://www.zhuangxiule.cn/c{}p{}/".format(i,x) for i in range(16,26) for x in range(0,25)]@retry(stop_max_attempt_n…
import os,time,random from multiprocessing import Pool def task(name): print('正在运行的任务:%s,PID:(%s)'%(name,os.getpid())) start=time.time() time.sleep(random.random()*10) end=time.time() print('任务:%s,用时:%0.2f 秒'%(name,(end-start))) if __name__=='__main_…
''' 进程池,启动一个进程就要克隆一份数据,假设父进程1G,那么启动进程开销很大 避免启动太多造成系统瘫痪,就有进程池,即同一时间允许的进程数量 ps:线程没有池,因为线程启动开销小,线程有类似信号量来控制 ''' ''' windows上必须加语句: if __name__ == '__main__': freeze_support() ''' from multiprocessing import Pool,freeze_support import time import os def…
进程池: 进程池的使用有四种方式:apply_async.apply.map_async.map.其中apply_async和map_async是异步的,也就是启动进程函数之后会继续执行后续的代码不用等待进程函数返回.apply_async和map_async方式提供了一写获取进程函数状态的函数:ready().successful().get(). PS:join()语句要放在close()语句后面.   实例代码如下: # -*- coding: utf-8 -*- import multi…
import os from multiprocessing import Pool,Process def f1(n): print('进程池里面的进程id',os.getpid()) print('>>>>',n) return n*n def call_back_func(asdf): print('>>>>>>>>>>>>>',os.getpid()) print('回调函数中的结果:',asdf…
import time from multiprocessing import Process,Pool def f1(n): time.sleep(0.5) # print(n) return n*n if __name__ == '__main__': pool = Pool(4) res_list = [] for i in range(10): print('xxxx') #异步给进程池提交任务 res = pool.apply_async(f1,args=(i,)) res_list.…
import time from multiprocessing import Process,Pool def f1(n): time.sleep(0.5) # print(n) return n*n if __name__ == '__main__': pool = Pool(4) # pool.apply(f1,args=(2,)) #同步方法 res_list = [] for i in range(10): # print('任务%s'%i) #进程池的同步方法,将任务变成了串行 #…
from multiprocessing import Pool,Process import time,os def Foo(a):#创建函数 time.sleep(2) print('in the process:',os.getpid(),os.getppid()) return a+100 def bar(arga):#创建函数 print('---->',arga) if __name__ == '__main__': print('父进程ID:',os.getpid()) pool…
进程池子 当你成千上万的业务需要创建成千上万的进程时,我们可以提前定义一个进程池 from multiprocessing import Pool p = Pool(10) #进程池创建方式,类似空任务队列 p.apply(func,args) #阻塞 func:func指明该进程池种的进程要工作的函数 args:不定长接收进程池中进程工作函数的参数 p.apply_async(func,args) #非阻塞方式 func:func指明该进程池种的进程要工作的函数 args:不定长接收进程池中进…
进程同步 进程的数据是独立存在的,进程也能加锁. from multiprocessing import Process, Lock def f(l,i): l.acquire() print('hello world',i) l.release() if __name__ =='__main__': lock = Lock() #获得锁的实例 for i in range(10): Process(target=f,args=(lock,i)).start() #启动进程,并且把锁的实例传到进…
1.进程池与线程池: 为什么要用“池”:池子使用来限制并发的任务数目,限制我们的计算机在一个自己可承受的范围内去并发地执行任务 池子内什么时候装进程:并发的任务属于计算密集型 池子内什么时候装线程:并发的任务属于IO密集型 1.进程池 from concurrent.futures import ProcessPoolExecutor,ThreadPoolExecutor import time,os,random def task(x): print('%s 接客' %os.getpid())…
from concurrent.futures import ProcessPoolExecutor import os,random def func(name): print("%s吃了又一碗饭:%s" %(name,os.getpid())) time.sleep(random.randint(1, 3)) if __name__ == "__main__": p = ProcessPoolExecutor(3) #创建一个进程池,里面容纳3个进程 for i…
1.进程锁:from multiprocessing import Process, Lock def f(l, i): l.acquire() print('hello world', i) l.release() if __name__ == '__main__': lock = Lock() for num in range(10): Process(target=f, args=(lock, num)).start() 2.进程池:from multiprocessing import…
今天闲,测试了下concurrent.futures 模块中的ThreadPoolExecutor,ProcessPoolExecutor. 对开不同的数量的进程池和任务量时,所耗时间. from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor import requests import time,os def get_page(url): #print('<%s> is getting [%s]'%(os.g…
多进程中各个进程间相互隔离,进程间通信需要使用到通道. 多进程中使用Queue实现进程中通信 from multiprocessing import Process,Queue import time ,random def f(q, ): for i in range(10): n = q.get() n+=1 q.put( n) print("计数",n) print('subpro',id(q)) time.sleep(random.random()) if __name__==…