进程间通信

进程彼此之间互相隔离,要实现进程间通信(IPC),multiprocessing模块支持两种形式:队列和管道,这两种方式都是使用消息传递的。

进程队列queue

不同于线程queue,进程queue的生成是用multiprocessing模块生成的。

在生成子进程的时候,会将代码拷贝到子进程中执行一遍,及子进程拥有和主进程内容一样的不同的名称空间。

示例1:

 1 import multiprocessing
2 def foo():
3 q.put([11,'hello',True])
4 print(q.qsize())
5
6 q=multiprocessing.Queue() #全局定义一个q进程队列,在产生子进程时候会在子进程里生成,可以指定最大数,限制队列长度
7 if __name__ == '__main__':
8 p=multiprocessing.Process(target=foo,args=()) #因为名称空间不同,子进程的主线程创建的q队列,主进程get不到,所以会阻塞住
9 p.start()
10 # foo() #主进程执行一下函数就可以访问到了
11 print(q.get())

示例2:

 1 import multiprocessing
2
3 def foo():
4 q.put([11,'hello',True])
5 print(q.qsize())
6
7 if __name__ == '__main__':
8 q = multiprocessing.Queue() #主进程创建一个q进程队列
9 p=multiprocessing.Process(target=foo,args=()) #因为名称空间不同,子进程的主线程找不到q队列,所以会报错提示没有q
10 p.start()
11 print(q.get())

示例3:

 1 import multiprocessing
2
3 def foo(argument): #定义函数处理进程队列
4 argument.put([11,'hello',True])
5 print(argument.qsize())
6 q = multiprocessing.Queue() #全局定义一个进程队列
7 print('test')
8
9 if __name__ == '__main__':
10 x = multiprocessing.Queue() #主进程定义一个进程队列
11 p=multiprocessing.Process(target=foo,args=(x,)) #主进程把值传给子进程就可以处理了
12 p.start()
13 print(x.get())
14 # foo(q)
15 # print(q.get())

常用方法

q.put方法用以插入数据到队列中,put方法还有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,该方法会阻塞timeout指定的时间,直到该队列有剩余的空间。如果超时,会抛出Queue.Full异常。如果blocked为False,但该Queue已满,会立即抛出Queue.Full异常。
q.get方法可以从队列读取并且删除一个元素。同样,get方法有两个可选参数:blocked和timeout。如果blocked为True(默认值),并且timeout为正值,那么在等待时间内没有取到任何元素,会抛出Queue.Empty异常。如果blocked为False,有两种情况存在,如果Queue有一个值可用,则立即返回该值,否则,如果队列为空,则立即抛出Queue.Empty异常.
q.get_nowait():同q.get(False)
q.put_nowait():同q.put(False)
q.empty():调用此方法时q为空则返回True,该结果不可靠,比如在返回True的过程中,如果队列中又加入了项目。
q.full():调用此方法时q已满则返回True,该结果不可靠,比如在返回True的过程中,如果队列中的项目被取走。
q.qsize():返回队列中目前项目的正确数量,结果也不可靠,理由同q.empty()和q.full()一样

其他方法

q.cancel_join_thread():不会在进程退出时自动连接后台线程。可以防止join_thread()方法阻塞
q.close():关闭队列,防止队列中加入更多数据。调用此方法,后台线程将继续写入那些已经入队列但尚未写入的数据,但将在此方法完成时马上关闭。如果q被垃圾收集,将调用此方法。关闭队列不会在队列使用者中产生任何类型的数据结束信号或异常。例如,如果某个使用者正在被阻塞在get()操作上,关闭生产者中的队列不会导致get()方法返回错误。
q.join_thread():连接队列的后台线程。此方法用于在调用q.close()方法之后,等待所有队列项被消耗。默认情况下,此方法由不是q的原始创建者的所有进程调用。调用q.cancel_join_thread方法可以禁止这种行为

另一个创建进程队列的类

http://www.cnblogs.com/zero527/p/7211909.html

管道pipe

管道就是管道,就像生活中的管道,两头都能进能出

默认管道是全双工的,如果创建管道的时候映射成False,左边只能用于接收,右边只能用于发送,类似于单行道

最简单的管道双向通信示例:

 1 import multiprocessing
2
3 def foo(sk):
4 sk.send('hello world')
5 print(sk.recv())
6
7 if __name__ == '__main__':
8 conn1,conn2=multiprocessing.Pipe() #开辟两个口,都是能进能出,括号中如果False即单向通信
9 p=multiprocessing.Process(target=foo,args=(conn1,)) #子进程使用sock口,调用foo函数
10 p.start()
11 print(conn2.recv()) #主进程使用conn口接收
12 conn2.send('hi son') #主进程使用conn口发送

常用方法

conn1.recv():接收conn2.send(obj)发送的对象。如果没有消息可接收,recv方法会一直阻塞。如果连接的另外一端已经关闭,那么recv方法会抛出EOFError。
conn1.send(obj):通过连接发送对象。obj是与序列化兼容的任意对象
注意:send()和recv()方法使用pickle模块对对象进行序列化

其他方法

conn1.close():关闭连接。如果conn1被垃圾回收,将自动调用此方法,不用的时候两边都要close

conn1.fileno():返回连接使用的整数文件描述符

conn1.poll([timeout]):如果连接上的数据可用,返回True。timeout指定等待的最长时限。如果省略此参数,方法将立即返回结果。如果将timeout射成None,操作将无限期地等待数据到达。

conn1.recv_bytes([maxlength]):接收c.send_bytes()方法发送的一条完整的字节消息。maxlength指定要接收的最大字节数。如果进入的消息,超过了这个最大值,将引发IOError异常,并且在连接上无法进行进一步读取。如果连接的另外一端已经关闭,再也不存在任何数据,将引发EOFError异常。

conn.send_bytes(buffer [, offset [, size]]):通过连接发送字节数据缓冲区,buffer是支持缓冲区接口的任意对象,offset是缓冲区中的字节偏移量,而size是要发送字节数。结果数据以单条消息的形式发出,然后调用c.recv_bytes()函数进行接收    

conn1.recv_bytes_into(buffer [, offset]):接收一条完整的字节消息,并把它保存在buffer对象中,该对象支持可写入的缓冲区接口(即bytearray对象或类似的对象)。offset指定缓冲区中放置消息处的字节位移。返回值是收到的字节数。如果消息长度大于可用的缓冲区空间,将引发BufferTooShort异常。

注意:生产者和消费者都没有使用管道的某个端点,就应该将其关闭,如在生产者中关闭管道的右端,在消费者中关闭管道的左端。如果忘记执行这些步骤,程序可能再消费者中的recv()操作上挂起。管道是由操作系统进行引用计数的,必须在所有进程中关闭管道后才能生产EOFError异常。因此在生产者中关闭管道不会有任何效果,付费消费者中也关闭了相同的管道端点。

 from multiprocessing import Process,Pipe

 import time,os
def consumer(p,name):
left,right=p
left.close()
while True:
try:
baozi=right.recv()
print('%s 收到包子:%s' %(name,baozi))
except EOFError:
right.close()
break
def producer(seq,p):
left,right=p
right.close()
for i in seq:
left.send(i)
# time.sleep(1)
else:
left.close()
if __name__ == '__main__':
left,right=Pipe()
c1=Process(target=consumer,args=((left,right),'c1'))
c1.start()
seq=(i for i in range(10))
producer(seq,(left,right))
right.close()
left.close()
c1.join()
print('主进程') 生产者消费者关闭某端点

生产者消费者关闭某端点

共享数据manage

Queue和pipe只是实现了数据交互,并没实现数据共享,即一个进程去更改另一个进程的数据

注:进程间通信应该尽量避免使用共享数据的方式

共享数据:列表

 1 from multiprocessing import Manager,Process
2 def foo(l,i):
3 l.append(i**i)
4 if __name__ == '__main__':
5 man=Manager()
6 ml=man.list([11,22,33])
7 l=[]
8 for i in range(5):
9 p=Process(target=foo,args=(ml,i))
10 p.start()
11 l.append(p)
12 for i in l: #必须要join,不然会执行报错,处理一个数据必须要一个个来,不能同时处理一个数据
13 i.join()
14 print(ml)

共享数据:字典

 1 from multiprocessing import Manager,Process
2 def foo(d,k,v):
3 d[k]=v
4 if __name__ == '__main__':
5 man=Manager()
6 md=man.dict({'name':'bob'})
7 l=[]
8 for i in range(5):
9 p=Process(target=foo,args=(md,i,'a'))
10 p.start()
11 l.append(p)
12 for i in l: #必须要join,不然会执行报错,处理一个数据必须要一个个来,不能同时处理一个数据
13 i.join()
14 print(md)

进程池

开多进程是为了并发,通常有几个cpu核心就开几个进程,但是进程开多了会影响效率,主要体现在切换的开销,所以引入进程池限制进程的数量。

进程池内部维护一个进程序列,当使用时,则去进程池中获取一个进程,如果进程池序列中没有可供使用的进进程,那么程序就会等待,直到进程池中有可用进程为止。

示例:

 1 from multiprocessing import Pool
2 import time
3
4 def foo(n):
5 print(n)
6 time.sleep(1)
7
8 if __name__ == '__main__':
9 pool_obj=Pool(5) #
10 for i in range(47):
11 # pool_obj.apply_async(func=foo,args=(i,))
12 pool_obj.apply(func=foo,args=(i,)) #子进程的生成是靠进程池对象维护的
13 # apply同步,子进程一个个执行
14 # apply_async异步,多个子进程一起执行
15 pool_obj.close()
16 pool_obj.join()
17 print('ending')

常用方法:

pool_obj.apply(func [, args [, kwargs]]):在一个池工作进程中执行func(*args,**kwargs),然后返回结果。需要强调的是:此操作并不会在所有池工作进程中并执行func函数。如果要通过不同参数并发地执行func函数,必须从不同线程调用p.apply()函数或者使用p.apply_async()
pool_obj.apply_async(func [, args [, kwargs]]):在一个池工作进程中执行func(*args,**kwargs),然后返回结果。此方法的结果是AsyncResult类的实例,callback是可调用对象,接收输入参数。当func的结果变为可用时,将理解传递给callback。callback禁止执行任何阻塞操作,否则将接收其他异步操作中的结果。
pool_obj.close():关闭进程池,防止进一步操作。如果所有操作持续挂起,它们将在工作进程终止前完成
pool_obj.jion():等待所有工作进程退出。此方法只能在close()或teminate()之后调用

其他方法:

方法apply_async()和map_async()的返回值是AsyncResul的实例obj。实例具有以下方法
obj.get():返回结果,如果有必要则等待结果到达。timeout是可选的。如果在指定时间内还没有到达,将引发一场。如果远程操作中引发了异常,它将在调用此方法时再次被引发。
obj.ready():如果调用完成,返回True
obj.successful():如果调用完成且没有引发异常,返回True,如果在结果就绪之前调用此方法,引发异常
obj.wait([timeout]):等待结果变为可用。
obj.terminate():立即终止所有工作进程,同时不执行任何清理或结束任何挂起工作。如果p被垃圾回收,将自动调用此函数

协程

协程:是单线程下的并发,又称微线程,纤程。英文名Coroutine。

一句话说明什么是线程:协程是一种用户态的轻量级线程,即协程是由用户程序自己控制调度的。

协程能保留上一次调用时的状态(即所有局部状态的一个特定组合),每次过程重入时,就相当于进入上一次调用的状态,换种说法:进入上一次离开时所处逻辑流的位置。

注意:

  1. python的线程属于内核级别的,即由操作系统控制调度(如单线程一旦遇到io就被迫交出cpu执行权限,切换其他线程运行)

  2. 单线程内开启协程,一旦遇到io,从应用程序级别(而非操作系统)控制切换

协程优点:

  1.  协程的切换开销更小,属于程序级别的切换,操作系统完全感知不到,因而更加轻量级

  2. 单线程内就可以实现并发的效果,最大限度地利用cpu

协程缺点:

  1.协程的本质是单线程下,无法利用多核,可以是一个程序开启多个进程,每个进程内开启多个线程,每个线程内开启协程

  2.协程指的是单个线程,因而一旦协程出现阻塞,将会阻塞整个线程

yield实现协程并发

 1 import time
2 def consumer():
3 r=''
4 while True:
5 n=yield r
6 if not n:
7 return
8 print('[CONSUMER] ←← Consuming %s...' % n)
9 time.sleep(1)
10 r='200 Ok'
11
12 def produce(c):
13 next(c) #1.启动生成器
14 n=0
15 while n < 5:
16 n=n+1
17 print('[PRODUCER] →→ Producing %s...' % n)
18 cr=c.send(n)
19 #2.将n传入到consumer的对象,yield接收到传入值开始执行代码,遇到yield执行代码返回r的值
20 print('[PRODUCER] Consumer return: %s' % cr)
21 #3.produce没有值了,关闭整个过程
22 c.close()
23
24 if __name__ == '__main__':
25 c=consumer() #生成生成器对象
26 produce(c) #执行调用

greenlet框架实现协程(封装yield的基础库)

greenlet机制的主要思想是:生成器函数或者协程函数中的yield语句挂起函数的执行,直到稍后使用next()或send()操作进行恢复为止。可以使用一个调度器循环在一组生成器函数之间协作多个任务。greentlet是python中实现我们所谓的"Coroutine(协程)"的一个基础库。

示例1:

 1 from greenlet import  greenlet
2 def foo():
3 print('ok1')
4 g2.switch() #阻断
5 print('ok3')
6 g2.switch()
7 def bar():
8 print('ok2')
9 g1.switch()
10 print('ok4')
11
12 g1=greenlet(foo) #生成foo函数的greenlet对象
13 g2=greenlet(bar) #生成bar函数的greenlet对象
14 g1.switch() #1、执行g1对象,打印ok1
15 #2、遇到g2.switch(),转到g2执行打印ok2
16 #3、遇到g1.switch(),转到g1的阻断处继续执行打印ok3
17 #4、遇到g2.switch(),转到g2执行打印ok4

示例2:

 1 def eat(name):
2 print('%s eat food 1' %name)
3 gr2.switch('bob')
4 print('%s eat food 2' %name)
5 gr2.switch()
6 def play_phone(name):
7 print('%s play 1' %name)
8 gr1.switch()
9 print('%s play 2' %name)
10
11 gr1=greenlet(eat)
12 gr2=greenlet(play_phone)
13 gr1.switch(name='natasha')#可以在第一次switch时传入参数,以后都不需要

这种方法不会节省时间,因为不是io操作,而greenlet遇到io操作不会跳转,仍然要io阻断

基于greenlet框架的高级库gevent模块

gevent是第三方库,通过greenlet实现协程,其基本思想是:

当一个greenlet遇到IO操作时,比如访问网络,就自动切换到其他的greenlet,等到IO操作完成,再在适当的时候切换回来继续执行。由于IO操作非常耗时,经常使程序处于等待状态,有了gevent为我们自动切换协程,就保证总有greenlet在运行,而不是等待IO。

由于切换是在IO操作时自动完成,所以gevent需要修改Python自带的一些标准库,这一过程在启动时通过monkey patch完成:

简单示例:

 1 import gevent
2 def foo():
3 print('ok1')
4 gevent.sleep(4) #模拟io操作
5 print('ok3')
6 def bar():
7 print('ok2')
8 gevent.sleep(2)
9 print('ok4')
10
11 g1=gevent.spawn(foo)
12 g2=gevent.spawn(bar)
13 gevent.joinall([g1,g2]) #全部阻塞,或者单独一个个join

spawn括号内第一个参数是函数名,如foo,后面可以有多个参数,可以是位置实参或关键字实参,都是传给函数foo的

注意:

gevent.sleep(4)模拟的是gevent可以识别的io阻塞,

而time.sleep(2)或其他的阻塞,gevent是不能直接识别的需要用下面一行代码,打补丁,就可以识别了

1 #补丁
2 from gevent import monkey
3 monkey.patch_all()

必须放到被打补丁者的前面,如time,socket模块之前

或者我们干脆记忆成:要用gevent,需要将补丁放到文件的开头

爬虫示例:

 1 from gevent import monkey;monkey.patch_all()
2 import gevent
3 import requests
4 import time
5
6 def get_page(url):
7 print('GET: %s' %url)
8 response=requests.get(url)
9 if response.status_code == 200:
10 print('%d bytes received from %s' %(len(response.text),url))
11
12
13 start_time=time.time()
14 gevent.joinall([
15 gevent.spawn(get_page,'https://www.python.org/'),
16 gevent.spawn(get_page,'https://www.yahoo.com/'),
17 gevent.spawn(get_page,'https://github.com/'),
18 ])
19 stop_time=time.time()
20 print('run time is %s' %(stop_time-start_time))

python基础之进程间通信、进程池、协程的更多相关文章

  1. Python菜鸟之路:Python基础-线程、进程、协程

    上节内容,简单的介绍了线程和进程,并且介绍了Python中的GIL机制.本节详细介绍线程.进程以及协程的概念及实现. 线程 基本使用 方法1: 创建一个threading.Thread对象,在它的初始 ...

  2. Python基础—线程、进程和协程

    今天已是学习Python的第十一天,来干一碗鸡汤继续今天的内容,今天的鸡汤是:超越别人对你的期望.本篇博客主要介绍以下几点内容: 线程的基本使用: 线程的锁机制: 生产者消费之模型(队列): 如何自定 ...

  3. Python之线程、进程和协程

    python之线程.进程和协程 目录: 引言 一.线程 1.1 普通的多线程 1.2 自定义线程类 1.3 线程锁 1.3.1 未使用锁 1.3.2 普通锁Lock和RLock 1.3.3 信号量(S ...

  4. python自动化开发学习 进程, 线程, 协程

    python自动化开发学习 进程, 线程, 协程   前言 在过去单核CPU也可以执行多任务,操作系统轮流让各个任务交替执行,任务1执行0.01秒,切换任务2,任务2执行0.01秒,在切换到任务3,这 ...

  5. python GIL全局解释器锁,多线程多进程效率比较,进程池,协程,TCP服务端实现协程

    GIL全局解释器锁 ''' python解释器: - Cpython C语言 - Jpython java ... 1.GIL: 全局解释器锁 - 翻译: 在同一个进程下开启的多线程,同一时刻只能有一 ...

  6. python 四——线程、进程、协程

    内容概要 1.进程与线程优.缺点的比较 2.适用情况 3.线程 线程的创建 setDaemon join event RLock 队列 4.进程 创建进程 setDaemon join 线程与进程,数 ...

  7. python3多进程 进程池 协程并发

    一.进程           我们电脑的应用程序,都是进程,进程是资源分配的单位.进程切换需要的资源最大,效率低.         进程之间相互独立         cpu密集的时候适合用多进程 #多 ...

  8. Py修行路 python基础 (十二) 协程函数应用 列表生成式 生成器表达式

    一.知识点整理: 1.可迭代的:对象下有_iter_方法的都是可迭代的对象 迭代器:对象._iter_()得到的结果就是迭代器 迭代器的特性: 迭代器._next_() 取下一个值 优点: 1.提供了 ...

  9. Python的线程、进程和协程

    进程:一个进程就是一个正在运行的程序,它是计CPU分配资源的最小单位.每个进程都有自己独立的内存空间.能同时执行的进程数最多不超过内核数,也就是每个内核 同一时刻只能执行一个进程.那么多进程就是能[同 ...

  10. python基础----迭代器、生成器、协程函数及应用(面向过程实例)

    一.什么是迭代器协议 1.迭代器协议是指:对象必须提供一个next方法,执行该方法要么返回迭代中的下一项,要么就引起一个StopIteration异常,以终止迭代 (只能往后走不能往前退) 2.可迭代 ...

随机推荐

  1. docker-day1-安装和基本使用

    Docker 1.什么是docker Docker 是一个开源项目,可以实现轻量级的操作系统虚拟化解决方案. Docker 的基础是 Linux 容器(LXC)等技术.在 LXC 的基础上 Docke ...

  2. python接口测试-项目实践(四)拼接出预期结果

    四 字符串拼接 空值处理 当某字段接口数据为空,则不显示相关字串. 比如字串原本是 "...,净资产收益率:ROE%",当接口数据中ROE为空,不显示',净资产收益率:%' 三目运 ...

  3. 初学MillerRabin素数测试

    前言 \(MillerRabin\)素数测试是一种很实用的素数判定方法. 它只针对单个数字进行判定,因而可以对较大的乃至于\(long\ long\)范围内的数进行判定,而且速度也很快,是个十分优秀的 ...

  4. 【[SCOI2007]修车】

    题目 只能做网络流度日了 当然是要对每个修车的人拆点,把每个人拆成\(n\)个点用于接收不同时刻的车 每个车\(i\)向每个时刻\(k\)的人\(j\)连边,边权为\(t[i][j]*k\)这样就是这 ...

  5. 【洛谷P3853】 [TJOI2007]路标设置

    路标设置 题目链接 此题和跳石头很相似,都是二分答案,模拟判断是否可行 #include<iostream> #include<cstdio> using namespace ...

  6. 【luogu P1231 教辅的组成】 题解

    题目链接:https://www.luogu.org/problemnew/show/P1231 对于每本书只能用一次,所以拆点再建边 #include <queue> #include ...

  7. $_GET 与 $POST

    $_GET就是地址传值,用 '?' 开始传值,多个值间用 '&' 号分隔,多用于简单的传值,比如说看新闻需要新闻id一般就会用地址传值, $_GET的好处是传值可见,也就是只要一个地址就ok了 ...

  8. Vue nodejs商城-订单模块

    一.订单列表渲染 新建OrderConfirm.vue订单确认页面,添加路由 src/router/index.js添加路由 import OrderConfirm from '@/views/Ord ...

  9. sql*plus

    [sql*plus创建txt文档编辑sql语句] (1)创建一个txt,命名doc SQL> ed  doc;          /*ed   文件名*/ (2)在doc.txt文件编辑sql语 ...

  10. 【TOJ 3812】Find the Lost Sock(异或)

    描述 Alice bought a lot of pairs of socks yesterday. But when she went home, she found that she has lo ...