1、multiprocessing模块——跨平台版本的多进程模块

multiprocessing模块提供了一个Process类来代表一个进程对象,下面的例子演示了启动一个子进程并等待其结束:

from multiprocessing import Process
import os #子进程要执行的代码
def run_proc(name):
print('Run child process %s (%s)…'%(name , os.getpid())) if __name__=='__main__':
print('parent process %s.'%os.getpid())
p=Process(target=run_proc,args=('test',))
print('Child process will start')
p.start()
p.join()
print('Child process end') parent process 14960.
Child process will start
Run child process test (12496)…
Child process end

上述代码的说明:

1、父进程的进程ID的获取,通过os.getpid()

2、创建子进程时,用到了语句

p=Process(target=run_proc,args=('test',))

只需传入一个执行函数的函数名(如上文的run_proc)和函数的参数(args,注意一个参数时括号中的逗号),如此构造一个Process实例,并用start()启动。

join()方法可以等待子进程结束后继续往下执行,通常用于进程间的同步。

2、Pool

如果要创建大量进程,可以通过进程池的方式批量创建子进程:

from multiprocessing import Pool
import os,time,random def long_time_task(name):
print('run task %s (%s)'%(name,os.getpid()))
start=time.time()
time.sleep(random.random()*3)
end=time.time()
print('task %s runs %.2fs'%(name,end-start)) if __name__=='__main__':
print('parent process %s '%os.getpid())
p=Pool(4)
for i in range(5):
p.apply_async(long_time_task,args=(i,))
print('Waiting for all subprocesses done…')
p.close()
p.join()
print('All subprocesses done')
parent process 5280
Waiting for all subprocesses done…
run task 0 (2768)
run task 1 (12844)
run task 2 (15340)
run task 3 (7612)
task 1 runs 0.33s
run task 4 (12844)
task 0 runs 1.45s
task 2 runs 2.01s
task 3 runs 2.91s
task 4 runs 2.89s
All subprocesses done

上述代码的说明:

1、对Pool对象调用join()方法会等待所有子进程执行完毕,调用join()前必须先调用close(),调用close()后就不能再添加新的process了

2、输出结果中,task0,1,2,3是立即执行的,而task4要等前面的某个task执行完后才能执行,这是因为我们之前人为设置了Pool的大小为4,因此最多同时执行4个进程。这是人为根据需要制定的,并不是操作系统的限制,如果我们改为

p=Pool(5)

就可以同时跑5个进程。

Pool的默认大小是CPU的核数。

3、子进程subprocess

很多时候,子进程不是自身,而是一个外部进程。——暂未理解这句话啥意思

我们创建子进程后,还要控制子进程的输入和输出。

subprocess模块可以让我们非常方便地启动一个子进程,然后控制其输入输出。

举例:在Python代码中运行命令

nslookup www.python.org

来达到和命令行同时运行相同的效果。

import subprocess
print('$ nslookup www.python.org')
r=subprocess.call(['nslookup','www.python.org'])
print('Exit Code:',r)
$ nslookup www.python.org
��Ȩ��Ӧ��:
������: public1.114dns.com
Address: 114.114.114.114
����: dualstack.python.map.fastly.net
Addresses: 2a04:4e42:36::223
151.101.108.223
Aliases: www.python.org
Exit Code: 0

如果子进程还需要输入,则可以通过communicate()方法输入:

import subprocess
print('$nslookup www.python.org')
p=subprocess.Popen(['nslookup'],stdin=subprocess.PIPE,stdout=subprocess.PIPE,stderr=subprocess.PIPE)
output,err=p.communicate(b'set q=mx\npython.org\nexit\n')
print(output.decode('utf-8'))
print('Exit Code:',p.returncode)

其中

p.communicate(b'set q=mx\npython.org\nexit\n')

相当于在命令行执行命令nslookup,然后手动输入:

set q=mx
python.org
exit

4、进程间通信

Python的multiprocessing模块提供了Queue、Pipes等多种方式来交换数据。

以Queue为例,在父进程中创建两个子进程,一个往Queue中写数据,另一个从Queue中读数据:

from multiprocessing import Queue,Process
import os,time,random #写数据进程要执行的代码
def write(q):
print('Process to write:%s'%os.getpid())
for value in ['A','B','C']:
print('put %s to queue'%value)
q.put(value)
time.sleep(random.random()) #读数据进程执行的代码
def read(q):
print('Process to read:%s'%os.getpid())
while True:
value=q.get(True)
print('Get %s from queue.'%value) if __name__=='__main__':
#父进程创建Queue并传给各个子进程
q=Queue()
pw=Process(target=write,args=(q,))
pr=Process(target=read,args=(q,))
#启动子进程pw,写入
pw.start()
#启动子进程pr,读取
pr.start() #等待pw结束
pw.join()
#pr进程里是死循环,无法自行终止,只能强行结束
pr.terminate()

结果:

Process to write:2696
put A to queue
Process to read:7944
Get A from queue.
put B to queue
Get B from queue.
put C to queue
Get C from queue.

在Unix/Linux下,multiprocessing模块封装了fork()调用,使我们不需要关注fork()的细节。由于Windows没有fork调用,因此multiprocessing需要模拟出fork的效果,父进程中所有Python对象都必须通过pickle序列化再传到子进程中去,所以如果multiprocessing在Windows下失效了,要先考虑是不是pickle失败了

2020.9.28 多进程multiprocess 进程池pool 子进程subprocess 进程间通信的更多相关文章

  1. python学习笔记——multiprocessing 多进程组件 进程池Pool

    1 进程池Pool基本概述 在使用Python进行系统管理时,特别是同时操作多个文件目录或者远程控制多台主机,并行操作可以节约大量时间,如果操作的对象数目不大时,还可以直接适用Process类动态生成 ...

  2. Python多进程库multiprocessing中进程池Pool类的使用[转]

    from:http://blog.csdn.net/jinping_shi/article/details/52433867 Python多进程库multiprocessing中进程池Pool类的使用 ...

  3. Python多进程库multiprocessing创建进程以及进程池Pool类的使用

    问题起因最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似bag ...

  4. [转]Python多进程并发操作中进程池Pool的应用

    Pool类 在使用Python进行系统管理时,特别是同时操作多个文件目录或者远程控制多台主机,并行操作可以节约大量的时间.如果操作的对象数目不大时,还可以直接使用Process类动态的生成多个进程,十 ...

  5. Python多进程并发操作中进程池Pool的应用

    Pool类 在使用Python进行系统管理时,特别是同时操作多个文件目录或者远程控制多台主机,并行操作可以节约大量的时间.如果操作的对象数目不大时,还可以直接使用Process类动态的生成多个进程,十 ...

  6. python 进程池pool简单使用

    平常会经常用到多进程,可以用进程池pool来进行自动控制进程,下面介绍一下pool的简单使用. 需要主动是,在Windows上要想使用进程模块,就必须把有关进程的代码写if __name__ == ‘ ...

  7. python 使用进程池Pool进行并发编程

    进程池Pool 当需要创建的子进程数量不多时,可以直接利用multiprocessing中的Process动态成生多个进程,但如果是上百甚至上千个目标,手动的去创建进程的工作量巨大,此时就可以用到mu ...

  8. 多任务-进程之进程池Pool

    1.什么是池? 首先从字面上看,池代表着一个容器,用来承载着某些内容的容器,了解到这里,就对进程池有了一个初步的轮廓. 2.什么是进程池Pool? (1)利用现实中的事物来理解: 对于小白初学者,接触 ...

  9. Python 之并发编程之manager与进程池pool

    一.manager 常用的数据类型:dict list 能够实现进程之间的数据共享 进程之间如果同时修改一个数据,会导致数据冲突,因为并发的特征,导致数据更新不同步. def work(dic, lo ...

随机推荐

  1. 网络分层和TCP三次握手

    它们就是 OSI 的七层模型,和 TCP/IP 的四层 / 五层模型.这两种模型的最大区别,就是前者在传输层和应用层之间,还有会话层和表示层,而后者没有. TCP三次握手: 位码即tcp标志位,有6种 ...

  2. Linux身份鉴别机制原理

    传统的UNIX身份鉴别机制原理 传统的UNIX身份鉴别即口令认证方式,它主要通过识别用户的用户名或者UID号获取在/etc/shadow中存放的对应用户密码密文等信息,然后获取用户输入密码并采用cry ...

  3. 一劳永逸,解决.NET发布云服务器的时区问题

    国内大多数开发者使用的电脑,都是使用的北京时间,日常开发的过程中其实并没有什么不便:不过,等遇到了阿里云等云服务器,系统默认使用的时间大多为UTC时间,这个时候,时区和时间的问题,就是不容忽视的大问题 ...

  4. What Goes Up Must Come Down

    跳转链接 题目描述 给定一个序列, 求出将此序列变换为单调递增.单调递减 或者先增后减 样例1 输入 7 3 1 4 1 5 9 2 输出 3 样例2 输入 9 10 4 6 3 15 9 1 1 1 ...

  5. HBuilderX频繁关闭,导致启动不了?

    根据官方给出的指南(http://ask.dcloud.net.cn/article/35583),在我的电脑打开%appdata%下面的会有HBuilderX目录,把这个目录删除或改名就可以启动了:

  6. tcp 中 FLAGS字段,几个标识:SYN, FIN, ACK, PSH, RST, URG.

    在TCP层,有个FLAGS字段,这个字段有以下几个标识:SYN, FIN, ACK, PSH, RST, URG. 其中,对于我们日常的分析有用的就是前面的五个字段.它们的含义是: 1.SYN表示建立 ...

  7. JAVA多线程学习十-Callable与Future的应用

    Callable与Runnable 先说一下java.lang.Runnable吧,它是一个接口,在它里面只声明了一个run()方法: public interface Runnable { publ ...

  8. NFS(Network File System)即网络文件系统 (转)

    第1章 NFS介绍 1.1 NFS服务内容的概述 □ RPC服务知识概念介绍说明,以及RPC服务存在价值(必须理解掌握) □ NFS服务工作原理讲解(必须理解掌握) □ NFS共享文件系统使用原理讲解 ...

  9. go基础——运算符

    算数运算符 /* 算术运算符:+,-,*,/,%,++,-- */ a := 10 b := 3 sum := a + b //加减乘类似 fmt.Printf("%d + %d = %d\ ...

  10. C++输入多行数据

    动机 编程题常用需求,比如输入两行数据. 解决思路:使用getline 程序 #include <iostream> #include <vector> #include &l ...