multiprocessing- 基于进程的并行性

介绍

multiprocessing是一个使用类似于threading模块的API支持生成进程的包。该multiprocessing软件包提供本地和远程并发，通过使用子进程而不是线程有效地支持全局解释器锁。multiprocessing模块充分利用给定机器上的多个处理器。它可以在Unix和Windows上运行。

该multiprocessing模块还引入了threading模块中没有模拟的API 。一个主要的例子是该 Pool对象提供了一种方便的方法，可以跨多个输入值并行化函数的执行，跨过程分配输入数据（数据并行）。以下示例演示了在模块中定义此类函数的常见做法，以便子进程可以成功导入该模块。这个数据并行的基本例子使用Pool

from multiprocessing import Pool

def f(x):

    return x*x

if __name__ == '__main__':

    with Pool(5) as p:

        print(p.map(f, [1, 2, 3]))

>>>[1, 4, 9]

#encoding:utf-8

# __author__ = 'donghao'

# __time__ = 2019/4/1 11:27

from multiprocessing import Pool

import time

import os

# 进程池

# 大量进程创建，使用pool的方法

def worker(msg):

    start = time.time()

    print('%s开始执行，进程号%d'%(msg,os.getpid()))

    time.sleep(1)

    end = time.time()

    print('耗时%0.2f'%(end-start))

if __name__ == '__main__':

    po = Pool(3)

    for i in range(10):

        po.apply_async(worker, (i,))

    print('——tart____')

    po.close()  # 关闭进程池，关闭后不再接受新的请求

    po.join()  # 等待所有的子进程执行完成，必须放到close之后

apply_async(func[, args[, kwds[, callback]]]) 它是非阻塞，apply(func[, args[, kwds]])是阻塞的

close() 关闭pool，使其不在接受新的任务。

terminate() 结束工作进程，不在处理未完成的任务。

join() 主进程阻塞，等待子进程的退出， join方法要在close或terminate之后使用。

Process

在multiprocessing，通过创建Process 对象然后调用其start()方法来生成进程。 Process 遵循API的threading.Thread

from multiprocessing import Process

def f(name):

    print('hello', name)

if __name__ == '__main__':

    p = Process(target=f, args=('bob',))

    p.start()

    p.join()

显示所涉及的各个进程ID

from multiprocessing import Process

import os

def info(title):

    print(title)

    print('module name:', __name__)

    print('父进程:', os.getppid())

    print('进程:', os.getpid())

def f(name):

    info('函数 f')

    print('我是', name)

if __name__ == '__main__':

    info('main line')

    p = Process(target=f, args=('鲁班七号',))

    p.start()

    p.join()

>>>

main line

module name: __main__

父进程: 1668

进程: 1368

函数 f

module name: __mp_main__

父进程: 1368

进程: 4644

我是 鲁班七号

multiprocessing 支持进程之间的两种通信

队列

这个Queue是近乎克隆的queue.Queue。例如：

from multiprocessing import Process, Queue

def f(q):

    q.put(['鲁班七号', '妲己', '后裔'])

if __name__ == '__main__':

    q = Queue()

    p = Process(target=f, args=(q,))

    p.start()

    print(q.get())    # prints ['鲁班七号', '妲己', '后裔']

    p.join()

队列是线程和进程安全的。

管道

from multiprocessing import Process, Pipe

def f(conn):

    conn.send(['鲁班七号', '妲己', '后裔'])

    conn.close()

if __name__ == '__main__':

    parent_conn,child_conn = Pipe()

    p = Process(target=f,args=(child_conn,))

    p.start()

    print(parent_conn.recv())

    p.join()

    parent_conn.close()

返回的两个连接对象Pipe()表示管道的两端。每个连接对象都有send()和 recv()方法（以及其他）。请注意，如果两个进程（或线程）同时尝试读取或写入管道的同一端，则管道中的数据可能会损坏。当然，同时使用管道的不同端的进程不存在损坏的风险

进程间的同步

multiprocessing包含所有同步原语的等价物threading。例如，可以使用锁来确保一次只有一个进程打印到标准输出：

from multiprocessing import Process, Lock

def f(l, i):

    print('hello world', i)

if __name__ == '__main__':

    lock = Lock()

    for num in range(10):

        Process(target=f, args=(lock, num)).start()

不使用来自不同进程的锁输出容易被混淆。

进程间共享状态

在进行并发编程时，通常最好尽量避免使用共享状态。使用多个进程时尤其如此。

但是，如果您确实需要使用某些共享数据，那么 multiprocessing提供了几种方法。

共享内存

可以使用Value或将数据存储在共享存储器映射中Array。例如，以下代码

from multiprocessing import Process, Value, Array

def f(n, a):

    n.value = 3.1415927

    for i in range(len(a)):

        a[i] = -a[i]

if __name__ == '__main__':

    num = Value('d', 0.0)

    arr = Array('i', range(10))

    p = Process(target=f, args=(num, arr))

    p.start()

    p.join()

    print(num.value)

    print(arr[:])

>>>

3.1415927

[0, -1, -2, -3, -4, -5, -6, -7, -8, -9]

服务器进程

Manager()控制器返回的管理器对象控制一个服务器进程，该进程保存Python对象并允许其他进程使用代理操作它们

通过返回的经理Manager()将支持类型

list，dict，Namespace，Lock， RLock，Semaphore，BoundedSemaphore， Condition，Event，Barrier， Queue，Value和Array

例如

from multiprocessing import Process, Manager

def f(d, l, kills):

    d['name'] = '程咬金'

    d['slogan'] = '真男人，必须要有强健的肌肉，身体和精神'

    d['装备'] = None

    l.reverse()

    kills.append('后裔')

if __name__ == '__main__':

    with Manager() as manager:

        d = manager.dict()

        l = manager.list(range(10))

        kills = manager.list(['达摩','鲁班七号'])

        p = Process(target=f, args=(d, l, kills))

        p.start()

        p.join()

        print(d)

        print(l)

        print(kills)

>>>

{'name': '程咬金', 'slogan': '真男人，必须要有强健的肌肉，身体和精神', '装备': None}

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

['达摩', '鲁班七号', '后裔']

服务器进程管理器比使用共享内存对象更灵活，因为它们可以支持任意对象类型。此外，单个管理器可以通过网络由不同计算机上的进程共享。但是，它们比使用共享内存慢。

daemon程序

# 不加daemon属性

import multiprocessing

import time

def worker(interval):

    print("work start:{0}".format(time.ctime()))

    time.sleep(interval)

    print("work end:{0}".format(time.ctime()))

if __name__ == "__main__":

    p = multiprocessing.Process(target = worker, args = (3,))

    p.start()

    print("end!")

>>>

end!

work start:Mon Apr  1 16:08:40 2019

work end:Mon Apr  1 16:08:43 2019

#加上daemon属性

import multiprocessing

import time

def worker(interval):

    print("work start:{0}".format(time.ctime()))

    time.sleep(interval)

    print("work end:{0}".format(time.ctime()))

if __name__ == "__main__":

    p = multiprocessing.Process(target = worker, args = (3,))

    p.daemon = True

    p.start()

    print("end!")

>>>

end!

注：因子进程设置了daemon属性，主进程结束，它们就随着结束了。

Event用来实现进程间同步通信。

import multiprocessing

import time

def wait_for_event(e):

    print("wait_for_event: starting")

    e.wait()

    print("wairt_for_event: e.is_set()->" + str(e.is_set()))

def wait_for_event_timeout(e, t):

    print("wait_for_event_timeout:starting")

    e.wait(t)

    print("wait_for_event_timeout:e.is_set->" + str(e.is_set()))

if __name__ == "__main__":

    e = multiprocessing.Event()

    w1 = multiprocessing.Process(name = "block",

            target = wait_for_event,

            args = (e,))

    w2 = multiprocessing.Process(name = "non-block",

            target = wait_for_event_timeout,

            args = (e, 1))

    w1.start()

    w2.start()

    time.sleep(5)

    e.set()

    print("main: event is set")

>>>

wait_for_event: starting

wait_for_event_timeout:starting

wait_for_event_timeout:e.is_set->False

main: event is set

wairt_for_event: e.is_set()->True

文件拷贝器：

#encoding:utf-8

# __author__ = 'donghao'

# __time__ = 2019/4/1 14:14

from multiprocessing import pool,Manager,Queue

import os,time

def mycopy(old_file_name, new_file_name, filename, queue):

    f = open(old_file_name+'/' + filename,'rb')

    content = f.read()

    f.close()

    w = open(new_file_name+'/' + filename,'wb')

    w.write(content)

    w.close()

    queue.put(filename)

def main():

    old_file_name = input('请输入文件名称')

    path = os.listdir(old_file_name)

    length = len(path)

    po = pool.Pool(5)

    queue = Manager().Queue()

    try:

        new_file_name = old_file_name+'[副本]'

        os.mkdir(new_file_name)

    except:

        pass

    for filename in path:

        po.apply_async(mycopy,args=(old_file_name, new_file_name, filename, queue))

    po.close()

    copy_file_nums = 0

    while True:

        filename = queue.get()

        copy_file_nums += 1

        print('\r 拷贝进度: %0.2f %%'%(copy_file_nums*100/length),end='')

        if copy_file_nums >= length:

            break

    print('\n文件拷贝成功!')

    po.join()

if __name__ == '__main__':

    main()

multiprocessing- 基于进程的并行性的更多相关文章

13、多进程multiprocessing、进程池
内容相关: multiprocessing: 进程的创建与运行进程常用相关函数进程池: 为什么要有进程池进程池的创建与运行:串行.并行回调函数多进程multiprocessing: pyth ...
Python多进程库multiprocessing中进程池Pool类的使用[转]
from:http://blog.csdn.net/jinping_shi/article/details/52433867 Python多进程库multiprocessing中进程池Pool类的使用 ...
并发编程——多进程——multiprocessing开启进程的方式及其属性（3）
开启进程的两种方式——Process 方式一:函数方法 from multiprocessing import Process import time def task(name): print('% ...
基于进程的Quartz.NET管理系统QuartzService(一)
需求在处理定时任务大家可能都用过Quartz.NET,但在生产环境中大家肯定也遇到过如下的问题: 发布的时候需要停掉所有的Job,再整个一起打包发布没有管理界面(其实在github也有几个这方面的 ...
python的multiprocessing模块进程创建、资源回收-Process,Pool
python的multiprocessing有两种创建进程的方式,每种创建方式和进程资源的回收都不太相同,下面分别针对Process,Pool及系统自带的fork三种进程分析. 1.方式一:fork( ...
多任务fork、multiprocessing、进程池、进程间通信-Queue
并发:一个处理器同时处理多个任务. 并行:多个处理器或者是多核的处理器同时处理多个不同的任务. fork创建子进程 import os import time #fork出一个子进程,子进程也从这一行 ...
Python多进程库multiprocessing中进程池Pool类的使用
问题起因最近要将一个文本分割成好几个topic,每个topic设计一个regressor,各regressor是相互独立的,最后汇总所有topic的regressor得到总得预测结果.没错!类似ba ...
python之multiprocessing创建进程
python的multiprocessing模块是用来创建多进程的,下面对multiprocessing总结一下使用记录. multiprocessing创建多进程在windows和linux系统下的 ...
Python并行编程(十一)：基于进程的并行
1.基本概念多进程主要用multiprocessing和mpi4py这两个模块. multiprocessing是Python标准库中的模块,实现了共享内存机制,可以让运行在不同处理器核心的进程能读 ...

随机推荐

旅游类的APP原型模板分享——Priceline
Priceline是一款旅游服务的APP应用.功能有查找预订酒店.车票.机票等服务. 本原型由国产Mockplus(原型工具)和iDoc(智能标注,一键切图工具)提供. 先简单看看动图: 点击这里,可 ...
cookie设置和清除，解决跨目录读取不到cookie值
cookies.setCookie("UserType", result.UserType, null, '/'); cookies.deleteCookie("User ...
奇异值分解（SVD）
首先说明一下特征值:设A是n阶方阵,如果存在 λ 和n维非零向量X,使 AX = λX ,则 λ 称为方阵A的一个特征值,X为方阵A对应于或属于特征值 λ 的一个特征向量. AX = λX 的过程是一 ...
[gazebo-1] process has died [pid 22855, exit code 255,
[gazebo-1] process has died [pid 22855, exit code 255, cmd /opt/ros/kinetic/lib/gazebo_ros/gzserver ...
构建你的spring boot代码
Spring boot不需要任何特定的代码布局来工作.然而,有一些最佳实践可以帮助您. 1.避免使用缺省包当一个类不包含包声明时,它被认为是在“缺省包”中.“默认包”的使用通常是不鼓励的,应该避免. ...
【NIFI】 Apache NiFI 集群搭建
NiFI 集群介绍 NiFi集群架构 NiFi采用Zero-Master Clustering范例.集群中的每个节点对数据执行相同的任务,但每个节点都在不同的数据集上运行.其中一个节点自动选择(通过A ...
检索html页自生成&nasp;标签，并替换为空（即去掉空格）
在开发过程中,遇到这样的一种情况,就是页面有时候不知道什么原因会自动生成一些元素,从而打乱自己原有的一些布局. 原html页源代码: 生成后的html源代码: 可以明显看出自动生成了很多元素,现 ...
OvO
OvO 知乎网易云图书馆 B站小众软件 360极速浏览器下载开源下载工具下载地址1 下载地址2 下载地址3
java 排序算法
1.冒泡排序 public static void main(String[] args) { int[] arr={6,3,8,2,9,1}; System.out.println("排序 ...
sqlserver存储过程分页记录
USE [HK_ERP]GO/****** Object: StoredProcedure [dbo].[GetPageBillsByShopID] Script Date: 2018/10/30 1 ...

multiprocessing- 基于进程的并行性

multiprocessing- 基于进程的并行性的更多相关文章

随机推荐

热门专题