Pytorch并行计算：nn.parallel.replicate, scatter, gather, parallel

import torch

import torch.nn as nn

import ipdb

class DataParallelModel(nn.Module):

    def __init__(self):

        super().__init__()

        self.block1 = nn.Linear(10, 20)

    def forward(self, x):

        x = self.block1(x)

        return x

def data_parallel(module, input, device_ids, output_device=None):

    if not device_ids:

        return module(input)

    if output_device is None:

        output_device = device_ids[0]

    replicas = nn.parallel.replicate(module, device_ids)

    print(f"replicas:{replicas}")

    inputs = nn.parallel.scatter(input, device_ids)

    print(f"inputs:{type(inputs)}")

    for i in range(len(inputs)):

        print(f"input {i}:{inputs[i].shape}")

    replicas = replicas[:len(inputs)]

    outputs = nn.parallel.parallel_apply(replicas, inputs)

    print(f"outputs:{type(outputs)}")

    for i in range(len(outputs)):

        print(f"output {i}:{outputs[i].shape}")

    result = nn.parallel.gather(outputs, output_device)

    return result

model = DataParallelModel()

x = torch.rand(16,10)

result = data_parallel(model.cuda(),x.cuda(), [0,1])

print(f"result:{type(result)}")

最后输出为

replicas:[DataParallelModel(

  (block1): Linear(in_features=10, out_features=20, bias=True)

), DataParallelModel(

  (block1): Linear(in_features=10, out_features=20, bias=True)

)]

inputs:<class 'tuple'>

input 0:torch.Size([8, 10])

input 1:torch.Size([8, 10])

outputs:<class 'list'>

output 0:torch.Size([8, 20])

output 1:torch.Size([8, 20])

result: torch.Size([16, 20])

可以看到整个流程如下：

replicas: 将模型复制若干份，这里只有两个GPU，所以复制两份
scatter: 将输入数据若干等分，这里划分成了两份，会返回一个tuple。因为batch size=16，所以刚好可以划分成8和8，那如果是15怎么办呢？没关系，它会自动划分成8和7，这个你自己可以做实验感受一下。
parallel_apply: 现在模型和数据都有了，所以当然就是并行化的计算咯，最后返回的是一个list，每个元素是对应GPU的计算结果。
gather：每个GPU计算完了之后需要将结果发送到第一个GPU上进行汇总，可以看到最终的tensor大小是[16,20],这符合预期。

Pytorch并行计算：nn.parallel.replicate, scatter, gather, parallel_apply的更多相关文章

JAVA NIO Scatter/Gather（矢量IO）
矢量IO=Scatter/Gather: 在多个缓冲区上实现一个简单的IO操作.减少或避免了缓冲区拷贝和系统调用(IO) write:Gather 数据从几个缓冲区顺序抽取并沿着通道发送,就好 ...
转:Java NIO系列教程(四) Scatter/Gather
Java NIO开始支持scatter/gather,scatter/gather用于描述从Channel(译者注:Channel在中文经常翻译为通道)中读取或者写入到Channel的操作.分散(sc ...
java的nio之：java的nio系列教程之Scatter/Gather
一:Java NIO的scatter/gather应用概念 ===>Java NIO开始支持scatter/gather,scatter/gather用于描述从Channel(译者注:Chann ...
Java基础知识强化之IO流笔记75：NIO之 Scatter / Gather
1. Java NIO开始支持scatter/gather,scatter/gather用于描述从Channel(译者注:Channel在中文经常翻译为通道)中读取或者写入到Channel的操作. 分 ...
Java NIO Scatter / Gather
原文链接:http://tutorials.jenkov.com/java-nio/scatter-gather.html Java NIO发布时内置了对scatter / gather的支持.sca ...
Java NIO中的通道Channel（二）分散/聚集 Scatter/Gather
什么是Scatter/Gather scatter/gather指的在多个缓冲区上实现一个简单的I/O操作,比如从通道中读取数据到多个缓冲区,或从多个缓冲区中写入数据到通道: scatter(分散): ...
NIO相关概念之Scatter / Gather
Scatter /Gather 是java NIO中用来对channel的读取或者写入操作的特殊的形式的描述 Scatter(发散) 是指在读操作的时候,从chanel读取到的数据,写入到多个buff ...
Java NIO系列教程（四） Scatter/Gather
Java NIO开始支持scatter/gather,scatter/gather用于描述从Channel(译者注:Channel在中文经常翻译为通道)中读取或者写入到Channel的操作.分散(sc ...
NIO学习笔记六：channel 之前数据传输及scatter/gather
在Java NIO中,如果两个通道中有一个是FileChannel,那你可以直接将数据从一个channel传输到另外一个channel. FileChannel的transferFrom()方法可以将 ...

随机推荐

MongoDB Shell 命令
更新列名 db.Stores.update({}, {$rename : {"StoreId" : "MetaId"}}, false, true) 查询长度 ...
《HeadFirts设计模式》笔记
定义在某种情境下,针对某些问题的某种解决方案. 设计模式 1.可拓展性强,方便维护,能够应付变化. 何时使用设计模式设计之前,还有在重构的时候. OOP 可复用,可扩充,可维护设计模式原则 1. ...
微信公众平台开发(150)——从新浪云SAE上传图片到图文消息
从新浪云SAE上传图片到图文消息,只能用于图文消息中, 没有个数限制 if (!empty($_FILES['qrcode']['name'])){ $filename = time()." ...
shell脚本监控阿里云专线网络状态，若不通通过触发阿里云的进程监控报警
#!/bin/bash while [ 1 ] do rtt=`ping -c 3 15.0.160.18 |grep rtt |awk '{print $4}' |awk -F'/' '{print ...
Python OpenCV4获取轮廓最大内切圆和外接圆
为了方便讲解,我们先来创建一个多边形做演示第一步:创建图像,并绘制一个六边形.代码和生成图像如下: # Create an image r = 100 src = np.zeros((4*r, 4* ...
码医自学法V2.2（附名老中医）
这段时间经常有网友微信公众号问我怎么入门'中医' 我贴下我自己的学习方法(仅供参考) 基础回顾:https://www.cnblogs.com/dunitian/p/7483038.html PS:自 ...
[转帖]SQL Server 2000~2017补丁包
SQL Server 2000~2017补丁包 https://www.cnblogs.com/VicLiu/p/11510510.html 最新更新 Product Version Latest S ...
@Valid参数验证 BindingResult result 的使用
1.首先导入依赖包bean-validator.jar2.在实体类上面写一些相关的验证信息:可以搜索更多的一些验证方式,这只是一部分可以参考:点击打开链接http://blog.csdn.net/c ...
OpenGL学习 (一) - 简单窗口绘制
一.OpenGL 简介 OpenGL 本质: OpenGL(Open Graphics Library),通常可以认为是API,其包含了一系列可以操作图形.图像的函数.但深究下来,它是由Khronos ...
用Python程序温度转换实例
实例:温度转换 (1)分析问题:利用程序进行温度转换,由用户输入温度值,程序给出输出结果:通过语音识别,图像识别等方法自动监听并获得温度信息发布渠道(如收音机.电视机)给出的温度播报源数据,再由程序装 ...

Pytorch并行计算：nn.parallel.replicate, scatter, gather, parallel_apply

Pytorch并行计算：nn.parallel.replicate, scatter, gather, parallel_apply的更多相关文章

随机推荐

热门专题