pytorch 中的重要模块化接口nn.Module

torch.nn 是专门为神经网络设计的模块化接口，nn构建于autgrad之上，可以用来定义和运行神经网络
nn.Module 是nn中重要的类，包含网络各层的定义，以及forward方法
对于自己定义的网络，需要注意以下几点：
1）需要继承nn.Module类，并实现forward方法，只要在nn.Module的子类中定义forward方法，backward函数就会被自动实现（利用autograd机制）
2）一般把网络中可学习参数的层放在构造函数中__init__()，没有可学习参数的层如Relu层可以放在构造函数中，也可以不放在构造函数中（在forward函数中使用nn.Functional）
3）在forward中可以使用任何Variable支持的函数，在整个pytorch构建的图中，是Variable在流动，也可以使用for，print，log等
4）基于nn.Module构建的模型中，只支持mini-batch的Variable的输入方式，如，N*C*H*W

代码示例：

class LeNet(nn.Module):

    def __init__(self):

        # nn.Module的子类函数必须在构造函数中执行父类的构造函数

        super(LeNet, self).__init__()  # 等价与nn.Module.__init__()

        # nn.Conv2d返回的是一个Conv2d class的一个对象，该类中包含forward函数的实现

        # 当调用self.conv1(input)的时候，就会调用该类的forward函数

        self.conv1 = nn.Conv2d(1, 6, (5, 5))  # output (N, C_{out}, H_{out}, W_{out})`

        self.conv2 = nn.Conv2d(6, 16, (5, 5))

        self.fc1 = nn.Linear(256, 120)

        self.fc2 = nn.Linear(120, 84)

        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):

        # F.max_pool2d的返回值是一个Variable， input:(10,1,28,28)  ouput:(10, 6, 12, 12)

        x = F.max_pool2d(F.relu(self.conv1(x)), (2, 2))

        # input:(10, 6, 12, 12)   output:(10,6,4,4)

        x = F.max_pool2d(F.relu(self.conv2(x)), (2, 2))

        # 固定样本个数，将其他维度的数据平铺，无论你是几通道，最终都会变成参数， output:(10, 256)

        x = x.view(x.size()[0], -1)

        # 全连接

        x = F.relu(self.fc1(x))

        x = F.relu(self.fc2(x))

        x = F.relu(self.fc3(x))

        # 返回值也是一个Variable对象

        return x

def output_name_and_params(net):

    for name, parameters in net.named_parameters():

        print('name: {}, param: {}'.format(name, parameters))

if __name__ == '__main__':

    net = LeNet()

    print('net: {}'.format(net))

    params = net.parameters()  # generator object

    print('params: {}'.format(params))

    output_name_and_params(net)

    input_image = torch.FloatTensor(10, 1, 28, 28)

    # 和tensorflow不一样，pytorch中模型的输入是一个Variable，而且是Variable在图中流动，不是Tensor。

    # 这可以从forward中每一步的执行结果可以看出

    input_image = Variable(input_image)

    output = net(input_image)

    print('output: {}'.format(output))

    print('output.size: {}'.format(output.size()))

pytorch 中的重要模块化接口nn.Module的更多相关文章

Pytorch中RoI pooling layer的几种实现
Faster-RCNN论文中在RoI-Head网络中,将128个RoI区域对应的feature map进行截取,而后利用RoI pooling层输出7*7大小的feature map.在pytorch ...
[转载]Pytorch中nn.Linear module的理解
[转载]Pytorch中nn.Linear module的理解本文转载并援引全文纯粹是为了构建和分类自己的知识,方便自己未来的查找,没啥其他意思. 这个模块要实现的公式是:y=xAT+*b 来源:h ...
PyTorch 中，nn 与 nn.functional 有什么区别？
作者:infiniteft链接:https://www.zhihu.com/question/66782101/answer/579393790来源:知乎著作权归作者所有.商业转载请联系作者获得授权, ...
『PyTorch x TensorFlow』第八弹_基本nn.Module层函数
『TensorFlow』网络操作API_上『TensorFlow』网络操作API_中『TensorFlow』网络操作API_下之前也说过,tf 和 t 的层本质区别就是 tf 的是层函数,调用即 ...
PyTorch官方中文文档：torch.nn
torch.nn Parameters class torch.nn.Parameter() 艾伯特(http://www.aibbt.com/)国内第一家人工智能门户,微信公众号:aibbtcom ...
『PyTorch』第十二弹_nn.Module和nn.functional
大部分nn中的层class都有nn.function对应,其区别是: nn.Module实现的layer是由class Layer(nn.Module)定义的特殊类,会自动提取可学习参数nn.Para ...
pytorch中torch.nn构建神经网络的不同层的含义
主要是参考这里,写的很好PyTorch 入门实战(四)--利用Torch.nn构建卷积神经网络卷积层nn.Con2d() 常用参数 in_channels:输入通道数 out_channels:输出 ...
Pytorch中Module,Parameter和Buffer的区别
下文都将torch.nn简写成nn Module: 就是我们常用的torch.nn.Module类,你定义的所有网络结构都必须继承这个类. Buffer: buffer和parameter相对,就是指 ...
Pytorch中nn.Conv2d的用法
Pytorch中nn.Conv2d的用法 nn.Conv2d是二维卷积方法,相对应的还有一维卷积方法nn.Conv1d,常用于文本数据的处理,而nn.Conv2d一般用于二维图像. 先看一下接口定义: ...

随机推荐

Jquery DataTables 获取表格数据及行数据
注意table变量是 1.jQuery DataTables 行号获取 $("#example tbody tr").on("click", function( ...
Centos使用LVS+keepalive 搭建集群原理详解
负载均衡集群是 load balance 集群的简写,翻译成中文就是负载均衡集群.常用的负载均衡开源软件有nginx.lvs.haproxy,商业的硬件负载均衡设备F5.Netscale.这里主要是学 ...
WebViewJavascriptBridge 进行js 与native通信。
1, iOS端加载web页面.开启日志并给webView建立JS与OC的桥梁 - (void)viewWillAppear:(BOOL)animated { if (_bridge) { retur ...
vue 实站技巧总结
多个页面都使用的到方法,放在 vue.prototype上会很方便刚接触 vue的时候做过一件傻事,因为封装了一个异步请求接口post,放在 post.js文件里面,然后在每个需要使用异步请求的页面 ...
select 与 time.After 配合使用的问题
今天在工作中发现了一个有趣的现象. 在一个select中设定了两个定时器,本来预计哪个定时器到达就运行相应指令的,但是发现最终只有时间最短的定时器一直得到执行,其它定时器完全没有得到执行. packa ...
Content of "Essential Software Test Design"
Content of "Essential Software Test Design" 2015-11-16 PART I 7 TEST DESIGN TECHNIQUES: AN ...
#pragma multi_compile_fwdbase会增加很多个shader variants
#pragma multi_compile_fwdbase是unity内置的用于前向渲染的关键字快捷方式,它包含了前向渲染光照计算需要的大多数关键字,因此会被shader带来很多的变体. 下面这个简单 ...
【ML入门系列】（一）训练集、测试集和验证集
训练集.验证集和测试集这三个名词在机器学习领域极其常见,但很多人并不是特别清楚,尤其是后两个经常被人混用. 在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train ...
查看和修改 mysql库、表、字段编码
查看编码查看数据库编码. show variables like '%char%'; 查看表编码 show create table <表名>; 例:show create table ...
我们正在招聘java工程师，想来美团工作吗？
我们希望你有? 1.3年以上Java服务器开发经验,精通Java及面向对象设计开发,熟悉主流web框架 2.熟悉网络编程,熟悉TCP/IP协议,熟悉互联网应用协议 3.有大规模分布式系统设计与开发经验 ...

pytorch 中的重要模块化接口nn.Module

pytorch 中的重要模块化接口nn.Module的更多相关文章

随机推荐

热门专题