pytorch构建优化器

这是莫凡python学习笔记。

1.构造数据，可以可视化看看数据样子

import torch

import torch.utils.data as Data

import torch.nn.functional as F

import matplotlib.pyplot as plt

%matplotlib inline

# torch.manual_seed(1)    # reproducible

LR = 0.01

BATCH_SIZE = 32

EPOCH = 12

# fake dataset

x = torch.unsqueeze(torch.linspace(-1, 1, 1000), dim=1)

y = x.pow(2) + 0.1*torch.normal(torch.zeros(*x.size()))

# plot dataset

plt.scatter(x.numpy(), y.numpy())

plt.show()

输出

2.构造数据集，及数据加载器

# put dateset into torch dataset

torch_dataset = Data.TensorDataset(x, y)

loader = Data.DataLoader(dataset=torch_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=2,)

3.搭建网络，以相应优化器命名

# default network

class Net(torch.nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.hidden = torch.nn.Linear(1, 20)   # hidden layer

        self.predict = torch.nn.Linear(20, 1)   # output layer

    def forward(self, x):

        x = F.relu(self.hidden(x))      # activation function for hidden layer

        x = self.predict(x)             # linear output

        return x

net_SGD         = Net()

net_Momentum    = Net()

net_RMSprop     = Net()

net_Adam        = Net()

nets = [net_SGD, net_Momentum, net_RMSprop, net_Adam]

4.构造优化器，此处共构造了SGD,Momentum,RMSprop,Adam四种优化器

# different optimizers

    opt_SGD         = torch.optim.SGD(net_SGD.parameters(), lr=LR)

    opt_Momentum    = torch.optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.8)

    opt_RMSprop     = torch.optim.RMSprop(net_RMSprop.parameters(), lr=LR, alpha=0.9)

    opt_Adam        = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99))

    optimizers = [opt_SGD, opt_Momentum, opt_RMSprop, opt_Adam]

5.定义损失函数，并开始迭代训练

　　 loss_func = torch.nn.MSELoss()

    losses_his = [[], [], [], []]   # record loss

    # training

    for epoch in range(EPOCH):

        print('Epoch: ', epoch)

        for step, (b_x, b_y) in enumerate(loader):          # for each training step

            for net, opt, l_his in zip(nets, optimizers, losses_his):

                output = net(b_x)              # get output for every net

                loss = loss_func(output, b_y)  # compute loss for every net

                opt.zero_grad()                # clear gradients for next train

                loss.backward()                # backpropagation, compute gradients

                opt.step()                     # apply gradients

                l_his.append(loss.data.numpy())     # loss recoder

6.画图，观察损失在不同优化器下的变化

    labels = ['SGD', 'Momentum', 'RMSprop', 'Adam']

    for i, l_his in enumerate(losses_his):

        plt.plot(l_his, label=labels[i])

    plt.legend(loc='best')

    plt.xlabel('Steps')

    plt.ylabel('Loss')

    plt.ylim((0, 0.2))

    plt.show()

输出

可以看到RMSprop和Adam的效果最好。

pytorch构建优化器的更多相关文章

[源码解析] PyTorch分布式优化器(1)----基石篇
[源码解析] PyTorch分布式优化器(1)----基石篇目录 [源码解析] PyTorch分布式优化器(1)----基石篇 0x00 摘要 0x01 从问题出发 1.1 示例 1.2 问题点 0 ...
[源码解析] PyTorch分布式优化器(2)----数据并行优化器
[源码解析] PyTorch分布式优化器(2)----数据并行优化器目录 [源码解析] PyTorch分布式优化器(2)----数据并行优化器 0x00 摘要 0x01 前文回顾 0x02 DP 之 ...
[源码解析] PyTorch分布式优化器(3)---- 模型并行
[源码解析] PyTorch分布式优化器(3)---- 模型并行目录 [源码解析] PyTorch分布式优化器(3)---- 模型并行 0x00 摘要 0x01 前文回顾 0x02 单机模型 2.1 ...
【小知识】神经网络中的SGD优化器和MSE损失函数
今天来讲下之前发的一篇极其简单的搭建网络的博客里的一些细节 (前文传送门) 之前的那个文章中,用Pytorch搭建优化器的代码如下: # 设置优化器 optimzer = torch.optim.SG ...
【机器学习的Tricks】随机权值平均优化器swa与pseudo-label伪标签
文章来自公众号[机器学习炼丹术] 1 stochastic weight averaging(swa) 随机权值平均这是一种全新的优化器,目前常见的有SGB,ADAM, [概述]:这是一种通过梯度下 ...
『PyTorch』第十一弹_torch.optim优化器
一.简化前馈网络LeNet import torch as t class LeNet(t.nn.Module): def __init__(self): super(LeNet, self).__i ...
Pytorch torch.optim优化器个性化使用
一.简化前馈网络LeNet 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 im ...
Pytorch实现MNIST（附SGD、Adam、AdaBound不同优化器下的训练比较） adabound实现
学习工具最快的方法就是在使用的过程中学习,也就是在工作中(解决实际问题中)学习.文章结尾处附完整代码. 一.数据准备在Pytorch中提供了MNIST的数据,因此我们只需要使用Pytorch提供 ...
pytorch 优化器调参
torch.optim 如何使用optimizer 构建为每个参数单独设置选项进行单次优化 optimizer.step() optimizer.step(closure) 算法如何调整学习率 ...

随机推荐

01-16委托Func
在类中编写方法: 在主函数中调用函数: 效果图:
10-12C#基础--运算符
10-12C#基础--运算符课前作业:班级内人数的姓名和年龄,分别写出之后并汇总. 一.运算符的分类 1.数学运算符(7个) 1)+(加号) 例: 2)-(减号) 例: 3)*(乘号) 例: 4)/ ...
C++深度解析教程学习笔记（2）C++中的引用
1.C++中的引用 (1)变量名的回顾 ①变量是一段实际连续存储空间的别名,程序中通过变量来申请并命名存储空间 ②通过变量的名字可以使用存储空间.(变量的名字就是变量的值,&变量名是取地址操作 ...
Webrtc服务器搭建<转>
http://blog.csdn.net/zqf_office/article/details/49851209
IntelliJ IDEA 导入Project
一.方式一 File---->Close Project 这样的户每次需要import,都要close一次,非常不方便,如果能在File下面岂不是更好? 二.方式二 File---->Se ...
使用GSON来生成JSON数据
第二种方法: 当不需要显示某个属性时,在不需要显示出的属性前加transient关键字即可满足使用gson来解析使用gson解析带日期转换集合类解析:gson中的数组与java中集合类都是对应 ...
Angular04 组件动态地从外部接收值、在组件中使用组件
一.组件从外部接收值 1 修改组件的ts文件,让组件的属性可以从外部接收值 1.1 导入Input注解对象 1.2 在属性变量前面添加 @Input() 注解 1.3 去掉构造器中的属性变量赋值语句 ...
li ol ul是什么的简写？
为了方便理解知识,我通常会对一些英语简写追根溯源,在火狐开发者社区里面找到了一些资料. li是 list item的简写不是list的简写 ol是ordered list的简写 ul是unordere ...
java开发中用到的技术（持续更新.....）
一.数据库 1.数据库连接池:当jdbc连接数据库使用DriverManager 获取时,每次向数据库建立连接的时候都要讲connection加载到内存中,当同时使用的用户数量较大时,会造成服务器不堪 ...
Git 之与Github交互
我们不可能只在一台电脑上开发,白天在公司用公司电脑,晚上在家可以用自己电脑.但是这个代码怎么让两台电脑同步呢?总不能用U盘复制粘贴.太繁琐. 这里我们就可以找个代码托管的平台,帮我们做这件事. Git ...

pytorch构建优化器

pytorch构建优化器的更多相关文章

随机推荐

热门专题