一、Pytorch介绍

Pytorch 是Torch在Python上的衍生物

和Tensorflow相比：

Pytorch建立的神经网络是动态的，而Tensorflow建立的神经网络是静态的

Tensorflow的高度工业化，它的底层代码很难看懂

官网：http://pytorch.org/

Pytorch主要有两个模块：

一个是torch,一个是torchvision,torch是主模块，用来搭建神经网络。torchvision是辅模块，有数据库，还有一些已经训练好的神经网络等着你直接用比如（VGG,AlexNet,ResNet）

二、基础知识

1.与Numpy交互

（1）数据转换

import torch

import numpy as np

# 创建一个np array

a = np.array([[1,2], [3,4]])

b = torch.from_numpy(a)      # 根据np array创建torch 张量

c = b.numpy()                # 根据张量, 导出np array

(2)数据运算

torch中tensor的运算与numpy array运算相似，比如

np.abs()--->torch.abs()

np.sin()---->torch.sin()等

2.变量Variable

(1)Variable组成

在Torch中Variable由三部分组成：data部分是Torch的Tensor,grad部分是这个变量的梯度缓存区，creator部分是这个Variable的创造节点，如果用一个Variable进行计算，那返回的也是同类型的Variable

(2)使用

导入

import torch

from torch.autograd import Variable

定义Variable的同时有一项requires_grad是关于参不参与误差反向传播，要不要计算梯度

注意Variable 和Tensor的区别：

Variable计算时，它在后台默默地搭建着一个庞大地系统，叫做计算图。computional graph将所有地计算步骤（节点）都连接起来，最后进行误差反向传递地时候，一次性将所有Variable里面地修改梯度都计算出来，而tensor只是一个数据结构。

构建计算图

y = w * x + b # y = 2 * x + 3

（3）计算梯度

# 对y求梯度

y.backward()

# 打印一下各个变量的梯度

print(x.grad)    # y对x的梯度: x.grad = 2

print(w.grad)    # y对w的梯度: w.grad = 1

print(b.grad)    # y对b的梯度: b.grad = 1

（4）Variable里面地数据

直接print(variable)只会输出Variable形式地数据，在很多时候是用不了地（比如想要用plt绘图），所以我们要转换一下，将它变成tensor形式

获取tensor数据：Print（variable.data）,也可以将其转为numpy形式：print(variable.data.numpy())

3.Pytorch中的激活函数

导入包：import torch.nn.functional as F

平时常用的：relu、sigmoid,tanh,softplus

激活函数：激活函数的输入与输出都是variable

4.Pytorch中的数据加载器和batch

(1)生成数据生成并构建Dataset子集

import torch

import torch.utils.data as Data

torch.manual_seed(1)    

BATCH_SIZE = 5

x = torch.linspace(1, 10, 10)       # 输入数据

y = torch.linspace(10, 1, 10)       # 输出数据

# 打包成TensorDataset对象,成为标准数据集

torch_dataset = Data.TensorDataset(data_tensor=x, target_tensor=y)

（2）生成batch数据

PyTorch用类torch.utils.data.DataLoader加载数据，并对数据进行采样，生成batch迭代器

# 创建数据加载器

loader = Data.DataLoader(

    dataset=torch_dataset,      # TensorDataset类型数据集

    batch_size=BATCH_SIZE,      # mini batch size

    shuffle=True,               # 设置随机洗牌

    num_workers=2,              # 加载数据的进程个数

)

for epoch in range(3):   # 训练3轮

    for step, (batch_x, batch_y) in enumerate(loader):  # 每一步

        # 在这里写训练代码...

        print('Epoch: ', epoch, '| Step: ', step, '| batch x: ', batch_x.numpy(), '| batch y: ', batch_y.numpy())

6.GPU运算

Pytorch中使用GPU计算简单，通过调用.cuda()方法，很容易实现GPU支持

torch.cuda会记录当前选择的GPU，并且分配的所有CUDA张量将在上面创建

可以使用torch.cuda.device上下文管理器更改所选设备

7.加载预训练模型

import torchvision

# 下载并加载resnet.

resnet = torchvision.models.resnet18(pretrained=True)

# 如果你只想要finetune模型最顶层的参数

for param in resnet.parameters():

    # 将resent的参数设置成不更新

    param.requires_grad = False

# 把resnet的全连接层fc 替换成自己设置的线性层nn.Linear

# 比如说,输入维度是resnet.fc.in_features, 输出是100维

resnet.fc = nn.Linear(resnet.fc.in_features, 100) 

# 测试一下

images = Variable(torch.randn(10, 3, 256, 256))

outputs = resnet(images)

print (outputs.size())   # (10, 100)

8.简单回归

import torch

from torch.autograd import Variable

import matplotlib.pyplot as plt

torch.manual_seed(1)

x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1)  # 张量 x: (100, 1)

y = x.pow(2) + 0.2*torch.rand(x.size())                 # 加入噪声的张量 y: (100, 1)

# 将张量转为 Variable

x, y = Variable(x), Variable(y)

# 画一下

plt.scatter(x.data.numpy(), y.data.numpy())

plt.show()

class Net(torch.nn.Module):

    def __init__(self, n_feature, n_hidden, n_output):

        super(Net, self).__init__()

        self.hidden = torch.nn.Linear(n_feature, n_hidden)   # 隐层

        self.relu = torch.nn.ReLU()                          # 选择激活层

        self.predict = torch.nn.Linear(n_hidden, n_output)   # 输出层

    def forward(self, x):

        x = self.hidden(x)                                   # 计算隐层

        x = self.relu(x)                                     # 计算激活层

        x = self.predict(x)                                  # 输出层

        return x

net = Net(n_feature=1, n_hidden=10, n_output=1)              # 定义网络

print(net)

                                              #打印网络结构

# 选择损失函数和优化方法

loss_func = torch.nn.MSELoss()

optimizer = torch.optim.SGD(net.parameters(), lr=0.2)

plt.ion()   # hold住图

for t in range(100):

    prediction = net(x)                                      # 用网络预测一下

    loss = loss_func(prediction, y)                          # 计算损失

    optimizer.zero_grad()                                    # 清除上一步的梯度

    loss.backward()                                          # 反向传播, 计算梯度

    optimizer.step()                                         # 优化一步

    if t % 5 == 0:

        plt.cla()

        plt.scatter(x.data.numpy(), y.data.numpy())

        plt.plot(x.data.numpy(), prediction.data.numpy(), 'r-', lw=5)

        plt.text(0.5, 0, 'Loss=%.4f' % loss.data[0], fontdict={'size': 20, 'color': 'red'})

        plt.pause(1)

        print(t)

plt.ioff()

plt.show()

9.快速构建序列网络

torch.nn.Sequential是一个Sequential容器，模块将按照构造函数中传递的顺序添加到模块中。另外，也可以传入一个有序模块。

# Sequential使用实例

model = nn.Sequential(

          nn.Conv2d(1,20,5),

          nn.ReLU(),

          nn.Conv2d(20,64,5),

          nn.ReLU()

        )

# Sequential with OrderedDict使用实例

model = nn.Sequential(OrderedDict([

          ('conv1', nn.Conv2d(1,20,5)),

          ('relu1', nn.ReLU()),

          ('conv2', nn.Conv2d(20,64,5)),

          ('relu2', nn.ReLU())

        ]))

为了方便比较，我们先用普通方法搭建一个神经网络。


import torch

# 继承方式实现, 能够自定义forward

class ModuleNet(torch.nn.Module):

    def __init__(self, n_feature, n_hidden, n_output):

        super(ModuleNet, self).__init__()

        self.hidden = torch.nn.Linear(n_feature, n_hidden)   # 隐层

        self.relu = torch.nn.ReLU()                          # 选择激活层

        self.predict = torch.nn.Linear(n_hidden, n_output)   # 输出层

    def forward(self, x):

        x = self.hidden(x)                                   # 计算隐层

        x = self.relu(x)                                     # 计算激活层

        x = self.predict(x)                                  # 输出层

        return x

module_net = ModuleNet(1, 10, 1)

上面ModuleNet继承了一个torch.nn.Module中的神经网络结构, 然后对其进行了修改；接下来我们来使用torch.nn.Sequential来快速搭建一个神经网络。

#用序列化工具, 给予Pytorch 内部集成的网络层 快速搭建

seq_net = torch.nn.Sequential(

    torch.nn.Linear(1, 10),

    torch.nn.ReLU(),

    torch.nn.Linear(10, 1)

)

我们来打印一下2个神经网络的数据，查看区别:


print(module_net)     # 打印网络结构

"""

ModuleNet (

  (hidden): Linear (1 -> 10)

  (relu): ReLU ()

  (predict): Linear (10 -> 1)

)

"""

print(seq_net)        # 打印网络结构

"""

Sequential (

  (0): Linear (1 -> 10)

  (1): ReLU ()

  (2): Linear (10 -> 1)

)

"""

Pytorch(一)的更多相关文章

Ubutnu16.04安装pytorch
1.下载Anaconda3 首先需要去Anaconda官网下载最新版本Anaconda3(https://www.continuum.io/downloads),我下载是是带有python3.6的An ...
解决运行pytorch程序多线程问题
当我使用pycharm运行 (https://github.com/Joyce94/cnn-text-classification-pytorch ) pytorch程序的时候,在Linux服务器 ...
基于pytorch实现word2vec
一.介绍 word2vec是Google于2013年推出的开源的获取词向量word2vec的工具包.它包括了一组用于word embedding的模型,这些模型通常都是用浅层(两层)神经网络训练词向量 ...
基于pytorch的CNN、LSTM神经网络模型调参小结
(Demo) 这是最近两个月来的一个小总结,实现的demo已经上传github,里面包含了CNN.LSTM.BiLSTM.GRU以及CNN与LSTM.BiLSTM的结合还有多层多通道CNN.LSTM. ...
pytorch实现VAE
一.VAE的具体结构二.VAE的pytorch实现 1加载并规范化MNIST import相关类: from __future__ import print_function import argp ...
PyTorch教程之Training a classifier
我们已经了解了如何定义神经网络,计算损失并对网络的权重进行更新. 接下来的问题就是: 一.What about data? 通常处理图像.文本.音频或视频数据时,可以使用标准的python包将数据加载 ...
PyTorch教程之Neural Networks
我们可以通过torch.nn package构建神经网络. 现在我们已经了解了autograd,nn基于autograd来定义模型并对他们有所区分. 一个 nn.Module模块由如下部分构成:若干层 ...
PyTorch教程之Autograd
在PyTorch中,autograd是所有神经网络的核心内容,为Tensor所有操作提供自动求导方法. 它是一个按运行方式定义的框架,这意味着backprop是由代码的运行方式定义的. 一.Varia ...
Linux安装pytorch的具体过程以及其中出现问题的解决办法
1.安装Anaconda 安装步骤参考了官网的说明:https://docs.anaconda.com/anaconda/install/linux.html 具体步骤如下: 首先,在官网下载地址 h ...
Highway Networks Pytorch
导读本文讨论了深层神经网络训练困难的原因以及如何使用Highway Networks去解决深层神经网络训练的困难,并且在pytorch上实现了Highway Networks. 一 .Highway ...

随机推荐

jsp中判断对象是否存在
 <input type="text" id="userName" ...
jedis CodedInputStream encountered a malformed varint
原因:从redis数据库中根据String类型的参数取数据时报的异常解决方法:应该用字节数组读取低层次的数据,因为是我们自定义的一些对象格式,如图: 这样就不报错了,可以正常读取redis数据库中的 ...
async and await 简单的入门
如果有几个Uri,需要获取这些Uri的所有内容的长度之和,你会如何做? 很简单,使用WebClient一个一个的获取uri的内容长度,进行累加. 也就是说如果有5个Uri,请求的时间分别是:1s 2s ...
go context包的WithTimeout和WithCancel的使用
1.WaitGroup 它是一种控制并发的方式,它的这种方式是控制多个goroutine同时完成. func main() { var wg sync.WaitGroup wg.Add(2) go f ...
vsftpd服务tar包安装
一般如果有网络ubuntu直接apt-get install 安装vsftpd服务即可. 没网络只能下好vsftpd的tar包自己安装配置. 1. 解压 tar -xvf vsftpd-3.0.2.t ...
STM32F10x_模拟I2C读写EEPROM
Ⅰ.写在前面说到IIC,大家都应该不会陌生,我们初学单片机的时候或多或少都知道或了解过,甚至使用I2C控制过器件.但是,有多少人真正去深入理解,或者深入研究过I2C通信协议呢? 1.我们有必要学习I ...
JS——覆盖显示，点击显示三层
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
js移除某一类的div
(转载)Javascript removeChild()不能删除全部子节点的解决办法在Javascript中,只提供了一种删除节点的方法:removeChild().removeChild() ...
struts2中，Action通过什么方式获得用户从页面输入的数据，又是通过什么方式把其自身的数据传给视图的？
struts2中,Action通过什么方式获得用户从页面输入的数据,又是通过什么方式把其自身的数据传给视图的? 解答: 1)可以直接通过与表单元素相同名称的数据成员(需要存在符合命名规范set和get ...
JSP数据库连接成功
<%@ page language="java" contentType="text/html; charset=utf-8" pageEncoding= ...

Pytorch(一)

一、Pytorch介绍

二、基础知识

Pytorch(一)的更多相关文章

随机推荐

热门专题