Recurrent neural network (RNN)

import torch

import torch.nn as nn

import torchvision

import torchvision.transforms as transforms

# 配置GPU或CPU设置

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# 超参数设置

sequence_length = 28

input_size = 28

hidden_size = 128

num_layers = 2

num_classes = 10

batch_size = 100

num_epochs = 2

learning_rate = 0.01

# MNIST dataset

train_dataset = torchvision.datasets.MNIST(root='./data/',

                                           train=True,

                                           transform=transforms.ToTensor(),# 将PIL Image或者 ndarray 转换为tensor，并且归一化至[0-1]，归一化至[0-1]是直接除以255

                                           download=True)

test_dataset = torchvision.datasets.MNIST(root='./data/',

                                          train=False,

                                          transform=transforms.ToTensor())# 将PIL Image或者 ndarray 转换为tensor，并且归一化至[0-1]，归一化至[0-1]是直接除以255

# 训练数据加载，按照batch_size大小加载，并随机打乱

train_loader = torch.utils.data.DataLoader(dataset=train_dataset,

                                           batch_size=batch_size,

                                           shuffle=True)

# 测试数据加载，按照batch_size大小加载

test_loader = torch.utils.data.DataLoader(dataset=test_dataset,

                                          batch_size=batch_size,

                                          shuffle=False)

# Recurrent neural network (many-to-one) 多对一

class RNN(nn.Module):

    def __init__(self, input_size, hidden_size, num_layers, num_classes):

        super(RNN, self).__init__() # 继承 __init__ 功能

        self.hidden_size = hidden_size

        self.num_layers = num_layers

        self.lstm = nn.LSTM(input_size, hidden_size, num_layers, batch_first=True) # if use nn.RNN(), it hardly learns  LSTM 效果要比 nn.RNN() 好多了

        self.fc = nn.Linear(hidden_size, num_classes)

    def forward(self, x):

        # Set initial hidden and cell states

        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(device)

        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_size).to(device)

        # Forward propagate LSTM

        out, _ = self.lstm(x, (h0, c0))  # out: tensor of shape (batch_size, seq_length, hidden_size)

        # Decode the hidden state of the last time step

        out = self.fc(out[:, -1, :])

        return out

model = RNN(input_size, hidden_size, num_layers, num_classes).to(device)

print(model)

# RNN((lstm): LSTM(28, 128, num_layers=2, batch_first=True)

#     (fc): Linear(in_features=128, out_features=10, bias=True))

# 损失函数与优化器设置

# 损失函数

criterion = nn.CrossEntropyLoss()

# 优化器设置 ，并传入RNN模型参数和相应的学习率

optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# 训练模型

total_step = len(train_loader)

for epoch in range(num_epochs):

    for i, (images, labels) in enumerate(train_loader):

        images = images.reshape(-1, sequence_length, input_size).to(device)

        labels = labels.to(device)

        # 前向传播

        outputs = model(images)

        # 计算损失 loss

        loss = criterion(outputs, labels)

        # 反向传播与优化

        # 清空上一步的残余更新参数值

        optimizer.zero_grad()

        # 反向传播

        loss.backward()

        # 将参数更新值施加到RNN model的parameters上

        optimizer.step()

        # 每迭代一定步骤，打印结果值

        if (i + 1) % 100 == 0:

            print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'

                   .format(epoch + 1, num_epochs, i + 1, total_step, loss.item()))

# 测试模型

with torch.no_grad():

    correct = 0

    total = 0

    for images, labels in test_loader:

        images = images.reshape(-1, sequence_length, input_size).to(device)

        labels = labels.to(device)

        outputs = model(images)

        _, predicted = torch.max(outputs.data, 1)

        total += labels.size(0)

        correct += (predicted == labels).sum().item()

    print('Test Accuracy of the model on the 10000 test images: {} %'.format(100 * correct / total))

# 保存已经训练好的模型

# Save the model checkpoint

torch.save(model.state_dict(), 'model.ckpt')

Recurrent neural network (RNN) - Pytorch版的更多相关文章

Convolutional neural network (CNN) - Pytorch版
import torch import torch.nn as nn import torchvision import torchvision.transforms as transforms # ...
Recurrent Neural Network(循环神经网络)
Reference: Alex Graves的[Supervised Sequence Labelling with RecurrentNeural Networks] Alex是RNN最著名变种 ...
机器学习: Python with Recurrent Neural Network
之前我们介绍了Recurrent neural network (RNN) 的原理: http://blog.csdn.net/matrix_space/article/details/5337404 ...
Recurrent Neural Network系列2--利用Python，Theano实现RNN
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORKS T ...
Recurrent Neural Network系列3--理解RNN的BPTT算法和梯度消失
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 这是RNN教程的第三部分. 在前面的教程中,我们从头实现了一个循环 ...
循环神经网络（Recurrent Neural Network，RNN）
为什么使用序列模型(sequence model)?标准的全连接神经网络(fully connected neural network)处理序列会有两个问题:1)全连接神经网络输入层和输出层长度固定, ...
4.5 RNN循环神经网络（recurrent neural network）
自己开发了一个股票智能分析软件,功能很强大,需要的点击下面的链接获取: https://www.cnblogs.com/bclshuai/p/11380657.html 1.1 RNN循环神经网络 ...
Recurrent Neural Network系列1--RNN（循环神经网络）概述
作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORKS T ...
Recurrent Neural Network系列4--利用Python，Theano实现GRU或LSTM
yi作者:zhbzz2007 出处:http://www.cnblogs.com/zhbzz2007 欢迎转载,也请保留这段声明.谢谢! 本文翻译自 RECURRENT NEURAL NETWORK ...

随机推荐

常用命令备忘 xargs
xargs 作为使用率很高的命令,但是长久不用就会模糊了记忆,所以要记录下来. 获取所有的cobbler相关的布尔值然后全部设置为真 getsebool -a|grep cobbler|awk '{p ...
实体类（VO，DO，DTO，PO）的划分《转载---》
转载自:https://blog.csdn.net/u010722643/article/details/61201899 经常会接触到VO,DO,DTO的概念,本文从领域建模中的实体划分和项目中的实 ...
django部署后样式加载不出来解决方案
django部署后样式加载不出来 1.html文件去掉<!DOCTYPE html> 2. location /static { alias /home/static/; } 3.STAT ...
2018-2019-2 《网络对抗技术》Exp8 Web基础 20165326
Web基础实验要求本实践的要求: Web前端HTML,能正常安装.启停Apache.理解HTML,理解表单,理解GET与POST方法,编写一个含有表单的HTML. Web前端javascipt.理 ...
反编译pyinstaller打包的exe安装包
PyInstaller将Python文件打包为exe后如何反编译(破解源码)以及防止反编译在这里分享一些技巧和经验给大家.辛苦撰文分享,转载或引用请保留本文作者信息及文章链接. 作者的环境: win ...
PHP如何解决网站大流量与高并发的问题（一）
高并发的相关概念在某个时间点,有多少个访问量如果一个系统的日PV在千万以上,有可能是一个高并发的系统 QPS: 每秒钟请求或者查询的数量,在互联网领域,指每秒相应请求数(指HTTP请求) 吞吐量: ...
MFC调用CEF实现单页面单COOKIE管理《转》
cookie简单介绍 cookie存储了网站的一些很重要的信息,如用户身份信息.常用设置.设置地理位置等等各种信息.使用cef访问网站时,如果设置了CefSettings.cache_path参数,则 ...
shell编程系列16--文本处理三剑客之awk模式匹配的两种方法
shell编程系列16--文本处理三剑客之awk模式匹配的两种方法 awk的工作模式第一种模式匹配:RegExp 第二种模式匹配:关系运算匹配用法格式对照表语法格式含义 RegExp 按正则表 ...
Dart中的数据类型转换：
int -> string age.toString() string -> int int.parse('100'); String -> double 1 var onePoin ...
SpringCloud学习成长之十四服务注册(consul)
这篇文章主要介绍 spring cloud consul 组件,它是一个提供服务发现和配置的工具.consul具有分布式.高可用.高扩展性. 一.consul 简介 consul 具有以下性质: 服务 ...

Recurrent neural network (RNN) - Pytorch版

Recurrent neural network (RNN) - Pytorch版的更多相关文章

随机推荐

热门专题