基于PyTorch实现MNIST手写字识别

本篇不涉及模型原理，只是分享下代码。想要了解模型原理的可以去看网上很多大牛的博客。

目前代码实现了CNN和LSTM两个网络，整个代码分为四部分：

Config：项目中涉及的参数；
CNN：卷积神经网络结构；
LSTM：长短期记忆网络结构；
TrainProcess：

模型训练及评估，参数model控制训练何种模型（CNN or LSTM）。

完整代码

—Talk is cheap, show me the code.

# -*- coding: utf-8 -*-

# @author: Awesome_Tang

# @date: 2019-04-05

# @version: python3.7

import torch

from torchvision import datasets, transforms

import torch.nn as nn

import torch.optim as optim

from torch.autograd import Variable

from datetime import datetime

class Config:

    batch_size = 64

    epoch = 10

    alpha = 1e-3

    print_per_step = 100  # 控制输出

class CNN(nn.Module):

    def __init__(self):

        super(CNN, self).__init__()

        """

        Conv2d参数：

        第一位：input channels  输入通道数

        第二位：output channels 输出通道数

        第三位：kernel size 卷积核尺寸

        第四位：stride 步长，默认为1

        第五位：padding size 默认为0，不补

        """

        self.conv1 = nn.Sequential(

            nn.Conv2d(1, 32, 3, 1, 2),

            nn.ReLU(),

            nn.MaxPool2d(2, 2)

        )

        self.conv2 = nn.Sequential(

            nn.Conv2d(32, 64, 5),

            nn.ReLU(),

            nn.MaxPool2d(2, 2)

        )

        self.fc1 = nn.Sequential(

            nn.Linear(64 * 5 * 5, 128),

            nn.BatchNorm1d(128),

            nn.ReLU()

        )

        self.fc2 = nn.Sequential(

            nn.Linear(128, 64),

            nn.BatchNorm1d(64),  # 加快收敛速度的方法（注：批标准化一般放在全连接层后面，激活函数层的前面）

            nn.ReLU()

        )

        self.fc3 = nn.Linear(64, 10)

    def forward(self, x):

        x = self.conv1(x)

        x = self.conv2(x)

        x = x.view(x.size()[0], -1)

        x = self.fc1(x)

        x = self.fc2(x)

        x = self.fc3(x)

        return x

class LSTM(nn.Module):

    def __init__(self):

        super(LSTM, self).__init__()

        self.lstm = nn.LSTM(

            input_size=28,

            hidden_size=64,

            num_layers=1,

            batch_first=True,

        )

        self.output = nn.Linear(64, 10)

    def forward(self, x):

        r_out, (_, _) = self.lstm(x, None)

        out = self.output(r_out[:, -1, :])

        return out

class TrainProcess:

    def __init__(self, model="CNN"):

        self.train, self.test = self.load_data()

        self.model = model

        if self.model == "CNN":

            self.net = CNN()

        elif self.model == "LSTM":

            self.net = LSTM()

        else:

            raise ValueError('"CNN" or "LSTM" is expected, but received "%s".' % model)

        self.criterion = nn.CrossEntropyLoss()  # 定义损失函数

        self.optimizer = optim.Adam(self.net.parameters(), lr=Config.alpha)

    @staticmethod

    def load_data():

        print("Loading Data......")

        """加载MNIST数据集，本地数据不存在会自动下载"""

        train_data = datasets.MNIST(root='./data/',

                                    train=True,

                                    transform=transforms.ToTensor(),

                                    download=True)

        test_data = datasets.MNIST(root='./data/',

                                   train=False,

                                   transform=transforms.ToTensor())

        # 返回一个数据迭代器

        # shuffle：是否打乱顺序

        train_loader = torch.utils.data.DataLoader(dataset=train_data,

                                                   batch_size=Config.batch_size,

                                                   shuffle=True)

        test_loader = torch.utils.data.DataLoader(dataset=test_data,

                                                  batch_size=Config.batch_size,

                                                  shuffle=False)

        return train_loader, test_loader

    def train_step(self):

        steps = 0

        start_time = datetime.now()

        print("Training & Evaluating based on '%s'......" % self.model)

        for epoch in range(Config.epoch):

            print("Epoch {:3}.".format(epoch + 1))

            for data, label in self.train:

                data, label = Variable(data.cpu()), Variable(label.cpu())

                # LSTM输入为3维，CNN输入为4维

                if self.model == "LSTM":

                    data = data.view(-1, 28, 28)

                self.optimizer.zero_grad()  # 将梯度归零

                outputs = self.net(data)  # 将数据传入网络进行前向运算

                loss = self.criterion(outputs, label)  # 得到损失函数

                loss.backward()  # 反向传播

                self.optimizer.step()  # 通过梯度做一步参数更新

                # 每100次打印一次结果

                if steps % Config.print_per_step == 0:

                    _, predicted = torch.max(outputs, 1)

                    correct = int(sum(predicted == label))  # 计算预测正确个数

                    accuracy = correct / Config.batch_size  # 计算准确率

                    end_time = datetime.now()

                    time_diff = (end_time - start_time).seconds

                    time_usage = '{:3}m{:3}s'.format(int(time_diff / 60), time_diff % 60)

                    msg = "Step {:5}, Loss:{:6.2f}, Accuracy:{:8.2%}, Time usage:{:9}."

                    print(msg.format(steps, loss, accuracy, time_usage))

                steps += 1

        test_loss = 0.

        test_correct = 0

        for data, label in self.test:

            data, label = Variable(data.cpu()), Variable(label.cpu())

            if self.model == "LSTM":

                data = data.view(-1, 28, 28)

            outputs = self.net(data)

            loss = self.criterion(outputs, label)

            test_loss += loss * Config.batch_size

            _, predicted = torch.max(outputs, 1)

            correct = int(sum(predicted == label))

            test_correct += correct

        accuracy = test_correct / len(self.test.dataset)

        loss = test_loss / len(self.test.dataset)

        print("Test Loss: {:5.2f}, Accuracy: {:6.2%}".format(loss, accuracy))

        end_time = datetime.now()

        time_diff = (end_time - start_time).seconds

        print("Time Usage: {:5.2f} mins.".format(time_diff / 60.))

if __name__ == "__main__":

    p = TrainProcess(model='CNN')

    p.train_step()

Peace~~

基于PyTorch实现MNIST手写字识别的更多相关文章

基于tensorflow的MNIST手写识别
这个例子,是学习tensorflow的人员通常会用到的,也是基本的学习曲线中的一环.我也是! 这个例子很简单,这里,就是简单的说下,不同的tensorflow版本,相关的接口函数,可能会有不一样哟.在 ...
基于tensorflow实现mnist手写识别（多层神经网络）
标题党其实也不多,一个输入层,三个隐藏层,一个输出层老样子先上代码导入mnist的路径很长,现在还记不住 import tensorflow as tf import tensorflow.exa ...
基于tensorflow的MNIST手写数字识别（二）--入门篇
http://www.jianshu.com/p/4195577585e6 基于tensorflow的MNIST手写字识别(一)--白话卷积神经网络模型基于tensorflow的MNIST手写数字识 ...
基于TensorFlow的MNIST手写数字识别-初级
一:MNIST数据集下载地址 MNIST是一个包含很多手写数字图片的数据集,一共4个二进制压缩文件分别是test set images,test set labels,training se ...
Tensorflow之基于MNIST手写识别的入门介绍
Tensorflow是当下AI热潮下,最为受欢迎的开源框架.无论是从Github上的fork数量还是star数量,还是从支持的语音,开发资料,社区活跃度等多方面,他当之为superstar. 在前面介 ...
用TensorFlow教你手写字识别
博主原文链接:用TensorFlow教你做手写字识别(准确率94.09%) 如需转载,请备注出处及链接,谢谢. 2012 年,Alex Krizhevsky, Geoff Hinton, and Il ...
Tensorflow编程基础之Mnist手写识别实验+关于cross_entropy的理解
好久没有静下心来写点东西了,最近好像又回到了高中时候的状态,休息不好,无法全心学习,恶性循环,现在终于调整的好一点了,听着纯音乐突然非常伤感,那些曾经快乐的大学时光啊,突然又慢慢的一下子出现在了眼前, ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...

随机推荐

STL库学习笔记（一）——什么是STL？
小明是一个很牛逼的程序员,在国际标准化组织工作. 他现在正在设计新一代的C++标准,标准中有一个待实现的函数:findMax(),这个函数要求使用者输入任何类型的数据,他都能找到最大的一个. 于是他想 ...
java应用性能调优之详解System的gc垃圾回收方法
一.什么是System.gc()? System.gc()是用Java,C#和许多其他流行的高级编程语言提供的API.当它被调用时,它将尽最大努力从内存中清除垃圾(即未被引用的对象).名词解释:GC, ...
创建linux系统下的虚拟机
1.打开VMware软件 2.创建新的虚拟机 3.下一步 4.点击稍后安装操作系统——下一步 5.选择其中版本我的镜像是这个版本所以选择这个 6.下一步设置虚拟机名称要保存的位置 7 ...
zookeeper集群模式安装
服务器节点规划: 节点1:192.168.0.103 节点2:192.168.0.104 节点3:192.168.0.105 安装zookeeper,将zookeeper上传到三个服务器,保存在/ho ...
IO类
Java的IO体系分为Input/Output和Reader/Writer两类,区别在于Reader/Writer在读写文本时能自动转换内码.基本上,所有的IO类多是配对的,即有XXXInput,就有 ...
nginx 根据不同url转发请求对应tomcat容器
根据前端请求的url,nginx转发到指定的tomcat容器原理如图: 现在我们有2个tomcat,一个tomcat的端口为9001,另一个tomcat的端口为9002 1.找到nginx的配置文件 ...
C++中对C的扩展学习新增语法——内联函数以及函数参数
内联函数以及函数参数内联函数使用 inline 关键字必须和函数体放在一起. 内联函数具有内部链接属性. 内联函数会被编译器在编译阶段替换到函数调用的地方. 可以把内联函数定义写到头文件中,多个c ...
通过 position:fixed 实现底部导航
通过 position:fixed 实现底部导航 HTML <div id="footer">页脚</div> CSS #footer { clear: b ...
【Vue | ElementUI】Vue离开当前页面时弹出确认框实现
Vue离开当前页面时弹出确认框实现 1. 实现目的在某种业务场景下,用户不允许跳转到其他页面.于是,需要在用户误操作或者是点击浏览器跳转时提示用户. 2. 实现原理使用路由守卫beforeRout ...
力扣（LeetCode）第一个错误的版本个人题解
你是产品经理,目前正在带领一个团队开发新的产品.不幸的是,你的产品的最新版本没有通过质量检测.由于每个版本都是基于之前的版本开发的,所以错误的版本之后的所有版本都是错的. 假设你有 n 个版本 [1, ...

基于PyTorch实现MNIST手写字识别

完整代码

基于PyTorch实现MNIST手写字识别的更多相关文章

随机推荐

热门专题