MNIST数据集上卷积神经网络的简单实现（使用PyTorch)

设计的CNN模型包括一个输入层，输入的是MNIST数据集中28*28*1的灰度图

两个卷积层，

第一层卷积层使用6个3*3的kernel进行filter，步长为1，填充1.这样得到的尺寸是（28+1*2-3)/1+1=28,即6个28*28的feature map

在后面进行池化，尺寸变为14*14

第二层卷积层使用16个5*5的kernel,步长为1，无填充，得到（14-5)/1+1=10,即16个10*10的feature map

池化后尺寸为5*5

后面加两层全连接层，第一层将16*5*5=400个神经元线性变换为120个，第二层将120个变为84个

最后的输出层将84个输出为10个种类

代码如下：

###MNIST数据集上卷积神经网络的简单实现###

# 配置库

import torch

from torch import nn, optim

import torch.nn.functional as F

from torch.autograd import Variable

from torch.utils.data import DataLoader

from torchvision import transforms

from torchvision import datasets

# 配置参数

torch.manual_seed(1)  # 设置随机数种子，确保结果可重复

batch_size = 128  # 批处理大小

learning_rate = 1e-2  # 学习率

num_epoches = 10  # 训练次数

# 加载MNIST数据

# 下载训练集MNIST手写数字训练集

train_dataset = datasets.MNIST(

    root='./data',  # 数据保持的位置

    train=True,  # 训练集

    transform=transforms.ToTensor(),  # 一个取值范围是【0,255】的PIL.Image

    # 转化成取值范围是[0,1.0]的torch.FloatTensor

    download=True

)

test_dataset = datasets.MNIST(

    root='./data',

    train=False,  # 测试集

    transform=transforms.ToTensor()

)

# 数据的批处理中，尺寸大小为batch_size

# 在训练集中，shuffle必须设置为True,表示次序是随机的

train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)

test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

# 创建CNN模型

# 使用一个类来创建，这个模型包括1个输入层，2个卷积层，2个全连接层和1个输出层。

# 其中卷积层构成为卷积（conv2d)->激励函数（ReLU)->池化（MaxPooling)

# 全连接层由线性层（Linear)构成

# 定义卷积神经网络模型

class Cnn(nn.Module):

    def __init__(self, in_dim, n_class):  # 28*28*1

        super(Cnn, self).__init__()

        self.conv = nn.Sequential(

            nn.Conv2d(in_dim, 6, 3, stride=1, padding=1),  # 28*28

            nn.ReLU(True),

            nn.MaxPool2d(2, 2),  # 14*14

            nn.Conv2d(6, 16, 5, stride=1, padding=0),  # 10*10*16

            nn.ReLU(True),

            nn.MaxPool2d(2, 2)  # 5*5*16

        )

        self.fc = nn.Sequential(

            nn.Linear(400, 120),

            nn.Linear(120, 84),

            nn.Linear(84, n_class)

        )

    def forward(self, x):

        out = self.conv(x)

        out = out.view(out.size(0), 400)  # 400=5*5*16

        out = self.fc(out)

        return out

# 图片大小是28*28,10是数据的种类

model = Cnn(1, 10)

# 打印模型，呈现网络结构

print(model)

# 模型训练，将img\label都用Variable包装起来，放入model中计算out,最后计算loss和正确率

# 定义loss和optimizer

criterion = nn.CrossEntropyLoss()

optimizer = optim.SGD(model.parameters(), lr=learning_rate)

# 开始训练

for epoch in range(num_epoches):

    running_loss = 0.0

    running_acc = 0.0

    for i, data in enumerate(train_loader, 1):  # 批处理

        img, label = data

        img = Variable(img)

        label = Variable(label)

        # 前向传播

        out = model(img)

        loss = criterion(out, label)  # loss

        running_loss += loss.item() * label.size(0)

        # total loss,由于loss是batch取均值的，需要把batch_size乘进去

        _, pred = torch.max(out, 1)  # 预测结果

        num_correct = (pred == label).sum()  # 正确结果的数量

        #accuracy = (pred == label).float().mean()  # 正确率

        running_acc += num_correct.item()  # 正确结果的总数

        # 后向传播

        optimizer.zero_grad()  # 梯度清零，以免影响其他batch

        loss.backward()  # 后向传播，计算梯度

        optimizer.step()  # 利用梯度更新W，b参数

    # 打印一个循环后，训练集合上的loss和正确率

    print('Train {} epoch, Loss:{:.6f},Acc:{:.6f}'.format(epoch + 1, running_loss / (len(train_dataset)),

                                                          running_acc / (len(train_dataset))))

# 在测试集上测试识别率

# 模型测试

model.eval()

# 由于训练和测试BatchNorm,Dropout配置不同，需要说明是否模型测试

eval_loss = 0

eval_acc = 0

for data in test_loader:  # test set批处理

    img, label = data

    with torch.no_grad():

        img = Variable(img)

    # volatile确定你是否调用.backward(),

    # 测试中不需要label=Variable(label,volatile=True)

    #不需要梯度更新改为with torch.no_grad()

    out = model(img)

    loss = criterion(out, label)  # 计算loss

    eval_loss += loss.item() * label.size(0)  # total loss

    _, pred = torch.max(out, 1)  # 预测结果

    num_correct = (pred == label).sum()  # 正确结果

    eval_acc += num_correct.item()  # 正确结果总数

print('Test loss:{:.6f},Acc:{:.6f}'.format(eval_loss / (len(test_dataset)), eval_acc * 1.0 / (len(test_dataset))))

MNIST数据集上卷积神经网络的简单实现（使用PyTorch)的更多相关文章

基于MNIST数据的卷积神经网络CNN
基于tensorflow使用CNN识别MNIST 参数数量:第一个卷积层5x5x1x32=800个参数,第二个卷积层5x5x32x64=51200个参数,第三个全连接层7x7x64x1024=3211 ...
pytorch实现MLP并在MNIST数据集上验证
写在前面由于MLP的实现框架已经非常完善,网上搜到的代码大都大同小异,而且MLP的实现是deeplearning学习过程中较为基础的一个实验.因此完全可以找一份源码以参考,重点在于照着源码手敲一遍, ...
TensorFlow+实战Google深度学习框架学习笔记（12）------Mnist识别和卷积神经网络LeNet
一.卷积神经网络的简述卷积神经网络将一个图像变窄变长.原本[长和宽较大,高较小]变成[长和宽较小,高增加] 卷积过程需要用到卷积核[二维的滑动窗口][过滤器],每个卷积核由n*m(长*宽)个小格组成 ...
嵌入式设备上卷积神经网络推理时memory的优化
以前的神经网络几乎都是部署在云端(服务器上),设备端采集到数据通过网络发送给服务器做inference(推理),结果再通过网络返回给设备端.如今越来越多的神经网络部署在嵌入式设备端上,即inferen ...
利用mnist数据集进行深度神经网络
初始神经网络这里要解决的问题是,将手写数字的灰度图像(28 像素 x28 像素)划分到 10 个类别中(0~9).我们将使用 MINST 数据集,它是机器学习领域的一个经典数据集,其历史几乎和这个领 ...
TensorFlow技术解析与实战学习笔记（13）------Mnist识别和卷积神经网络AlexNet
一.AlexNet:共8层:5个卷积层(卷积+池化).3个全连接层,输出到softmax层,产生分类. 论文中lrn层推荐的参数:depth_radius = 4,bias = 1.0 , alpha ...
使用CIFAR-10样本数据集测试卷积神经网络(ConvolutionalNeuralNetwork,CNN)
第一次将例程跑起来了,有些兴趣. 参考的是如下URL: http://www.yidianzixun.com/article/0KNz7OX1 本来是比较Keras和Tensorflow的,我现在的水 ...
3层-CNN卷积神经网络预测MNIST数字
3层-CNN卷积神经网络预测MNIST数字本文创建一个简单的三层卷积网络来预测 MNIST 数字.这个深层网络由两个带有 ReLU 和 maxpool 的卷积层以及两个全连接层组成. MNIST 由 ...
TersorflowTutorial_MNIST数据集上简单CNN实现
MNIST数据集上简单CNN实现觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 Tensorflow机器学习实战指南源代码请点击下方链接欢迎加星 Tesorflow实现基于MNI ...

随机推荐

开始认识java
1.java发展历史 1991年詹姆斯·高斯林 (James Gosling) SUN公司Green项目(消费类电子产品) Oak ...
线段树set，add基础
UVA11992 Fast Matrix Operations https://www.luogu.org/problem/UVA11992 此类模板题建议随便打打就行了233....
Python常用数据类型简介
1.变量的三个基本特征 1,大印 2,判断变量值是否相等 3,判断变量id是否相等 2.常用数据类型分类数字类型(int) 字符串类型(str) 列表类型(list) 字典类型(dict(dicti ...
Object的多种方法
Object.entries() Object.entries() 方法返回一个给定对象自身可枚举属性的键值对数组,其排列与使用 for...in 循环遍历该对象时返回的顺序一致(区别在于 for-i ...
CF-55 C.Pie or die
做法:先把四个角分别覆盖一条边,于是问题转化为判断离边最近的一个点是否离边的距离大于等于4 #include<iostream> #include<cstdio> #inclu ...
【BZOJ3534】[SDOI2014] 重建（矩阵树定理）
点此看题面大致题意: 给你一张图,每条边有一定存在概率.求存在的图刚好为一棵树的概率. 矩阵树定理是什么如果您不会矩阵树定理,可以看看蒟蒻的这篇博客:初学矩阵树定理. 矩阵树定理的应用此题中,直 ...
R语言两自定义矩阵的基本运算-实例
#sink("matrix_history.txt") cat("请输入矩阵的行和列数,“,”号隔开,建议行等于列数:") number<-scan( ...
word设置标题1,标题2,标题3项目编号联动
word经常要按层级显示标题,并且标题样式之间要联动如: 设置办法: word内鼠标右键 2.选择项目符号和编号 3.选择一个样式并自定义将级别链接到样式.选择对应标题样式即可实现联动.
C++ 静态库与动态库以及在 Windows上的创建、使用
一.什么是库库是写好的现有的,成熟的,可以复用的代码.现实中每个程序都要依赖很多基础的底层库,不可能每个人的代码都从零开始,因此库的存在意义非同寻常. 本质上来说库是一种可执行代码的二进制形式,可以 ...
POJ 3041 Asteroids（二分图最大匹配）
###题目链接### 题目大意: 给你 N 和 K ,在一个 N * N 个图上有 K 个小行星.有一个可以横着切或竖着切的武器,问最少切多少次,所有行星都会被毁灭. 分析: 将 1~n 行数加入左 ...

MNIST数据集上卷积神经网络的简单实现（使用PyTorch)

MNIST数据集上卷积神经网络的简单实现（使用PyTorch)的更多相关文章

随机推荐

热门专题