Pytorch搭建卷积神经网络用于MNIST分类

import torch

from torch.utils.data import DataLoader

from torchvision import datasets

from torchvision import transforms

from torch import nn, optim

from torch.nn import functional as F

EPOCH = 1000

BATCH_SIZE = 128

LR = 0.001

DOWNLOAD_MNIST = False

train_data = datasets.MNIST(

    root='./mnist',

    train=True,

    transform=transforms.Compose([

                           transforms.ToTensor(),

                           transforms.Normalize((0.1307,), (0.3081,))

                       ]),#0-255 -> 0-1

    download=DOWNLOAD_MNIST

)

#plot one example

print(train_data.train_data.size())

print(train_data.train_labels.size())

plt.imshow(train_data.train_data[0].numpy(), cmap='gray')

plt.title('%i' % train_data.train_labels[0])

plt.show()

train_loader = DataLoader(dataset=train_data, batch_size=BATCH_SIZE,\

                               shuffle=True, num_workers=2)

test_data = datasets.MNIST(

    root='./mnist',

    train=False,

    transform=transforms.Compose([

                           transforms.ToTensor(),

                           transforms.Normalize((0.1307,), (0.3081,))

                       ]),#0-255 -> 0-1

    download=DOWNLOAD_MNIST

)

test_loader = DataLoader(dataset=test_data, batch_size=BATCH_SIZE,\

                               shuffle=True, num_workers=2)

x, label = iter(test_loader).next()  #这个iter能把一个batch_size提取出来

print("x:",x.shape, 'label:',label.shape)

class CNN(nn.Module):

    def __init__(self):

        super(CNN, self).__init__()

        self.conv1 = nn.Sequential(         # input shape (1, 28, 28)

            nn.Conv2d(

                in_channels=1,              # input height

                out_channels=10,            # n_filters

                kernel_size=5,              # filter size

                stride=1,                   # filter movement/step

                padding=2,                  # if want same width and length of this image after Conv2d, padding=(kernel_size-1)/2 if stride=1

            ),                              # output shape (16, 28, 28)

            nn.ReLU(),                      # activation

            nn.MaxPool2d(kernel_size=2),    # choose max value in 2x2 area, output shape (16, 14, 14)

        )

        self.conv2 = nn.Sequential(         # input shape (16, 14, 14)

            nn.Conv2d(10, 20, 5, 1, 2),     # output shape (32, 14, 14)

            nn.ReLU(),                      # activation

            nn.MaxPool2d(2),                # output shape (32, 7, 7)

        )

        self.out1 = nn.Linear(20 * 7 * 7, 512)   # fully connected layer, output 10 classes

        self.out2 = nn.Linear(512, 10)

    def forward(self, x):

        x = self.conv1(x)

        x = self.conv2(x)

        x = x.view(x.size(0), -1)           # flatten the output of conv2 to (batch_size, 32 * 7 * 7)

        output = self.out1(x)

        output = F.relu(output)

        output = self.out2(output)

        return output    # return x for visualization

DEVICE = torch.device("cuda" if torch.cuda.is_available() else "cpu")

cnn = CNN().to(DEVICE)

print(cnn)  # net architecture

optimizer = optim.Adam(cnn.parameters(), lr=LR)   # optimize all cnn parameters

criteon = nn.CrossEntropyLoss().to(DEVICE)                     # the target label is not one-hotted

def train(model, device, train_loader, optimizer, epoch):

    model.train()

    for batch_idx, (data, target) in enumerate(train_loader):

        data, target = data.to(device), target.to(device)

        output = model(data)

        loss = criterion(output, target)

        optimizer.zero_grad()

        loss.backward()

        optimizer.step()

        if(batch_idx+1)%30 == 0:

            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(

                epoch, batch_idx * len(data), len(train_loader.dataset),

                100. * batch_idx / len(train_loader), loss.item()))

def test(model, device, test_loader):

    model.eval()

    test_loss = 0

    correct = 0

    with torch.no_grad():

        for data, target in test_loader:

            data, target = data.to(device), target.to(device)

            output = model(data)

            pred = output.argmax(dim=1)

            correct += torch.eq(pred, target).float().sum().item()

            test_loss += criterion(output, target)

#             test_loss += F.nll_loss(output, target, reduction='sum').item() # 将一批的损失相加

#             pred = output.max(1, keepdim=True)[1] # 找到概率最大的下标

#             correct += pred.eq(target.view_as(pred)).sum().item()

    test_loss /= len(test_loader.dataset)

    print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(

        test_loss, correct, len(test_loader.dataset),

        100. * correct / len(test_loader.dataset)))

# training and testing

for epoch in range(EPOCH):

    train(cnn, DEVICE, train_loader, optimizer, epoch)

    test(cnn, DEVICE, test_loader)

最后能得到99%的准确率

Pytorch搭建卷积神经网络用于MNIST分类的更多相关文章

Tensorflow框架初尝试————搭建卷积神经网络做MNIST问题
Tensorflow是一个非常好用的deep learning框架学完了cs231n,大概就可以写一个CNN做一下MNIST了 tensorflow具体原理可以参见它的官方文档然后CNN的原理可以 ...
Pytorch搭建简单神经网络 Task2
1>建立数据集(并绘制图像) # -*- coding: utf-8 -*- #demo.py import torch import torch.nn.functional as F # 主要 ...
TensorFlow——CNN卷积神经网络处理Mnist数据集
CNN卷积神经网络处理Mnist数据集 CNN模型结构: 输入层:Mnist数据集(28*28) 第一层卷积:感受视野5*5,步长为1,卷积核:32个第一层池化:池化视野2*2,步长为2 第二层卷积 ...
3层-CNN卷积神经网络预测MNIST数字
3层-CNN卷积神经网络预测MNIST数字本文创建一个简单的三层卷积网络来预测 MNIST 数字.这个深层网络由两个带有 ReLU 和 maxpool 的卷积层以及两个全连接层组成. MNIST 由 ...
使用MXNet远程编写卷积神经网络用于多标签分类
最近试试深度学习能做点什么事情.MXNet是一个与Tensorflow类似的开源深度学习框架,在GPU显存利用率上效率高,比起Tensorflow显著节约显存,并且天生支持分布式深度学习,单机多卡.多 ...
TensorFlow系列专题(十四): 手把手带你搭建卷积神经网络实现冰山图像分类
目录: 冰山图片识别背景数据介绍数据预处理模型搭建结果分析总结一.冰山图片识别背景这里我们要解决的任务是来自于Kaggle上的一道赛题(https://www.kaggle.com/c/ ...
动手学习Pytorch(6)--卷积神经网络基础
卷积神经网络基础本节我们介绍卷积神经网络的基础概念,主要是卷积层和池化层,并解释填充.步幅.输入通道和输出通道的含义. 二维卷积层本节介绍的是最常见的二维卷积层,常用于处理图像数据. 二维 ...
写给程序员的机器学习入门 (八) - 卷积神经网络 (CNN) - 图片分类和验证码识别
这一篇将会介绍卷积神经网络 (CNN),CNN 模型非常适合用来进行图片相关的学习,例如图片分类和验证码识别,也可以配合其他模型实现 OCR. 使用 Python 处理图片在具体介绍 CNN 之前, ...
深度学习原理与框架-Tensorflow卷积神经网络-cifar10图片分类(代码) 1.tf.nn.lrn(局部响应归一化操作) 2.random.sample(在列表中随机选值) 3.tf.one_hot(对标签进行one_hot编码)
1.tf.nn.lrn(pool_h1, 4, bias=1.0, alpha=0.001/9.0, beta=0.75) # 局部响应归一化,使用相同位置的前后的filter进行响应归一化操作参数 ...

随机推荐

linux中shell编辑小技巧
一.循环1到100 ..};do echo $i done 二.获取100以内的随机值 ] 三.截取字符串 demo= :} #截取3位字符echo ${demo:1} #截取1到最后的字符希望大家 ...
《Head First 软件开发》阅读二
项目计划:为成功而筹划每段伟大的代码始于伟大的计划. 客户现在就要他们的软件,可是开发需要的时间远远超过客户要求时间.我们需要实际解决方法:由客户确定优先级,与客户一起确定优先级顺序,开发出Mile ...
迭代处理enum类会生成枚举的各个成员
import enum class BugStatus(enum.Enum): new = 7 incomplete = 6 invalid = 5 wont_fix ...
Python---面向对象的三大特征
# 面向对象的三大特征 - 继承 - 封装 - 多态 # 继承 - 子类可以使用父类定义的内容或者行为等 - 继承的实现 - 父类:基类,超类:被继承的类, Base Class, Super Cla ...
【GDOI2013模拟4】贴瓷砖
题目 A镇的主街是由N个小写字母构成,镇长准备在上面贴瓷砖,瓷砖一共有M种,第i种上面有Li个小写字母,瓷砖不能旋转也不能被分割开来,瓷砖只能贴在跟它身上的字母完全一样的地方,允许瓷砖重叠,并且同一种 ...
clojure的语法糖
语法糖很多, 就是奔这个“懒” 来用clj的. 但是,在常见的书里(<Clojure编程><Clojure编程乐趣2>)都对很多基本语法,用法都介绍不全, 不细.看书看得很累. ...
模板_SEG_TREE
#include<bits/stdc++.h> #define maxn 500005 #define int long long using namespace std; inline ...
Spoj4060 game with probability Problem
题目链接:Click here Solution: 刚开始还以为博弈论加概率,然而并不是... 设两个状态:$f(i)$表示当前剩下$i$个石头时,先手的获胜概率,$g(i)$为后手的获胜 ...
Apache配置详解(最好的APACHE配置教程)
From: http://aiks.blog.com.cn/archives/2006/1748482.shtml Apache的配置 Apache的配置由httpd.conf文件配置,因此下面的配置 ...
nowcoder---常州大学新生寒假训练会试----F 大佬的生日礼包（二分）
链接:https://www.nowcoder.net/acm/contest/78/F 时间限制:C/C++ 1秒,其他语言2秒空间限制:C/C++ 32768K,其他语言65536K 64bit ...

Pytorch搭建卷积神经网络用于MNIST分类

Pytorch搭建卷积神经网络用于MNIST分类的更多相关文章

随机推荐

热门专题