用pytorch做手写数字识别，识别l率达97.8%

pytorch做手写数字识别

效果如下：

工程目录如下

第一步数据获取

下载MNIST库，这个库在网上，执行下面代码自动下载到当前data文件夹下

from torchvision.datasets import MNIST

import torchvision

mnist = MNIST(root='./data',train=True,download=True)

print(mnist)

print(mnist[0])

print(len(mnist))

img = mnist[0][0]

img.show()

dataset.py文件，读取数据并做预处理

'''

准备数据集

'''

import torch

from torch.utils.data import DataLoader

from torchvision.datasets import MNIST

import torchvision

def mnist_dataset(train):

    func = torchvision.transforms.Compose([

        torchvision.transforms.ToTensor(),

        torchvision.transforms.Normalize(mean=(0.1307,),std=(0.3081,))

    ])

    #1.准备Mnist数据集

    return MNIST(root='./data',train=train,download=False,transform=func)

def get_dataloader(train = True):

    mnist = mnist_dataset(train)

    return DataLoader(mnist,batch_size=128,shuffle=True)

if __name__ == '__main__':

    for (images,labels) in get_dataloader():

        print(images.size())

        print(labels.size())

        break

models.py文件，定义训练的模型类

'''

定义模型

'''

import torch.nn as  nn

import torch.nn.functional as F

class MnistModel(nn.Module):

    def __init__(self):

        super(MnistModel,self).__init__()

        self.fc1 = nn.Linear(1*28*28,100)

        self.fc2 = nn.Linear(100,10)

    def forward(self,image):

        image_viewd = image.view(-1,1*28*28) #[batch_size,1*28*28]

        fc1_out = self.fc1(image_viewd) #[batch_size,100]

        fc1_out_relu = F.relu(fc1_out) #[batch_size,100]

        out = self.fc2(fc1_out_relu) #[batch_size,10]

        return F.log_softmax(out,dim=-1)  #带权损失计算交叉熵

cong.py文件，定义一些常亮，设置使用cpu还是GPU　　

'''

项目配置

'''

import torch

train_batch_size = 128

test_batch_size = 100

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

train.py文件，模型训练文件，保存模型

"""

进行模型的训练

"""

from dataset import get_dataloader

from models import MnistModel

from torch import optim

import torch.nn.functional as F

import conf

from tqdm import tqdm

import numpy as np

import torch

import os

from test import eval

#1. 实例化模型，优化器，损失函数

model = MnistModel().to(conf.device)

optimizer = optim.Adam(model.parameters(),lr=1e-3)

#2. 进行循环，进行训练

def train(epoch):

    train_dataloader = get_dataloader(train=True)

    bar = tqdm(enumerate(train_dataloader),total=len(train_dataloader))

    total_loss = []

    for idx,(input,target) in bar:

        input = input.to(conf.device)

        target = target.to(conf.device)

        #梯度置为0

        optimizer.zero_grad()

        #计算得到预测值

        output = model(input)

        #得到损失

        loss = F.nll_loss(output,target)

        #反向传播，计算损失

        loss.backward()

        total_loss.append(loss.item())

        #参数的更新

        optimizer.step()

        #打印数据

        if idx%10 ==0 :

            bar.set_description_str("epcoh:{} idx:{},loss:{:.6f}".format(epoch,idx,np.mean(total_loss)))

            torch.save(model.state_dict(),"./models/model.pkl")

            torch.save(optimizer.state_dict(),"./models/optimizer.pkl")

if __name__ == '__main__':

    for i in range(10):

        train(i)

        eval()

test.py文件，模型测试文件，测试模型准确率　　

'''

进行模型评估

'''

from dataset import get_dataloader

from models import MnistModel

from torch import optim

import torch.nn.functional as F

import conf

from tqdm import tqdm

import numpy as np

import torch

import os

def eval():

    #实例化模型，优化器，损失函数

    model = MnistModel().to(conf.device)

    if os.path.exists("./models/model.pkl"):

        model.load_state_dict(torch.load("./models/model.pkl"))

    test_dataloader = get_dataloader(train=False)

    total_loss = []

    total_acc = []

    with torch.no_grad():

        for input, target in test_dataloader:  # 2. 进行循环，进行训练

            input = input.to(conf.device)

            target = target.to(conf.device)

            # 计算得到预测值

            output = model(input)

            # 得到损失

            loss = F.nll_loss(output, target)

            # 反向传播，计算损失

            total_loss.append(loss.item())

            # 计算准确率

            ###计算预测值

            pred = output.max(dim=-1)[-1]

            total_acc.append(pred.eq(target).float().mean().item())

    print("test loss:{},test acc:{}".format(np.mean(total_loss), np.mean(total_acc)))

# if __name__ == '__main__':

#     # for i in range(10):

#     #     train(i)

#     eval()

用pytorch做手写数字识别，识别l率达97.8%的更多相关文章

【转】机器学习教程十四-利用tensorflow做手写数字识别
模式识别领域应用机器学习的场景非常多,手写识别就是其中一种,最简单的数字识别是一个多类分类问题,我们借这个多类分类问题来介绍一下google最新开源的tensorflow框架,后面深度学习的内容都会基 ...
用Keras搭建神经网络简单模版（三）—— CNN 卷积神经网络（手写数字图片识别）
# -*- coding: utf-8 -*- import numpy as np np.random.seed(1337) #for reproducibility再现性 from keras.d ...
opencv实现KNN手写数字的识别
人工智能是当下很热门的话题,手写识别是一个典型的应用.为了进一步了解这个领域,我阅读了大量的论文,并借助opencv完成了对28x28的数字图片(预处理后的二值图像)的识别任务. 预处理一张图片: 首 ...
pytorch CNN 手写数字识别
一个被放弃的入门级的例子终于被我实现了,虽然还不太完美,但还是想记录下 1.预处理相比较从库里下载数据集(关键是经常失败,格式也看不懂),更喜欢直接拿图片,从网上找了半天,最后从CSDN上下载了一个 ...
caffe+opencv3.3dnn模块完成手写数字图片识别
最近由于项目需要用到caffe,学习了下caffe的用法,在使用过程中也是遇到了些问题,通过上网搜索和问老师的方法解决了,在此记录下过程,方便以后查看,也希望能为和我一样的新手们提供帮助. 顺带附上老 ...
用tensorflow求手写数字的识别准确率（简单版）
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #载入数据集 mnist = in ...
吴裕雄 python神经网络手写数字图片识别（5）
import kerasimport matplotlib.pyplot as pltfrom keras.models import Sequentialfrom keras.layers impo ...
用Keras搭建神经网络简单模版（四）—— RNN Classifier 循环神经网络（手写数字图片识别）
# -*- coding: utf-8 -*- import numpy as np np.random.seed(1337) from keras.datasets import mnist fro ...
吴裕雄 python 神经网络——TensorFlow 卷积神经网络手写数字图片识别
import os import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_N ...

随机推荐

开发一个基础的npm包
初始化项目 # 新建文件夹 mkdir whosmeya-npm-package-test # 进入 cd whosmeya-npm-package-test/ # 初始化 package.json, ...
python3读取excel
说明 2007版以前的Excel(xls结尾的),需要使用xlrd读,xlwt写. 2007版以后的Excel(xlsx结尾的),需要使用openpyxl来读写. pypi的地址: https://p ...
if-else、switch、while、for
文章主要会涉及如下几个问题: if-else 和 switch-case 两者相比谁的效率会高些?在日常开发中该如何抉择? 如何基于赫夫曼树结构减少 if-else 分支判断次数? 如何巧妙的应用 d ...
Springmvc与Struts区别？
在一个技术群里看到机器人解释的二者区别,在此Mark下. 一.框架机制 spring mvc 和 struts2的加载机制不同:spring mvc的入口是servlet,而struts2是filte ...
模块 psutil 系统信息获取
psutil模块介绍 psutil是一个开源切跨平台的库,其提供了便利的函数用来获取才做系统的信息,比如CPU,内存,磁盘,网络等.此外,psutil还可以用来进行进程管理,包括判断进程是否存在.获取 ...
测试Activity和Fragment的生命周期
Activity的生命周期有7个函数,Fragment的生命周期有11个函数. Activity生命周期除上述6个方法还有一个Restart()方法,该方法在该Activity从不可见(仍存在)到重新 ...
将本地项目关联到git上面
1.github上面创建新项目 2.初始化项目-------------可忽略首先加入git提交忽略的文件.gitignore文件 .idea 忽略以.idea文件logs/ 忽略logs文件夹* ...
PXE基础装机环境
PXE基础装机环境案例1:PXE基础装机环境案例2:配置并验证DHC ...
LoadRunner从入门到实战学习路线（持续更新中...)
写在前面我是一个测试工程师,从土木工程行业转行到互联网行业,目前是工作的第三年.平时主要做功能测试,性能测试接触比较少,虽然以前培训的时候学习过一些性能相关的知识,但都是入门初级的知识 ...
SSAS 第一篇：多维数据分析基础
多维数据分析是指按照多个维度(即多个角度)对数据进行观察和分析,多维的分析操作是指通过对多维形式组织起来的数据进行切片 .切块.聚合.钻取 .旋转等分析操作,以求剖析数据,使用户能够从多种维度.多个侧 ...

用pytorch做手写数字识别，识别l率达97.8%

用pytorch做手写数字识别，识别l率达97.8%的更多相关文章

随机推荐

热门专题