MXNet学习-第一个例子:训练MNIST数据集

一个门外汉写的MXNET跑MNIST的例子，三层全连接层最后验证率是97%左右，毕竟是第一个例子，主要就是用来理解MXNet怎么使用。

#导入需要的模块

import numpy as np #numpy只保存数值，用于数值运算，解决Python标准库中的list只能保存对象的指针的问题

import os #本例子中没有使用到

import gzip #使用zlib来压缩和解压缩数据文件，读写gzip文件

import struct #通过引入struct模块来处理图片中的二进制数据

import mxnet as mx #引入MXNet包

import logging #引入logging包记录日志

#利用MNIST数据集进行训练

def read_data(label_url,image_url): #定义读取数据的函数

    with gzip.open(label_url) as flbl: #解压标签包

        magic, num = struct.unpack(">II",flbl.read(8)) #采用Big Endian的方式读取两个int类型的数据，且参考MNIST官方格式介绍，magic即为magic number (MSB first) 用于表示文件格式，num即为文件夹内包含的数据的数量

        label = np.fromstring(flbl.read(),dtype=np.int8) #将标签包中的每一个二进制数据转化成其对应的十进制数据，且转换后的数据格式为int8（-128 to 127）格式，返回一个数组

    with gzip.open(image_url,'rb') as fimg: #已只读形式解压图像包

        magic, num, rows, cols = struct.unpack(">IIII",fimg.read(16)) #采用Big Endian的方式读取四个int类型数据，且参考MNIST官方格式介绍，magic和num上同，rows和cols即表示图片的行数和列数

        image = np.fromstring(fimg.read(),dtype=np.uint8).reshape(len(label),rows,cols) #将图片包中的二进制数据读取后转换成无符号的int8格式的数组，并且以标签总个数，行数，列数重塑成一个新的多维数组

    return (label,image) #返回读取成功的label数组和image数组

#且fileobject.read(size)的时候是按照流的方式读取（可test）

(train_lbl, train_img) = read_data('mnist/train-labels-idx1-ubyte.gz','mnist/train-images-idx3-ubyte.gz') #构建训练数据

(val_lbl, val_img) = read_data('mnist/t10k-labels-idx1-ubyte.gz','mnist/t10k-images-idx3-ubyte.gz') #构建测试数据

def to4d(img): #定义一个函数用于生成四维矩阵

    return img.reshape(img.shape[0],1,28,28).astype(np.float32)/255 #将图像包中的数组以标签总个数，图像通道数（MNIST数据集为黑白数据集故只为1），行数，列数重塑后复制为一个数据类型为float32的新的四维矩阵，且其中的元素值都除以255后转化为0-1的浮点值

batch_size = 100 #定义每次处理数据的数量为100

train_iter = mx.io.NDArrayIter(to4d(train_img),train_lbl,batch_size,shuffle=True) #构建训练数据迭代器，且其中shuffle表示采用可拖动的方式，意味着可以将在早期已经训练过的数据在后面再次训练

val_iter = mx.io.NDArrayIter(to4d(val_img),val_lbl,batch_size) #构建测试数据迭代器

#创建多层网络模型

data = mx.sym.Variable('data') #创建一个用于输入数据的PlaceHolder变量（占位符）

data = mx.sym.Flatten(data=data) #将data中的四维数据转化为二维数据且其中一维为每次处理数据的数量，第二维即为每张图片的图像通道数×长×宽（即为其像素点个数×图像通道数）

fc1 = mx.sym.FullyConnected(data=data,name='fc1',num_hidden=128) #创建第一层全连接层，输入数据为data，num_hidden表示该隐藏层有128个用于输出的节点

act1 = mx.sym.Activation(data=fc1,name='relu1',act_type='relu') #为第一层全连接层设定一个Relu激活函数，输入数据为fc1

fc2 = mx.sym.FullyConnected(data=act1,name='fc2',num_hidden=64) #创建第二层全连接层，输入数据为act1，num_hidden表示该隐藏层有64个用于输出的节点

act2 = mx.sym.Activation(data=fc2,name='relu2',act_type='relu') #为第一层全连接层设定一个Relu激活函数，输入数据为fc2

fc3 = mx.sym.FullyConnected(data=act2,Name='fc3',num_hidden=10) #创建第三层全连接层，输入数据为act2，num_hidden表示该隐藏层有10个用于输出的节点

mlp = mx.sym.SoftmaxOutput(data=fc3,name='softmax') #对输入的数据执行softmax变换，并且通过利用logloss执行BP算法

logging.getLogger().setLevel(logging.DEBUG) #返回作为层次结构根记录器的记录器，且记录等级作为DEBUG

#构建前馈神经网络模型

model = mx.model.FeedForward(

    symbol = mlp, #使网络结构为构建好的mlp

    num_epoch = 10, #数据的训练次数为10

    learning_rate = 0.1 #使模型按照学习率为0.1进行训练

)

#数据拟合，训练模型

model.fit(

    X = train_iter, #设置训练迭代器

    eval_data = val_iter, #设置测试迭代器

    batch_end_callback = mx.callback.Speedometer(batch_size,200) #在每一批epoches结尾时调用，打印logging信息(每经过200个batch_size打印logging)

)

MXNet学习-第一个例子:训练MNIST数据集的更多相关文章

Keras学习:第一个例子-训练MNIST数据集
import numpy as npimport gzip import struct import keras as ks import logging from keras.layers impo ...
使用caffe训练mnist数据集 - caffe教程实战（一）
个人认为学习一个陌生的框架,最好从例子开始,所以我们也从一个例子开始. 学习本教程之前,你需要首先对卷积神经网络算法原理有些了解,而且安装好了caffe 卷积神经网络原理参考:http://cs231 ...
实践详细篇-Windows下使用VS2015编译的Caffe训练mnist数据集
上一篇记录的是学习caffe前的环境准备以及如何创建好自己需要的caffe版本.这一篇记录的是如何使用编译好的caffe做训练mnist数据集,步骤编号延用上一篇 <实践详细篇-Windows下 ...
【Mxnet】----1、使用mxnet训练mnist数据集
使用自己准备的mnist数据集,将0-9的bmp图像分别放到0-9文件夹下,然后用mxnet训练. 1.制作rec数据集 (1).制作list
TensorFlow 训练MNIST数据集（2）—— 多层神经网络
在我的上一篇随笔中,采用了单层神经网络来对MNIST进行训练,在测试集中只有约90%的正确率.这次换一种神经网络(多层神经网络)来进行训练和测试. 1.获取MNIST数据 MNIST数据集只要一行代码 ...
深度学习（一）之MNIST数据集分类
任务目标对MNIST手写数字数据集进行训练和评估,最终使得模型能够在测试集上达到\(98\%\)的正确率.(最终本文达到了\(99.36\%\)) 使用的库的版本: python:3.8.12 py ...
TensorFlow训练MNIST数据集（1） —— softmax 单层神经网络
1.MNIST数据集简介首先通过下面两行代码获取到TensorFlow内置的MNIST数据集: from tensorflow.examples.tutorials.mnist import inp ...
搭建简单模型训练MNIST数据集
# -*- coding = utf-8 -*- # @Time : 2021/3/16 # @Author : pistachio # @File : test1.py # @Software : ...
mxnet卷积神经网络训练MNIST数据集测试
mxnet框架下超全手写字体识别—从数据预处理到网络的训练—模型及日志的保存 import numpy as np import mxnet as mx import logging logging. ...

随机推荐

python安装第三方库的步骤
windows下举例:1.下载openpyxl,http://pypi.doubanio.com/simple/openpyxl/2.将下载后的文件解压放到Python文件夹下的Lib文件夹下3.cm ...
Linux内核模块学习
注:本文是<Linux设备驱动开发详解:基于最新的Linux 4.0内核 by 宋宝华 >一书学习的笔记,大部分内容为书籍中的内容. 书籍可直接在微信读书中查看:Linux设备驱动开发详解 ...
[WPF] 用 Effect 实现线条光影效果
1. 前言几个月前 ChokCoco 大佬发布了一篇文章: CSS 奇技淫巧 | 妙用 drop-shadow 实现线条光影效果在文章里实现了一个发光的心形线条互相追逐的效果: 现在正好有空就试试 ...
数据库锁（mysql）
InnoDB支持表.行(默认)级锁,而MyISAM支持表级锁本文着中介绍InnoDB对应的锁. mysql锁主要分为以下三类: 表级锁:开销小,加锁快:不会出现死锁:锁定粒度大,发生锁冲突的概率最高 ...
【PTA】5-2 下列程序读入时间数值，将其加1秒后输出，时间格式为：hh: mm: ss，即“小时:分钟:秒”，当小时等于24小时，置为0。
5-2 下列程序读入时间数值,将其加1秒后输出,时间格式为:hh: mm: ss,即"小时:分钟:秒",当小时等于24小时,置为0. #include <stdio.h> ...
聊聊dubbo协议
搜索关注微信公众号"捉虫大师",后端技术分享,架构设计.性能优化.源码阅读.问题排查.踩坑实践. 协议协议通俗易懂地解释就是通信双方需要遵循的约定. 我们了解的常见的网络传输协议 ...
leetcode 120. 三角形最小路径和及 53. 最大子序和
三角形最小路径和问题描述给定一个三角形,找出自顶向下的最小路径和.每一步只能移动到下一行中相邻的结点上. 例如,给定三角形: [ [2], [3,4], [6,5,7], [4,1,8,3] ] ...
只要一行代码，实现五种 CSS 经典布局
常用的页面布局,其实就那么几个.下面我会介绍5个经典布局,只要掌握了它们,就能应对绝大多数常规页面. 这几个布局都是自适应的,自动适配桌面设备和移动设备.代码实现很简单,核心代码只有一行,有很大的学习 ...
centos7无法访问虚拟机web服务
第一种: 先看下防火墙状态:firewall-cmd --state 关闭防火墙再试试:systemctl stop firewalld.service 第二种,不想关闭防火墙放开http服务 fi ...
K8s配置配置存活、就绪和启动探测器
kubelet 使用存活探测器来知道什么时候要重启容器. 例如,存活探测器可以捕捉到死锁(应用程序在运行,但是无法继续执行后面的步骤). 这样的情况下重启容器有助于让应用程序在有问题的情况下更可用. ...

MXNet学习-第一个例子:训练MNIST数据集

MXNet学习-第一个例子:训练MNIST数据集的更多相关文章

随机推荐

热门专题