深度学习-使用cuda加速卷积神经网络-手写数字识别准确率99.7%

源码和运行结果

cuda：https://github.com/zhxfl/CUDA-CNN

C语言版本参考自：http://eric-yuan.me/

针对著名手写数字识别的库mnist，准确率是99.7%,在几分钟内，CNN的训练就可以达到99.60%左右的准确率。

参数配置

网络的配置使用Config.txt进行配置##之间是注释，代码会自动过滤掉，其他格式参考如下：

#Comment#

#NON_LINEARITY CAN = NL_SIGMOID , NL_TANH , NL_RELU#

##

##

##

##

IS_GRADIENT_CHECKING = false;

BATCH_SIZE = ;

NON_LINEARITY = NL_RELU;

[

LAYER = CONV;

KERNEL_SIZE = ;

KERNEL_AMOUNT = ;

WEIGHT_DECAY = 1e-;

POOLING_DIM = ;

]

[

LAYER = CONV;

KERNEL_SIZE = ;

KERNEL_AMOUNT = ;

WEIGHT_DECAY = 1e-;

POOLING_DIM = ;

]

[

LAYER = FC;

NUM_HIDDEN_NEURONS = ;

WEIGHT_DECAY = 1e-;

DROPOUT_RATE = 0.5;

]

[

LAYER = FC;

NUM_HIDDEN_NEURONS = ;

WEIGHT_DECAY = 1e-;

DROPOUT_RATE = 0.5;

]

[

LAYER = SOFTMAX;

NUM_CLASSES = ;

WEIGHT_DECAY = 1e-;

]

1）目前代码支持多个卷积层，多个全链接层。

2）卷积层默认带有池化层，池化算法目前只支持最大值池化。

3）卷积层的卷积核大小只支持奇数。

4）全链接层支持Dropconnect。（配置里面写的是dropout，后面会纠正这个的）

5）weight_decay这个参数如果你不知道是做什么，也可以先不理会，先用这个值就行了。

编译代码

1）代码目前依赖cuda-6.0以及opencv，如果你不想去装opencv，可以将util.cu和util.h所有有关opencv的代码都去掉，整个代码只有这里使用到opencv，而且只是由于我在开发过程中需要显示图片来调试而已。

2）代码直接可以导入nsight然后编译运行。同时也可以再vs2010里面编译运行。

代码特性

1）我们对数据做了处理，每次进行训练之前，都会随机的进行旋转、尺度变换、畸变和裁剪。下图是两个例子，实际上，这样做非常有效，使得我们的准确能够更高

2）整个代码采用cuda进行加速，其中我们用到了cublas.lib和curand.lib两个库，一个是矩阵运算一个是随机数的生成。我一次性申请了所有需要使用的内存，在程序开始运行之后，就不存在任何CPU和GPU之间的数据交换，事实证明这样非常有效。程序的性能比原来作者C语言版本快了数十倍左右（如果网络比较大，可以达到一百倍左右的加速比）。我们每个epos使用1600ms，处理了60000张图片，也就是训练一张图片大概是0.0266ms。

3）实际上，如果训练多个网络，然后进行投票，准确率可以达到99.82%，这个结果是目前为止所有公开发表结果中最好（99.79%）的。

深度学习-使用cuda加速卷积神经网络-手写数字识别准确率99.7%的更多相关文章

深度学习面试题12：LeNet(手写数字识别)
目录神经网络的卷积.池化.拉伸 LeNet网络结构 LeNet在MNIST数据集上应用参考资料 LeNet是卷积神经网络的祖师爷LeCun在1998年提出,用于解决手写数字识别的视觉任务.自那时起 ...
TensorFlow 卷积神经网络手写数字识别数据集介绍
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 手写数字识别接下来将会以 MNIST 数据集为例,使用卷积层和池 ...
基于Numpy的神经网络+手写数字识别
基于Numpy的神经网络+手写数字识别本文代码来自Tariq Rashid所著<Python神经网络编程> 代码分为三个部分,框架如下所示: # neural network class ...
深度学习(一）:Python神经网络——手写数字识别
声明:本文章为阅读书籍<Python神经网络编程>而来,代码与书中略有差异,书籍封面: 源码若要本地运行,请更改源码中图片与数据集的位置,环境为 Python3.6x. 1 import ...
吴裕雄 python 神经网络——TensorFlow 卷积神经网络手写数字图片识别
import os import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_N ...
caffe的python接口学习（4）mnist实例手写数字识别
以下主要是摘抄denny博文的内容,更多内容大家去看原作者吧一数据准备准备训练集和测试集图片的列表清单; 二导入caffe库,设定文件路径 # -*- coding: utf-8 -*- im ...
神经网络手写数字识别numpy实现
本文摘自Michael Nielsen的Neural Network and Deep Learning,该书的github网址为:https://github.com/mnielsen/neural ...
keras基于卷积网络手写数字识别
import time import keras from keras.utils import np_utils start = time.time() (x_train, y_train), (x ...
【问题解决方案】Keras手写数字识别-ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接
参考:台大李宏毅老师视频课程-Keras-Demo 在载入数据阶段报错: ConnectionResetError: [WinError 10054] 远程主机强迫关闭了一个现有的连接 Google之 ...

随机推荐

AlphaGo 已经战胜了李世石，而你还不知道什么是机器学习？
谷歌人工智能 AlphaGo 与韩国棋手李世石 3 月 15 日进行了最后一场较量,最终比赛结果为 AlphaGo 4:1 胜李世石,人机围棋大战巅峰对决至此落幕.我不知道大家有没有被震撼到,反正我的 ...
POJ2349+prim
最小生成树 /* prim 题意:给定一些点,一些卫星,一个卫星能连接两个点,点和点之间通信有一定的距离限制. 问能使得所有的点联通的最小距离. */ #include<stdio.h> ...
【形式化方法：VDM++系列】2.VDMTools环境的搭建
接前文:http://www.cnblogs.com/Kassadin/p/3975853.html 上次讲了软件需求分析的演化过程,本次进入正题——VDM开发环境的搭建 (自从发现能打游戏以来,居然 ...
python之高性能网络编程并发框架eventlet实例
http://blog.csdn.net/mingzznet/article/details/38388299 前言: 虽然 eventlet 封装成了非常类似标准线程库的形式,但线程和eventle ...
【转】linux下cvs配置
1. 验证是否已安装CVS #rpm -q cvs 如果能显示出类似这样的版本信息,证明已安装CVS: #cvs-1.11.19 若没有安装信息,则需要从htttp://www.cvshome.or ...
WPF中动态添加xaml资源文件
一.新建一个资源文件,然后设置其Build Actoin(生成操作)为Resource(资源): 二.在App.xaml.cs的StartUp事件或者是你需要的时机代码段写上如下代码: Resourc ...
sc.exe管理系统服务
sc.exe管理系统服务下面介绍SC,SC QC,and SC QUERY sc.exe create HomerSatelliteDesktopGC binPath= "D:XXXXXX ...
WinCE下VPN设置
一.环境 1. WinCE5.0+2004/2005/2006/2007补丁. 2. 3G拨号模块. 二.说明 1. WinCE设备必须可以接入网络. 2. 支 ...
Visual C#每一次新版本的变化
What's New in Visual C# .NET 2003[Visual Studio .NET 2003] What's New in Visual C# 2005 What's New i ...
UVa 673 (括号配对) Parentheses Balance
本来是当做水题来做的,后来发现这道题略坑. 首先输入的字符串可能是空串,所以我用了gets函数,紧接着就被scanf("%d", &n)后面的换行符坑掉了. 于是乎再加一句 ...

深度学习-使用cuda加速卷积神经网络-手写数字识别准确率99.7%

深度学习-使用cuda加速卷积神经网络-手写数字识别准确率99.7%的更多相关文章

随机推荐

热门专题