Caffe实战二（手写体识别例程：CPU、GPU、cuDNN速度对比）

上一篇文章成功在CPU模式下编译了Caffe，接下来需要运行一个例程来直观的了解Caffe的作用。（参考：《深度学习 21天实战Caffe》第6天运行手写体数字识别例程）

编译步骤：

CPU模式：

、下载MNIST数据集

sudo ./data/mnist/get_mnist.sh

、转换格式

sudo ./examples/mnist/create_mnist.sh

、修改训练超参数文件

sudo vim examples/mnist/lenet_solver.prototxt

修改最后一行为：solver_mode : CPU

、进行训练

sudo ./build/tools/caffe.bin train --solver=examples/mnist/lenet_solver.prototxt

、用训练好的模型对数据进行预测

sudo ./build/tools/caffe.bin test \

-model examples/mnist/lenet_train_test.prototxt \

-weights examples/mnist/lenet_iter_10000.caffemodel \

-iterations

GPU模式：

、重新编译Caffe

修改Makefile.config，屏蔽CPU_ONLY，即在CPU_ONLY前加上“#”

sudo make -j

、修改训练超参数文件

sudo vim examples/mnist/lenet_solver.prototxt

修改最后一行为：solver_mode : GPU

、进行训练

sudo ./build/tools/caffe.bin train --solver=examples/mnist/lenet_solver.prototxt

、用训练好的模型对数据进行预测，并使用caffe time命令进行计时

sudo ./build/tools/caffe.bin time \

-model examples/mnist/lenet_train_test.prototxt \

-gpu

cuDNN模式：

、重新编译Caffe

修改Makefile.config，去掉USE_CUDNN前的“#”（使用cuDNN加速）

sudo make -j

、进行训练

sudo ./build/tools/caffe.bin train --solver=examples/mnist/lenet_solver.prototxt

、用训练好的模型对数据进行预测，并使用caffe time命令进行计时

sudo ./build/tools/caffe.bin time \

-model examples/mnist/lenet_train_test.prototxt \

-gpu

结果对比：
CPU模式：

CPU_ONLY :=

solver mode : CPU

测试时间：3633ms

GPU模式：

# CPU_ONLY :=

solver mode : GPU

测试时间：.594ms

cuDNN加速：

USE_CUDNN :=

# CPU_ONLY :=

solver mode : GPU

测试时间：.016ms

由此可见，训练时间：CPU > GPU > cuDNN。

Caffe实战二（手写体识别例程：CPU、GPU、cuDNN速度对比）的更多相关文章

caffe-windows之手写体数字识别例程mnist
caffe-windows之手写体数字识别例程mnist 一.训练测试网络模型 1.准备数据 Caffe不是直接处理原始数据的,而是由预处理程序将原始数据变换存储为LMDB格式,这种方式可以保持较高的 ...
AI应用开发实战 - 手写识别应用入门
AI应用开发实战 - 手写识别应用入门手写体识别的应用已经非常流行了,如输入法,图片中的文字识别等.但对于大多数开发人员来说,如何实现这样的一个应用,还是会感觉无从下手.本文从简单的MNIST训练出 ...
MXNET手写体识别的例子
安装完MXNet之后,运行了官网的手写体识别的例子,这个相当于深度学习的Hello world了吧.. http://mxnet.io/tutorials/python/mnist.html 运行的过 ...
R︱Softmax Regression建模 (MNIST 手写体识别和文档多分类应用)
本文转载自经管之家论坛, R语言中的Softmax Regression建模 (MNIST 手写体识别和文档多分类应用) R中的softmaxreg包,发自2016-09-09,链接:https:// ...
舌尖上的硬件：CPU/GPU芯片制造解析(高清)(组图)
一沙一世界,一树一菩提,我们这个世界的深邃全部蕴藏于一个个普通的平凡当中.小小的厨房所容纳的不仅仅是人们对味道的情感,更有推动整个世界前进的动力.要想理解我们的世界,有的时候只需要细细品味一下我们所喜 ...
小米笔记本pro CPU GPU 做科学计算的算力对比
小米笔记本pro:15.6寸,i7-8850,16G,256G,GPU:MX150 测试对象Caffe,MNIST训练使用纯CPU训练: 1.耗时:11分58秒 2.功耗:35W 使用GPU训练: ...
kubernetes实战(二十八)：Kubernetes一键式资源管理平台Ratel安装及使用
1. Ratel是什么? Ratel是一个Kubernetes资源平台,基于管理Kubernetes的资源开发,可以管理Kubernetes的Deployment.DaemonSet.Stateful ...
入门项目数字手写体识别：使用Keras完成CNN模型搭建（重要）
摘要: 本文是通过Keras实现深度学习入门项目——数字手写体识别,整个流程介绍比较详细,适合初学者上手实践. 对于图像分类任务而言,卷积神经网络(CNN)是目前最优的网络结构,没有之一.在面部识别. ...
CPU/GPU/TPU/NPU...XPU都是什么意思？
CPU/GPU/TPU/NPU...XPU都是什么意思? 现在这年代,技术日新月异,物联网.人工智能.深度学习等概念遍地开花,各类芯片名词GPU, TPU, NPU,DPU层出不穷......都是什么 ...

随机推荐

光流（optical flow）和openCV中实现
转载请注明出处! ! ! http://blog.csdn.net/zhonghuan1992 光流(optical flow)和openCV中实现光流的概念: 是Gibson在195 ...
HDU 5371 Hotaru's problem（Manacher算法+贪心）
manacher算法详见 http://blog.csdn.net/u014664226/article/details/47428293 题意:给一个序列,让求其最大子序列,这个子序列由三段组成, ...
WTF
WTF ,luna黑色主题比较sublime 还是差点!
redis02---对于key的操作命令
Redis对于key的操作命令 del key1 key2 ... Keyn 作用: 删除1个或多个键返回值: 不存在的key忽略掉,返回真正删除的key的数量 rename key newkey ...
Vue 中的受控与非受控组件
Vue 中的受控与非受控组件熟悉 React 的开发者应该对"受控组件"的概念并不陌生,实际上对于任何组件化开发框架而言,都可以实现所谓的受控与非受控,Vue 当然也不例外.并且 ...
HDU3652 B-number —— 数位DP
题目链接:https://vjudge.net/problem/HDU-3652 B-number Time Limit: 2000/1000 MS (Java/Others) Memory L ...
织梦系统如何设置URL绝对路径及绝对路径的好处
今天,和大家分享下织梦系统如何设置URL绝对路径及绝对路径的好处,我的一些就是用的织梦系统,感觉织梦在SEO优化方面做的还是非常好的,至少在CMS系统中应该是做的最出色的吧!下面,我就先来讲下这个织梦 ...
一步一步学Silverlight 2系列（22）：在Silverlight中如何用JavaScript调用.NET代码
概述 Silverlight 2 Beta 1版本发布了,无论从Runtime还是Tools都给我们带来了很多的惊喜,如支持框架语言Visual Basic, Visual C#, IronRuby, ...
一步一步学Silverlight 2系列（10）：使用用户控件
概述 Silverlight 2 Beta 1版本发布了,无论从Runtime还是Tools都给我们带来了很多的惊喜,如支持框架语言Visual Basic, Visual C#, IronRuby, ...
WC2017游记
Day0 到杭州之后出了点锅换了辆车,等了好久才开= =到宿舍发现路由器就在房门口,稳啊,过了一会儿就连不上了= =而且只有门口那个连不上,可以连上楼下的= =之后干了啥也忘了…… Day1 上午直接 ...

Caffe实战二（手写体识别例程：CPU、GPU、cuDNN速度对比）

Caffe实战二（手写体识别例程：CPU、GPU、cuDNN速度对比）的更多相关文章

随机推荐

热门专题