CaffeExample 在CIFAR-10数据集上训练与测试

于繁华求淡然 2024-10-01 10:42:24 原文

本文主要来自Caffe作者Yangqing Jia网站给出的examples。

@article{jia2014caffe,

  Author = {Jia, Yangqing and Shelhamer, Evan and Donahue, Jeff and Karayev, Sergey and Long, Jonathan and Girshick, Ross and Guadarrama, Sergio and Darrell, Trevor},

  Journal = {arXiv preprint arXiv:1408.5093},

  Title = {Caffe: Convolutional Architecture for Fast Feature Embedding},

  Year = {2014}

}

1.cuda-convnet

采用的网络是Alex Krizhevsky的cuda-convnet，链接中详细描述了模型的定义、所用的参数、训练过程，在CIFAR-10上取得了很好的效果。

2.数据集的准备

本实验使用的数据集是CIFAR-10，一共有60000张32*32的彩色图像，其中50000张是训练集，另外10000张是测试集。数据集共有10个类别，分别如下所示

下面假定caffe的根目录是CAFFE_ROOT，在终端输入命令下载数据集：

cd $CAFFE_ROOT

./data/cifar10/get_cifar10.sh  #该脚本会下载二进制的cifar，并解压，会在/data/cifar10中出现很多batch文件

./examples/cifar10/create_cifar10.sh  #运行后将会在examples中出现数据集./cifar10_xxx_lmdb和数据集图像均值./mean.binaryproto

3.模型

CIFAR-10的卷积神经网络模型由卷积层，pooling层，ReLU，非线性变换层，局部对比归一化线性分类器组成。该模型定义在CAFFE_ROOT/examples/cifar10/cifar10_quick_train_test.prototxt中。

4.训练和测试“quick”模型

写好网络定义和solver以后，开始训练模型。输入下面的命令：

cd $CAFFE_ROOT

 ./examples/cifar10/train_quick.sh  #先以0.001的学习率迭代4000次，再以0.01的学习率接着再迭代1000次，共5000次

可以看到每一层的详细信息、连接关系及输出的形式，方便调试。

初始化后开始训练：

在solver的设置中，每100次迭代会输出一次训练损失，测试是500次迭代输出一次：

训练阶段，lr是学习率，loss是训练函数。测试阶段，score 0是准确率，score 1是损失函数。最后的结果：

测试准确率大约有0.75，模型参数存储在二进制protobuf格式的文件cifar10_quick_iter_5000中。
参考CAFFE_ROOT/examples/cifar10/cifar10_quick.prototxt的模型定义，就可以训练其他数据了。

5.GPU使用

CIFAR-10比较小，可以用GPU训练，当然也可以用CPU训练。为了比较CPU和GPU的训练速度，通过修改cifar*solver.prototxt中的一行代码来实现。

# solver mode: CPU or GPU

solver_mode: CPU

1
2

6.”full”模型

同理可以训练full模型，full模型比quick模型迭代次数多，一共迭代70000次，前60000次学习率是0.001，中间5000次学习率是0.0001，最后5000次学习率是0.00001。full模型的网络层数也比quick模型多。
命令是：

cd $CAFFE_ROOT

./examples/cifar10/train_full.sh

1
2

测试准确率也比quick模型高，大约有0.82。

转自 http://blog.csdn.net/liumaolincycle/article/details/47258937

CaffeExample 在CIFAR-10数据集上训练与测试的更多相关文章

Ubuntu14.04+caffe+cuda7.5 环境搭建以及MNIST数据集的训练与测试
Ubuntu14.04+caffe+cuda 环境搭建以及MNIST数据集的训练与测试一.ubuntu14.04的安装: ubuntu的安装是一件十分简单的事情,这里给出一个参考教程: http:/ ...
(2) 用DPM(Deformable Part Model，voc-release4.01)算法在INRIA数据集上训练自己的人体检測模型
步骤一,首先要使voc-release4.01目标检測部分的代码在windows系统下跑起来: 參考在window下执行DPM(deformable part models) -(检測demo部分) ...
[PocketFlow]解决TensorFLow在COCO数据集上训练挂起无输出的bug
1. 引言因项目要求,需要在PocketFlow中添加一套PeleeNet-SSD和COCO的API,具体为在datasets文件夹下添加coco_dataset.py, 在nets下添加pelee ...
【翻译】TensorFlow卷积神经网络识别CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow
原网址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Published May 21, ...
【神经网络与深度学习】基于Windows+Caffe的Minst和CIFAR—10训练过程说明
Minst训练我的路径:G:\Caffe\Caffe For Windows\examples\mnist 对于新手来说,初步完成环境的配置后,一脸茫然.不知如何跑Demo,有么有!那么接下来的教 ...
Caffe初试（二）windows下的cafee训练和测试mnist数据集
一.mnist数据集 mnist是一个手写数字数据库,由Google实验室的Corinna Cortes和纽约大学柯朗研究院的Yann LeCun等人建立,它有60000个训练样本集和10000个测试 ...
TersorflowTutorial_MNIST数据集上简单CNN实现
MNIST数据集上简单CNN实现觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考文献 Tensorflow机器学习实战指南源代码请点击下方链接欢迎加星 Tesorflow实现基于MNI ...
深度学习笔记 (二) 在TensorFlow上训练一个多层卷积神经网络
上一篇笔记主要介绍了卷积神经网络相关的基础知识.在本篇笔记中,将参考TensorFlow官方文档使用mnist数据集,在TensorFlow上训练一个多层卷积神经网络. 下载并导入mnist数据集首 ...
基于深度学习和迁移学习的识花实践——利用 VGG16 的深度网络结构中的五轮卷积网络层和池化层，对每张图片得到一个 4096 维的特征向量，然后我们直接用这个特征向量替代原来的图片，再加若干层全连接的神经网络，对花朵数据集进行训练（属于模型迁移）
基于深度学习和迁移学习的识花实践(转) 深度学习是人工智能领域近年来最火热的话题之一,但是对于个人来说,以往想要玩转深度学习除了要具备高超的编程技巧,还需要有海量的数据和强劲的硬件.不过 Tens ...

随机推荐

在webstrorm中配置好es6 babel【更新：在webstorm中配置.vue和.vue文件中支持es6】
第一步:全局安装babel-cli npm install -g babel-cli 第二步,新建一个空项目,在 WebStorm 中的当前项目中打开 Terminal,进入项目的根目录下, 安装 E ...
android黑科技系列——手机端破解神器MT的内购VIP功能破解教程
一.前言在破解app的时候,我们现在几乎都是在PC端进行操作,但是之前bin神的MT管理器,可以在手机端直接破解,不过也有很大的局限性,但是对于一些简单的app破解没问题的.这个工具其实原理也很简单 ...
二分图的最大独立集最大匹配解题 Hopcroft-Karp算法
二分图模型中的最大独立集问题:在二分图G=(X,Y;E)中求取最小的顶点集V* ⊂ {X,Y},使得边 V*任意两点之间没有边相连. 公式: 最大独立集顶点个数 = 总的顶点数(|X|+|Y|)- 最 ...
参数转对象类似 ?camera=1&travel=0&faceScore=1
parseQueryString(url) { var obj = {}; var keyvalue = []; var key = "", value = "" ...
Ext未定义问题解决
做的项目用到EXT.NET,调试时候没问题,发布到IIS上出现EXT未定义,把项目的应用程序池改为Classic 模式就可以了.
RxSwift文档搜集与备份
http://reactivex.io The Observer pattern done right ReactiveX is a combination of the best ideas fro ...
python笔记4----字典
1.哈希: 输入任意长度,输出固定长度. 即判断是否哈希,即判断可不可变. 2.创建字典 (1)直接创建:dic={1:'a',2:'b',3:'c'} (2)dict函数创建: list=[(1,' ...
简单JavaScript小程序
<!DOCTYPE html><html> <head> <meta charset="UTF-8"> ...
微信小程序：获取地理定位和显示相应的城市名称。
最近在看微信小程序,遇到地理定位显示城市名称的问题.本文就是记录这一过程. 解决方案 ...
基于Tags的简单内容推荐的实现
原来为了简单方便,自己小网站上的文章页的相关内容推荐就是从数据库里随机抽取数据来填充一个列表,所以一点相关性都没有,更本没有办法引导用户去访问推荐内容. 算法选择如何能做到相似内容的推荐呢,碍于小网 ...