一、caffe-windows之彩色图像分类例程cifar10

训练测试网络模型【参考1】【参考2】

1. 准备数据

下载二进制数据集数据集，下载链接为http://www.cs.toronto.edu/~kriz/cifar-10-binary.tar.gz，在linux或是w10系统下，也可以直接运行.sh文件下载数据。
解压压缩包，得到6个bin文件和一个batches.meta.txt文件，其中data_batch_1.bin到bata_batch_5.bin是训练数据集，由50000张32*32的彩图组成，test_batch.bin是测试数据集，由10000张32*32的彩图组成，batches.meta.txt为标签文件。

2. 数据格式转换

在examples/cifar10/下新建一个input_folder文件夹，将6个bin文件放入；

利用convert_cifar_data.exe可执行程序转换数据，可以转换成leveldb或mldb格式，直接存放在examples/cifar10/文件夹中。

 //leveldb

 Build\x64\Release\convert_cifar_data.exe examples\cifar10\input_folder examples\cifar10 leveldb

 //lmdb

 Build\x64\Release\convert_cifar_data.exe examples\cifar10\input_folder examples\cifar10 lmdb

3. 计算数据均值文件

利用compute_image_mean.exe来得到数据集的均值文件，可以根据leveldb格式数据集或是lmdb格式数据集，命令如下：

//leveldb，因为默认数据时lmdb格式，所以要用leveldb格式，需要用-backend字段指明。

Build\x64\Release\compute_image_mean.exe  -backend=leveldb examples\cifar10\cifar10_train_leveldb examples\cifar10\mean.binaryproto

//lmdb

Build\x64\Release\compute_image_mean.exe examples\cifar10\cifar10_train_lmdbdb examples\cifar10\mean.binaryproto

4. 训练模型

确定网络模型描述文件为examples/cifar10/cifar10_quick_train_test.prototxt，超参数配置文件为cifar10_quick_solver.prototxt.
如果是lmdb格式数据，只要修改cifar10_quick_solver.prototxt中的solver_mode改为CPU就好；

如果是leveldb格式的话，cifar10_quick_train_test.prototxt中的数据source需要修改，同时backend需要改成LEVELDB。
执行训练命令
```
 Build\x64\Release\caffe.exe train -solver examples\cifar10\cifar10_quick_solver.prototxt
```
【执行结果】：accruacy有0.7083，loss有0.867989，保存的快照文件为cifar10_quick_iter_4000.caffemodel.h5，cifar10_quick_iter_4000.solverstate.h5

5. 测试网络模型

准备一张待识别的彩色图像，缩放到32*32.
确定识别网络模型描述文件为examples\cifar10\cifar10_quick.prototxt，模型权值文件为examples\cifar10\cifar10_quick_iter_4000.caffemodel.h5，数据集均值文件为examples\cifar10\mean.binaryproto，数据集标签文件为examples\cifar10\batches.meta.txt

利用classification.exe调用网络识别图像

 Build\x64\Release\classification.exe examples\cifar10\cifar10_quick.prototxt examples\cifar10\cifar10_quick_iter_4000.caffemodel.h5 examples\cifar10\mean.binaryproto examples\cifar10\batches.meta.txt examples\cifar10\dog.jpg

识别结果0.7744的概率为狗。

二、利用上述网络训练自己的24类字母数据集实现字母识别

之前用mnist的网络去分类，发现效果不好，这次用cifar网络试一下。

数据集包括24个类别的字母（A-Z），每类字母有90张左右的样本。抽取每类样本中的70张，共1680张样本组成训练数据集，剩余466张的样本组成测试数据集。

训练网络的过程与上述过程类似：

准备数据，得到训练标签文件char-trainData.txt和测试标签文件char-testData.txt，文件中的每一行为“样本图像路径+' '+标签” ;

数据集格式转换为lmdb格式，因为cifar10数据集是32*32的彩图，因此这里也将数据集转换成32*32大小的。

 //train-data

 Build\x64\Release\convert_imageset.exe --resize_height=32 --resize_width=32 examples\my_project\char\ examples\my_project\char\char-trainData.txt examples\my_project/char/char_trainData_db

 //test-data

 Build\x64\Release\convert_imageset.exe --resize_height=32 --resize_width=32 examples\my_project\char\ examples\my_project\char\char-testData.txt examples\my_project/char/char_testData_db

得到数据集均值文件

 Build\x64\Release\compute_image_mean.exe examples\my_project\char\char_trainData_db examples\my_project\char\mean.binaryproto

修改网络描述文件和超参数配置文件

cifar10_quick_solver.prototxt里只要修改网络路径net、测试迭代次数test_iter、快照保存路径snapshot_prefix。

cifar10_quick_train_test.prototxt里要修改的有：均值文件路径mean_file、训练或测试数据路径source、单批训练或测试的数量batch_size、最终网络输出的类别数num_output。
训练网络

训练结果如下，最终可以得到0.975的识别准确率，如第一张图所示，但在迭代训练3500次的时候，网络识别准确率更好，达到了0.981818，如图第二张图所示。
```
 Build\x64\Release\caffe.exe train -solver examples\my_project\char\cifar10_quick_solver.prototxt
```

caffe-windows之彩色图像分类例程cifar10的更多相关文章

【转】[caffe]深度学习之图像分类模型AlexNet解读
[caffe]深度学习之图像分类模型AlexNet解读原文地址:http://blog.csdn.net/sunbaigui/article/details/39938097 本文章已收录于: ...
caffe windows学习：第一个测试程序
caffe windows编译成功后,就可以开始进行测试了.如果还没有编译成功的,请参考:caffe windows 学习第一步:编译和安装(vs2012+win 64) 一般第一个测试都是建议对手写 ...
caffe windows 学习第一步：编译和安装（vs2012+win 64)
没有GPU,没有linux, 只好装caffe的windows版本了. 我的系统是win10(64位),vs 2012版本,其它什么都没有装,因此会需要一切的依赖库. 其实操作系统只要是64位就行了, ...
[caffe]深度学习之图像分类模型VGG解读
一.简单介绍 vgg和googlenet是2014年imagenet竞赛的双雄,这两类模型结构有一个共同特点是go deeper.跟googlenet不同的是.vgg继承了lenet以及alexnet ...
caffe windows编译
MicroSoft维护的caffe已经作为官方的caffe分支了,编译方式也改了,刚好最近重装了一次caffe windows, 记录一下里面的坑 https://github.com/BVLC/ca ...
Kinect v1 (Microsoft Kinect for Windows v1 )彩色和深度图像对的采集步骤
Kinect v1 (Microsoft Kinect for Windows v1 )彩色和深度图像对的采集步骤一.在ubuntu下尝试 1. 在虚拟机VWware Workstation 12. ...
基于Kaggle的图像分类（CIFAR-10）
基于Kaggle的图像分类(CIFAR-10) Image Classification (CIFAR-10) on Kaggle 一直在使用Gluon's data package数据包直接获得张量 ...
[caffe]深度学习之图像分类模型AlexNet解读
在imagenet上的图像分类challenge上Alex提出的alexnet网络结构模型赢得了2012届的冠军.要研究CNN类型DL网络模型在图像分类上的应用,就逃不开研究alexnet.这是CNN ...
Caffe+Windows 环境搭建收集
Caffe+Anconda3+VS2015+Win10(64位)环境搭建 Caffe on Windows (Visual Studio 2015+CUDA8.0+cuDNNv5) Win10+VS2 ...

随机推荐

linux负载均衡与性能监控
平均负载是单位时间内, 系统处于可运行状态和不可中断状态的平均进程数( 平均活跃进程数 ) 可运行状体好理解, 就是进程正在运行状态Running和可运行状态Runnable... 这里需要注意的是 ...
百度地图中使用mouseover事件获取经纬度时无法拿到鼠标所在位置的经纬度。
用百度2.0的话使用mousemove 鼠标在地图区域移动过程中触发此事件.mouseover参数e中没有point参数
分布式中为什么要加入redis缓存的理解
面我们介绍了mybatis自带的二级缓存,但是这个缓存是单服务器工作,无法实现分布式缓存.那么什么是分布式缓存呢?假设现在有两个服务器1和2,用户访问的时候访问了1服务器,查询后的缓存就会放在1服务器 ...
创建一个流（Stream）可以让Bitmap或Image保存到流里面
创建一个流(Stream)可以让Bitmap或Image保存到流里面 http://blog.csdn.net/angxiao/article/details/7481465 写文件流 ...
python 函数的作用域，闭包函数的用法
一.三元表达式 if条件成功的值 if 条件 else else条件成功的值 #if条件成立的结果 if 条件 else else条件成立的结果 # a = 20 # b = 10 # c ...
PIE SDK介绍
1. 产品概述 PIE-SDK是航天宏图自主研发的PIE二次开发组件包,集成了专业的遥感影像处理.辅助解译.信息提取.专题图表生成.二三维可视化等功能.底层采用微内核式架构,由跨平台的标准C++编写, ...
PIE SDK导出图片
1. 功能简介导出图片功能可以将制图模板以及视图.绘制元素.制图元素等保存为图片.本示例程序实现了专题制图下导出图片功能. 2. 功能实现说明 2.1导出图片 2.2 实现思路及原理说明调用IPa ...
CAPL编程实现诊断刷写，车联网FOTA流程自动化测试（代码篇）
原创内容,转载请注明出处接上篇,本文主要讲CAPL编程详细实现,软件环境CANoe 11.0 一.Simulation Setup 1.建模之前,首先创建一个.DBC文件.如果不会,可以用一个 ...
oracle 查看一个表中的记录是否被锁住
SELECT a.object_id, a.session_id, b.object_nameFROM v$locked_object a, dba_objects bWHERE a.object_i ...
ActiveMQ的单节点和集群部署
平安寿险消息队列用的是ActiveMQ. 单节点部署: 下载解压后,直接cd到bin目录,用activemq start命令就可启动activemq服务端了. ActiveMQ默认采用61616端口提 ...

caffe-windows之彩色图像分类例程cifar10