转自网站：

http://blog.csdn.net/muyiyushan/article/details/70578077

1.准备数据

使用dog/cat数据集，在训练项目根目录下分别建立train和val文件夹，作为训练数据和验证数据的保存位置。train和val文件夹下各有两个文件夹：dogs和cats，分别保存dog和cat的图片。dog和cat分别有1000张训练图像和400张测试图像。

写一个python脚本文件，遍历train和val两个文件夹，分别生成train.txt和val.txt，其中保存图片的相对路径和标签。类似下面格式，但是最好要将cat和dog的路径顺序打乱，不要一开始全cat,之后全是dog。

/cats/cat.0.jpg 0

/cats/cat.1.jpg 0

/cats/cat.10.jpg 0

/cats/cat.100.jpg 0

/cats/cat.101.jpg 0

/cats/cat.102.jpg 0

/cats/cat.103.jpg 0

/cats/cat.104.jpg 0

2.数据预处理

2.1转换数据格式

使用convert_imageset.exe将原始图像转换成caffe直接读取的格式：lmdb或leveldb。默认是lmdb，如果要生成leveldb，要添加–backend=leveldb参数。建立convert_image.bat文件，里面命令如下。

SET GLOG_logtostderr=1

E:\Code\Caffe\caffe-master\caffe-master\Build\x64\Release\convert_imageset.exe --resize_width=256 --resize_height=256 E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\train E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\train.txt E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\trainldb

E:\Code\Caffe\caffe-master\caffe-master\Build\x64\Release\convert_imageset.exe  --resize_width=256 --resize_height=256 E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\val\ E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\val.txt E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\valldb

pause

参数说明：
1. E:\Code\Caffe\caffe-master\caffe-master\Build\x64\Release\convert_imageset.exe是执行程序路径。
2. –resize_width=256 –resize_height=256重新指定生成图像大小。
3. E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\train是训练图像存储位置。
4. E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\train.txt训练图像的索引文件。
5. E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\trainldb生成的lmdb格式文件路径。

测试图像同上。

注意：3的路径和4中train.txt里指定路径连接在一块是图像的绝对路径，否则找不到图片）
执行convert_image.bat文件，即可生成lmdb文件，分别保存在指定路径中。

2.3计算图像均值

建立compute_mean.bat并执行，内容如下

E:\Code\Caffe\caffe-master\caffe-master\Build\x64\Release\compute_image_mean.exe E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\trainldb E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\train_mean.binaryproto

参数说明
1. E:\Code\Caffe\caffe-master\caffe-master\Build\x64\Release\compute_image_mean.exe是计算均值的执行文件。
2. E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\trainldb上一步生成的了 lmdb文件路径。
3. E:\Code\Caffe\caffe-master\caffe-master\data\dogCat\train_mean.binaryproto生成的均值文件，后缀是.binaryproto。

3.修改配置文件

在项目根目录新建train_val文件夹，将.\caffe-master\models\bvlc_reference_caffenet中的配置文件复制到train_val中。包括train_val.prototxt和solver.prototxt。

train_val.prototxt中修改mean_file路径(训练和测试时用同样的mean file)和data_source的路径，设置相应的batch_size。将最后一层fc8的num_output设置为相应的输出类别数目，也就是2。

solver.prototxt中设置如下。

net: "E:/Code/Caffe/caffe-master/caffe-master/data/dogCat/train_val/train_val.prototxt"

test_iter: 16

test_interval: 50

base_lr: 0.01

lr_policy: "step"

gamma: 0.1

stepsize: 2000

display: 20

max_iter: 10000

momentum: 0.9

weight_decay: 0.0005

snapshot: 500

snapshot_prefix: "E:/Code/Caffe/caffe-master/caffe-master/data/dogCat/caffenet_finetune"

solver_mode: CPU

net参数为刚才设置好的train_val.prototxt。
test_iter为测试时使用的batch个数，test_iter*testbatch_size=test images number。
test_interval: 测试的迭代间隔次数。
max_iter:迭代次数。
…

4.开始训练

建立caffe.bat训练模型。并保存log文件。

5.可视化训练过程

使用log文件可视化accuracy和loss等参数。

6.微调

1-5完成了从头训练一个模型，我们也可以从头训练一个模型。但是这样花费时间很多，而且如果训练数据不够多，训练精度也不高。基于迁移学习的思想，可以用自己的数据finetune用imagenet预训练过的模型，这样减少训练时间，效果也更好。实际上就是参数初始化方法不同。

下载预训练模型。

相应修改train_val.prototxt和solver.prototxt。train_val.prototxt中配置好数据文件路径，将最后一层的名称改掉，设置相应num_output，增大weights和bias的lr_mult（从头训练，要加快速度）。

solver.prototxt中减少初始学习率。

开始训练。

caffe 图片数据的转换成lmdb和数据集均值（转）的更多相关文章

获取minist数据并转换成lmdb
caffe本身是没有数据集的,但在data目录下有获取数据的一些脚本.MNIST,一个经典的手写数字库,包含60000个训练样本和10000个测试样本,每个样本为28*28大小的黑白图片,手写数字为0 ...
7.caffe：create_lmdb.sh（数据预处理转换成lmdb格式）
个人实践代码如下: #!/usr/bin/env sh # Create the imagenet lmdb inputs # N.B. set the path to the imagenet tr ...
【caffe-windows】 caffe-master 之训练自己数据集（图片转换成lmdb or leveldb）
前期准备: 文件夹train:此文件夹中按类别分好子文件夹,各子文件夹里存放相应图片文件夹test:同train,有多少类就有多少个子文件夹 trainlabels.txt : 存的是训练集的标签 ...
【caffe-windows】 caffe-master 之图片转换成lmdb or leveldb
前期准备: 文件夹train:此文件夹中按类别分好子文件夹,各子文件夹里存放相应图片文件夹test:同train,有多少类就有多少个子文件夹 trainlabels.txt : 存的是训练集的标签 ...
base64格式的图片数据如何转成图片
base64格式的图片数据如何转成图片一.总结一句话总结:不仅要去掉前面的格式串,还需要base64_decode()解码才行. // $base_img是获取到前端传递的值 $base_img ...
java中，字符串类型的时间数据怎样转换成date类型。
将字符串类型的时间转换成date类型可以使用SimpleDateFormat来转换,具体方法如下:1.定义一个字符串类型的时间:2.创建一个SimpleDateFormat对象并设置格式:3.最后使用 ...
使用Sql语句快速将数据表转换成实体类
开发过程中经常需要根据数据表编写对应的实体类,下面是使用sql语句快速将数据表转换成对应实体类的代码,使用时只需要将第一行'TableName'引号里面的字母换成具体的表名称就行了: declare ...
利用泛型和反射,管理配置文件,把Model转换成数据行,并把数据行转换成Model
利用泛型和反射,管理配置文件,把Model转换成数据行,并把数据行转换成Model 使用场景:网站配置项目,为了便于管理,网站有几个Model类来管理配置文件, 比如ConfigWebsiteMo ...
python - django 将图片路径地址转换成 InMemoryUploadedFile 并存储数据库
# 问题场景:对接第三方时遇到一个图片存储问题,对方给的是他们服务器的图片路径地址,但是我这里存储图片用的是 ImageField 字段属性,也设置了存储路径,现在一旦将图片显示到前端就会将设置的 ...

随机推荐

35-迷宫寻宝（一）-NYOJ82
http://acm.nyist.edu.cn/JudgeOnline/problem.php?pid=82 迷宫寻宝(一) 时间限制:1000 ms | 内存限制:65535 KB 难度:4 ...
Linux 大页面使用与实现简介(转)
引言随着计算需求规模的不断增大,应用程序对内存的需求也越来越大.为了实现虚拟内存管理机制,操作系统对内存实行分页管理.自内存“分页机制”提出之始,内存页面的默认大小便被设置为 4096 字节(4KB ...
前端（HTML/CSS/JS）-JavaScript编码规范
1. 变量命名 (1)变量名不应以短巧为荣左边的变量名都不太清楚,代码的扩展性不好,一旦代码需要加功能的话,就容易出现obj1.obj2.obj3这种很抽象的命名方式.所以一开始就要把变量的名字起得 ...
分享常用的GoLang包工具
包名链接地址备注 Machinery异步队列 https://github.com/RichardKnop/machinery Mqtt通信 github.com/eclipse/paho.mqt ...
DingTalk代码库机器人尝试
今日室友询问相关机器人的事情,本来对于机器人还是有一些了解的,至少是明白一些简单的原理,包括微信公众号,qq群的只能机器人,以及钉钉的机器人. 首先是说那个关于微信公众号的那个自动回复便可以使用一些机 ...
HDU - 4597 Play Game（博弈dp）
Play Game Alice and Bob are playing a game. There are two piles of cards. There are N cards in each ...
QQ空间爬虫--获取好友信息
QQ空间网页版:https://user.qzone.qq.com/ 登陆后,进入设置,有一个权限设置,设置“谁能看我的空间”为好友可见,然后构造爬虫. (1)获取Cookie 两种方式: 第一种:通 ...
xshell学习笔记
$0:当前Shell程序的文件名dirname $0,获取当前Shell程序的路径cd `dirname $0`,进入当前Shell程序的目录 echo "hvkjvk" > ...
CI框架定义判断POST GET AJAX
CI框架当中并没有提供,类似tp框架中IS_POST,IS_AJAX,IS_GET的方法. 所有就得我们自己造轮子了.下面就介绍一下,如何定义这些判断请求的方法.其实很简单的. 首先打开constan ...
13、OpenCV Python canny边缘提取
__author__ = "WSX" import cv2 as cv import numpy as np def lapalian_demo(image): #拉普拉斯算子 # ...

caffe 图片数据的转换成lmdb和数据集均值（转）