【caffe-windows】 caffe-master 之图片转换成lmdb or leveldb
前期准备:
文件夹train:此文件夹中按类别分好子文件夹,各子文件夹里存放相应图片
文件夹test:同train,有多少类就有多少个子文件夹
trainlabels.txt : 存的是训练集的标签
testlables.txt: 存的是测试集的标签
(特别注意:文件的路径以及文件名要对应)
第一步
生成train文件夹和test文件夹以及标签文件。本文用的是matlab对数据集进行读取,然后输出图片到相应文件夹中,并且生成标签文件。此处给出matlab的代码,请自行分析。
%% 实现图片的输出,将图片输出到train和test两个文件夹下,并且对图片进行重命名
% 同时给所有图片打标签,存于test_labels.txt trainlabels.txt
%
% clear
rand('seed',1);
datadir = ('D:\matconvnet-beta23\data\chars74K\Fnt'); % 原数据集所在路径
catedir=dir(datadir); % 获取数据集下信息
trainratio = 0.8; % 百分之八十训练
train_labels= fopen('train_labels.txt','wt'); % 创建标签文件
test_labels = fopen('test_labels.txt','wt');
class_num = 0 ; % 记录类别
for i =3:length(catedir)
sampdir=dir(fullfile(datadir,catedir(i).name,'\*.png')); % 获取类文件夹下 png图片,
disp(['category ', num2str(i-2) , ' have ', num2str(length(sampdir)),'instance.']); new_folder_train = ['./train/',catedir(i).name]; % 创建各类文件夹,按第i类创建
new_folder_test = ['./test/',catedir(i).name];
mkdir(new_folder_train);
mkdir(new_folder_test);
class_num =class_num + 1;
for j = 1:length(sampdir)
if j==1
krand = randperm(length(sampdir)); % 随机选取图片,防止过拟合
end
kk = krand(j);
img = imread(fullfile(datadir,catedir(i).name,sampdir(j).name)); % 读取
name = [catedir(i).name,'\',sampdir(kk).name]; % 输出每张图片的名称 if j < length(sampdir) *trainratio % j是读取的第j个样本(子类中),j小于**时,设置为1,1是表示训练
imwrite(img,[new_folder_train,'/',sampdir(kk).name]); % 注 :‘.png’
fprintf(train_labels,'%s %s\n',name,num2str(class_num-1)); % 从0开始编号,写label的txt文件
else
imwrite(img,[new_folder_test,'/',sampdir(kk).name]);
fprintf(test_labels,'%s %s\n',name,num2str(class_num-1)); % 从0开始编号
end
disp(['category ', num2str(i-2) , ' have ', num2str(length(sampdir)-2),' sample. ' ...
'sample ', ' ------ ', num2str(j) ]);
end
end
fclose(train_labels);
fclose(test_labels);
来看看生成的文件,此处将数据存于caffe-master\data\Chars74k下,因此train和test文件夹是在caffe-master\data\Chars74k下。
如图所示,train文件夹里有62个子文件夹,分别代表62个类别,每个子文件夹里就是图片。Test文件夹同理。
如图所示,这训练集的标签文件,分两个部分。第一部分是路径,此处要注意, “Sample001\img001-00051.png ” 要与train文件夹里的图片的文件名一一对应,否则在用convert_imageset.exe进行转换格式时候会出现 找不到文件的提示。
(PS:我直接就是在matlab中输出图片时,多加了’.png’,导致图片的文件名是 Sample001\img001-00051.png.png 最终导致找不到文件)
第二部分就是标签了,这里的标签是从0开始表示第一个类别。特别注意,txt文件中,文件路径和标签中有一个空格。
- 第二步
有了train和test以及对应标签文件,就可以利用 convert_imageset.exe将图片转换成LMDB或者LEVELDB的格式,这里采用批处理的方式。首先在caffe-master\data\Chars74k 文件夹下创建txt文件重命名为:convert_chars74k_LMDB.bat
一定要把后缀改成 .bat ,然后将以下代码复制到文本中,保存。
D:\caffe-master\Build\x64\Release\convert_imageset.exe --resize_width= --resize_height= ./train/ train_labels.txt train_lmdb -backend=lmdb
D:\caffe-master\Build\x64\Release\convert_imageset.exe --resize_width= --resize_height= ./test/ test_labels.txt test_lmdb -backend=lmdb
Pause
这里的每行包含七个部分,第一个部分:D:\caffe-master\Build\x64\Release\convert_imageset.exe 表示 convert_imageset.exe所在路径(PS,若是用Debug生成的,则在将Release改成Debug即可)
第二、三部分,是对原始图片进行了resize,第四部分:
./train/ 是训练图片文件所在路径,此处用了相对路径的形式(不了解相对路径的同学,请度娘 ./ ../的作用) 第五部分,train_labels.txt是训练集的标签
第六部分:train_lmdb 是生成LMDB格式文件的文件名
第七部分:-backend=lmdb 是所要转成的格式(要转成 leveldb的则改成 -backend=leveldb)
然后双击运行convert_chars74k_LMDB.bat
运行正常的话,在文件夹caffe-master\data\Chars74k下会出现
test_lmdb 和train_lmdb 两个文件夹。至此,已经将自己的数据集转换成为LMDB格式的数据了,即caffe可读的数据格式。
- 第三步
训练
此处和训练Mnist和Cifar-10一样可参考(http://blog.csdn.net/u011995719/article/details/53998331)
训练需要写两个prototxt文件,一个是描述网络结构的,一个是超参数的设定。
如图所示,一个是网络模型描述,一个是超参数设置,特别注意路径。
写好这两个文件之后,就可以利用caffe.exe进行训练啦。
在文件夹caffe-master\data\Chars74k下,创建txt文件,重命名为caffe_train_Chars74k.bat(注意改后缀),然后复制以下代码:
..\..\Build\x64\Release\caffe.exe train --solver=./Chars74k_solver.prototxt
Pause
同样的,注意路径就好。保存之后,双击运行即可。
【caffe-windows】 caffe-master 之图片转换成lmdb or leveldb的更多相关文章
- 【caffe-windows】 caffe-master 之 训练自己数据集(图片转换成lmdb or leveldb)
前期准备: 文件夹train:此文件夹中按类别分好子文件夹,各子文件夹里存放相应图片 文件夹test:同train,有多少类就有多少个子文件夹 trainlabels.txt : 存的是训练集的标签 ...
- 获取minist数据并转换成lmdb
caffe本身是没有数据集的,但在data目录下有获取数据的一些脚本.MNIST,一个经典的手写数字库,包含60000个训练样本和10000个测试样本,每个样本为28*28大小的黑白图片,手写数字为0 ...
- 使用CSS将图片转换成黑白(灰色、置灰)z转
小tip: 使用CSS将图片转换成黑白(灰色.置灰) by zhangxinxu from http://www.zhangxinxu.com 本文地址:http://www.zhangxinxu.c ...
- [转]C#将image中的显示的图片转换成二进制
本文转自:http://www.cnblogs.com/shuang121/archive/2012/07/09/2582654.html .将Image图像文件存入到数据库中 我们知道数据库里的Im ...
- 小tip: 使用CSS将图片转换成模糊(毛玻璃)效果
去年盛夏之时,曾写过“小tip: 使用CSS将图片转换成黑白”一文,本文的模式以及内容其实走得是类似路线.CSS3 → SVG → IE filter → canvas. 前段时间,iOS7不是瓜未熟 ...
- ABBYY如何把图片转换成pdf格式
在制作工作文件的时候,有时候会遇到需要进行文件格式转换的情况,比较常见的文件格式转换就包含了Office与pdf格式之间的转换.但除此之外,图片与pdf格式也是可以进行转换的,那么图片要怎么操作,才能 ...
- [转] 小tip: 使用CSS将图片转换成模糊(毛玻璃)效果 ---张鑫旭
by zhangxinxu from http://www.zhangxinxu.com本文地址:http://www.zhangxinxu.com/wordpress/?p=3804 去年盛夏之时, ...
- C#将image中的显示的图片转换成二进制
原文:C#将image中的显示的图片转换成二进制 1.将Image图像文件存入到数据库中 我们知道数据库里的Image类型的数据是"二进制数据",因此必须将图像文件转换成字节数组才 ...
- 运用C语言将图片转换成16进制的字符串(base64)
最近在写手机端的性能测试脚本的时候,发现手机在上传图片数据时,先将图片转换成一堆16进制的字符,将字符传输过去,服务器再将字符解码成图片 我们在loadrunner中测试时,就需要用C语言将图片编码. ...
随机推荐
- bzoj 1003 [ZJOI2006]物流运输(最短路+dp)
[ZJOI2006]物流运输 Time Limit: 10 Sec Memory Limit: 162 MBSubmit: 8973 Solved: 3839[Submit][Status][Di ...
- hdu 5976 Detachment 脑洞题 猜结论
题目链接 题意 将\(x\)拆成\(a_1+a_2+...+\)的形式,且\(a_1\lt a_2\lt...\),使得\(a_1*a_2*...\)取到最大值 思路 大胆猜结论. 首先拆分的形式中肯 ...
- 【Visual Studio】让用VS2012/VS2013编写的程序在XP中顺利运行(转)
原文转自 http://blog.csdn.net/asanscape/article/details/38752655 微软为了推销自家平台,默认配置下VS2012和VS2013编写的应用程序只能在 ...
- 标准C程序设计七---70
Linux应用 编程深入 语言编程 标准C程序设计七---经典C11程序设计 以下内容为阅读: <标准C程序设计>(第7版) 作者 ...
- 详解DNS域名解析全过程
关于dns域名解析的大致过程很多人都知道,但有些细枝末节的东西容易遗忘,今天有空整理一下,作为以后复习用,如有不对的地方,还望指正.解析大致过程如图(不喜欢看图的可以直接跳过): 当一个用户在地址栏输 ...
- vs-插件+配置
{ "window.zoomLevel": 0, "files.autoSave": "off", "editor.fontSiz ...
- netty-类图对比
- GeoServer自动发布地图服务
1 NetCDF气象文件自动发布案例 GeoServer是一个地理服务器,提供了管理页面进行服务发布,样式,切片,图层预览等一系列操作,但是手动进行页面配置有时并不满足业务需求,所以GeoServer ...
- android studio 在线更新android sdk,遇到无法Fetching https://dl-ssl.google.com/...的解决方案
最近实在受不了eclipse的“迟钝”,准备入手Android studio开发环境,但是貌似不太顺利,成功安装了Android studio,在线更新Android adk的时候,总是遇到如下错误: ...
- linux安装开源邮件服务器iredmail的方法:docker
直接安装的方法,参考网文,我不介绍.本文介绍的是快速的方法:docker 使用镜像源:https://hub.docker.com/r/lejmr/iredmail/,因为pull的数量最多 直接 d ...