1. 准备自己的图片数据

选用部分的Caltech数据库作为训练和测试样本。Caltech是加州理工学院的图像数据库，包含Caltech101和Caltech256两个数据集。该数据集是由Fei-FeiLi, Marco Andreetto, Marc 'Aurelio Ranzato在2003年9月收集而成的。Caltech101包含101种类别的物体，每种类别大约40到800个图像，大部分的类别有大约50个图像。Caltech256包含256种类别的物体，大约30607张图像。图像如下图所示，下载链接为：http://www.vision.caltech.edu/Image_Datasets/Caltech101/

Caltech其中的airplanes、Faces、Motorbikes、watch 4个类别分别包含800、435、798、239张图片，选用这4种图片训练和测试数据。

airplanes：

Faces：

Motorbikes：

watch：

2. 图片重命名

为了清楚的分类，收集的图片按照各自的分类重命名一下（该过程也可以省略），airplanes、Faces、Motorbikes和watch类别中的图片分别以0、1、2、和3作为名称的第一个字母（如上图所示，已经做好了重命名），代表自己的分类。python实现的文件批量重命名：

import os

def renameImage(pathFile,label):

    startNum=0

    for files in os.listdir(pathFile):

        oldDir=os.path.join(pathFile,files)

        if os.path.isdir(oldDir):

            continue

        filename=os.path.splitext(files)[0]

        filetype=os.path.splitext(files)[1]

        newDir=os.path.join(pathFile,str(label)+'_'+str(startNum)+filetype)

        os.rename(oldDir,newDir)

        startNum+=1

        print(oldDir+' 重命名为： '+newDir)

renameImage('D:\\0704\\Motorbikes',2)

renameImage函数第一个参数是需要重命名的文件所在文件夹路径，第二个参数是图片分类。

3. 灰度图转换&&图片大小统一

Caltech中的图片是三通道彩色图片，大小不统一，需要修改成单通道灰度图片，统一修改成64*64大小：

import cv2

import os

import numpy

def Resize(pathFile,reSizeFile):

    for files in os.listdir(pathFile):

        imagePathFile=os.path.join(pathFile,files)

        img=cv2.imread(imagePathFile,0)

        imgResize=cv2.resize(img,(64,64),interpolation=cv2.INTER_CUBIC)

        reSizeDir=os.path.join(reSizeFile,files)

        cv2.imwrite(reSizeDir,imgResize)

        print(imagePathFile+' 调整大小成功，存放路径在： '+reSizeFile)

Resize('D:\\0704\\Motorbikes','D:\\0704\\RMotorbikes')

第一个参数是的图片文件所在路径，第二个参数是保存路径。

4. 生成Label文件

图片准备好之后开始制作label标签文件，格式是 “xx.jpg 0”，python实现：

import os

def maketxtList(imageFile,pathFile,label):

    fobj=open(pathFile,'a')

    for files in os.listdir(imageFile):

        fobj.write('\n'+files+' '+str(label))

        print(files+' '+str(label)+' 写入成功！')

    fobj.close()

maketxtList('D:\\0704\\Testwatch','D:\\0704\\testLabel.txt',3)

第一个参数是在第3步处理好的图片路径，第二个参数是生成的标签文件，第三个参数是标签，生成的标签如下：

测试数据集分别取airplanes、Faces、Motorbikes、watch各200、200、200、100张图片共700张，按同样的方法生成测试标签。

5. 转化成lmdb数据库文件

新建一个MakeLmdb.bat的脚本文件，使用caffe中的convert_imageset.exe工具转化图片数据为lmdb数据文件：

D:\Software\Caffe\caffe-master\Build\x64\Release\convert_imageset.exe

D:\0704\testImage\ D:\0704\testLabel.txt D:\0704\test_lmdb

pause

执行结果：

分别生成train_lmdb和 test_lmdb文件：

6. 计算均值文件mean.binaryproto

计算均值文件备用：

D:\Software\Caffe\caffe-master\Build\x64\Release\compute_image_mean.exe

D:\0704\test_lmdb D:\0704\mean_test.binaryproto

pause

7. 建立CNN网络和训练参数

CNN网络和训练参数文件使用caffe中mnist例子中的 “lenet_train_test.prototxt” 和 “lenet_solver.prototxt”两个文件，做一些参数修改：

lenet_solve.prototxt文件参数修改：

测试数据量比较少，这里的test_iter参数修改为20，另一个就是基础学习率设置为0.0001，这个参数比较重要，需要根据实际情况调整，如果按照之前学习率设置为0.01的话，会出现训练过程中loss一直保持87.3365（其实已经溢出了）这个值不变的情况。

lenet_train_test.prototxt文件参数修改：

1. 修改训练和测试lmdb数据路径和训练数据每组包含数据（batch_size），这里的batch_size不宜设置过小，建议最少为20：

2. 修改输出层 ip2中的输出由10改为4，这里的4代表训练分为4种分类：

8. 执行训练

D:\Software\Caffe\caffe-master\Build\x64\Release\caffe.exe

train --solver=D:\0704\lenet_solver.prototxt

pause

训练结果，accuracy为0.9928：

python+caffe训练自己的图片数据流程的更多相关文章

caffe训练自己的图片进行分类预测--windows平台
caffe训练自己的图片进行分类预测标签: caffe预测 2017-03-08 21:17 273人阅读评论(0) 收藏举报分类: caffe之旅(4) 版权声明:本文为博主原创文章,未 ...
Caffe初试（三）使用caffe的cifar10网络模型训练自己的图片数据
由于我涉及一个车牌识别系统的项目,计划使用深度学习库caffe对车牌字符进行识别.刚开始接触caffe,打算先将示例中的每个网络模型都拿出来用用,当然这样暴力的使用是不会有好结果的- -||| ,所以 ...
实践详细篇-Windows下使用Caffe训练自己的Caffemodel数据集并进行图像分类
三:使用Caffe训练Caffemodel并进行图像分类上一篇记录的是如何使用别人训练好的MNIST数据做训练测试.上手操作一边后大致了解了配置文件属性.这一篇记录如何使用自己准备的图片素材做图像分 ...
使用caffe训练自己的图像数据（未完）
参考博客:blog.csdn.net/drrlalala/article/details/47274549 1,首先在网上下载图片,猫和狗.直接保存下载该网页,会生成一个有图片的文件夹.caffe-m ...
使用LeNet训练自己的手写图片数据
一.前言本文主要尝试将自己的数据集制作成lmdb格式,送进lenet作训练和测试,参考了http://blog.csdn.net/liuweizj12/article/details/5214974 ...
Python库 - Albumentations 图片数据增强库
Python图像处理库 - Albumentations,可用于深度学习中网络训练时的图片数据增强. Albumentations 图像数据增强库特点: 基于高度优化的 OpenCV 库实现图像快速数 ...
使用caffe训练mnist数据集 - caffe教程实战（一）
个人认为学习一个陌生的框架,最好从例子开始,所以我们也从一个例子开始. 学习本教程之前,你需要首先对卷积神经网络算法原理有些了解,而且安装好了caffe 卷积神经网络原理参考:http://cs231 ...
caffe训练数据流程
cifar10训练实例 1. 下载数据 # sudo sh data/cifar10/get_cifar10.sh 2. 转换数据格式为lmdb # sudo sh examples/cifar10/ ...
caffe简易上手指南（二）—— 训练我们自己的数据
训练我们自己的数据本篇继续之前的教程,下面我们尝试使用别人定义好的网络,来训练我们自己的网络. 1.准备数据首先很重要的一点,我们需要准备若干种不同类型的图片进行分类.这里我选择从ImageNet ...

随机推荐

Directx Matrix.PerspectiveFovLH Matrix.PerspectiveFovRH的理解
该函数一个四个参数public static Matrix PerspectiveFovLH ( float fieldOfViewY, float aspectRatio, float znearP ...
0x25 广度优先搜索
今天莫名不想说话. 结果发现效率挺高? poj3322 本来可以1a的..发现我宽搜写的是head<=tail而且初始是head=1,tail=2如果是多组数据简直就gg了.基础不牢固这题虽然 ...
Qt-窗口部件概念介绍
前言:包括基础窗口部件QWidget.对话框QDialog.QFrame类族 .按钮部件.行编辑器.数值设定框以及滑块部件. 一.基础窗口部件QWidget 窗口部件(Widget)是Qt中建立用户界 ...
struts2学习之基础笔记8
文件的上传和下载上传步骤1:在文件上传表单中设置method和enctype属性值格式:<s:form method=”post” enctype =”multipart/ form.da ...
Python 之入门须知
1.Python2.0不支持中文,3.0支持 2.版本问题
day09-3 数据类型总结，深浅拷贝
目录数据类型总结,深浅拷贝存一个值还是多个值有序 or 无序可变 or 不可变浅拷贝和深拷贝的区别(只针对可变类型) 1.拷贝: 3.深拷贝总结: 数据类型总结,深浅拷贝存一个值还是多个 ...
Java模拟数据量过大时批量处理数据的两种实现方法
方法一: 代码如下: import java.util.ArrayList; import java.util.List; /** * 模拟批量处理数据(一) * 当数据量过大过多导致超时等问题可以将 ...
Day 02 - 02 编程语言的分类
编程语言的分类机器语言分为: 1.机器语言优点:执行代码效率非常快缺点:开发效率低 2.汇编语言优点(相对于机器语言):开发效率高缺点(相对于机器语言):执行效率低 3.高级语言解释型(同 ...
Django配置MariaDB数据库
Django中配置MariaDB数据库.配置文件如下: DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': ...
JS深拷贝拷贝的区别？
拷贝拷贝引用,共享内存深拷贝拷贝实例,不共享内存 1. 浅拷贝:当一个对象拷贝另一个对象的数据时,只要一个对象的数据发生改变时,另一个对象的数据也会发生改变,因为浅拷贝拷贝的是引用的地址实现方 ...

python+caffe训练自己的图片数据流程