caffe使用自己的数据做分类

这里只举一个例子: Alexnet网络训练自己数据的过程

用AlexNet跑自己的数据

参考1：http://blog.csdn.net/gybheroin/article/details/54095399

参考2：http://www.cnblogs.com/alexcai/p/5469436.html

,准备数据；

在caffe根目录下data文件夹新建一个文件夹，名字自己起一个就行了，我起的名字是food，在food文件夹下新建两个文件夹，分别存放train和val数据，

在train文件夹下存放要分类的数据toast, pizza等，要分几类就建立几个文件夹，分别把对应的图像放进去。（当然，也可以把所有的图像都放在一个文件夹下，只是在标签文件中标明就行）。

./data (food) -> ./data/food (train val) -> ./data/food/train (pizza sandwich 等等) ./data/food/val (pizza sandwich 等等)

然后在food目录下生成建立train.txt和val.txt category.txt

--- train.txt 和val.txt 内容类似为:

toast/.jpg

toast/.jpg

toast/.jpg

pizza/.jpg

pizza/.jpg

pizza/.jpg

--- category.txt内容类似为：

 toast

 pizza

注：图片需要分两批：训练集（train）、测试集（test），一般训练集与测试集的比例大概是5:1以上，此外每个分类的图片也不能太少，我这里每个分类大概选了5000张训练图+1000张测试图。

,lmdb制作（也可以不制作lmdb数据类型，需要在train的配置文件中data layer 的type改为：type: "ImageData" ###可以直接使用图像训练）

编译成功的caffe根目录下bin文件夹下有一个convert_imageset.exe文件，用来转换数据，在food文件夹下新建一个脚本文件create_foodnet.sh，内容参考example/imagenet/create_imagenet.sh

#!/usr/bin/env sh

# Create the imagenet lmdb inputs

# N.B. set the path to the imagenet train + val data dirs

set -e

EXAMPLE=data/food  # the path of generated lmdb data

DATA=data/food  # the txt path of train and test data

TOOLS=build/tools

TRAIN_DATA_ROOT=/path/to/imagenet/train/    # /path/to/imagenet/train/

VAL_DATA_ROOT=/path/to/imagenet/val/

# Set RESIZE=true to resize the images to 256x256. Leave as false if images have

# already been resized using another tool.

RESIZE=false

if $RESIZE; then

  RESIZE_HEIGHT=

  RESIZE_WIDTH=

else

  RESIZE_HEIGHT=

  RESIZE_WIDTH=

fi

if [ ! -d "$TRAIN_DATA_ROOT" ]; then

  echo "Error: TRAIN_DATA_ROOT is not a path to a directory: $TRAIN_DATA_ROOT"

  echo "Set the TRAIN_DATA_ROOT variable in create_imagenet.sh to the path" \

       "where the ImageNet training data is stored."

  exit

fi

if [ ! -d "$VAL_DATA_ROOT" ]; then

  echo "Error: VAL_DATA_ROOT is not a path to a directory: $VAL_DATA_ROOT"

  echo "Set the VAL_DATA_ROOT variable in create_imagenet.sh to the path" \

       "where the ImageNet validation data is stored."

  exit

fi

echo "Creating train lmdb..."

GLOG_logtostderr= $TOOLS/convert_imageset \

    --resize_height=$RESIZE_HEIGHT \

    --resize_width=$RESIZE_WIDTH \

    --shuffle \

    $TRAIN_DATA_ROOT \

    $DATA/train.txt \

    $EXAMPLE/food_train_lmdb   #生成的lmdb路径

echo "Creating val lmdb..."

GLOG_logtostderr= $TOOLS/convert_imageset \

    --resize_height=$RESIZE_HEIGHT \

    --resize_width=$RESIZE_WIDTH \

    --shuffle \

    $VAL_DATA_ROOT \

    $DATA/val.txt \

    $EXAMPLE/food_val_lmdb     #生成的lmdb路径

echo "Done."

，mean_binary生成

下面我们用lmdb生成mean_file，用于训练

EXAMPLE=data/food

DATA=data/food

TOOLS=build/tools

$TOOLS/compute_image_mean $EXAMPLE/food_train_lmdb $DATA/foodnet_mean.binaryproto

，solver 和train网络修改

------ Solver.prototxt详解：

# 表示网络的测试迭代次数。网络一次迭代将一个batchSize的图片进行测试，

# 所以为了能将validation集中所有图片都测试一次，这个参数乘以TEST的batchSize

# 应该等于validation集中图片总数量。即test_iter*batchSize=val_num。

test_iter:   

# 表示网络迭代多少次进行一次测试。一次迭代即一个batchSize的图片通过网络

# 正向传播和反向传播的整个过程。比如这里设置的是224，即网络每迭代224次即

# 对网络的准确率进行一次验证。一般来说，我们需要将训练集中所有图片都跑一

# 编，再对网络的准确率进行测试，整个参数乘以网络data层（TRAIN）中batchSize

# 参数应该等于训练集中图片总数量。即test_interval*batchSize=train_num

test_interval: 

# 表示网络的基础学习率。学习率过高可能导致loss持续86.，也可能导致

# loss无法收敛等等问题。过低的学习率会使网络收敛慢，也有可能导致梯度损失。

# 一般我们设置为0.

base_lr: 0.01

display:

max_iter:

lr_policy: "step"

gamma: 0.1

momentum: 0.9   #动量，上次参数更新的权重

weight_decay: 0.0001

stepsize:   #每stpesize之后降低学习率

snapshot:    # 每多少次保存一次学习的结果。即caffemodel

snapshot_prefix: "food/food_net/food_alex_snapshot"     #快照路径和前缀

solver_mode: GPU

net: "train_val.prototxt"  # 网络结构的文件路径。

solver_type: SGD  

----- train_val.prototxt 修改

###### Data层为原图像格式。设置主要是data层不同（原图像作为输入）

layer {

  name: "data"

  type: "ImageData" ###注意是ImageData，可以直接使用图像训练

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

image_data_param { ###

    source: "examples/finetune_myself/train.txt"  ###

    batch_size:

    new_height:  ###

    new_width:  ###

  }

##### data层为lmdb格式.（制作的lmdb格式作为输入）

layer {

  name: "data"

  type: "Data" ###这里是data，使用转换为lmdb的图像之后训练

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

  data_param {  ###

    source: "examples/imagenet/car_train_lmdb"###

    batch_size:

    backend: LMDB ###

  }

整个网络结构为：

name: "AlexNet"

layer {

  name: "data"

  type: "Data"

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

  transform_param {

    mirror: true

    crop_size:

    mean_file: "mimg_mean.binaryproto" #均值文件

  }

  data_param {

    source: "mtrainldb"  #训练数据

    batch_size:

    backend: LMDB

  }

}

layer {

  name: "data"

  type: "Data"

  top: "data"

  top: "label"

  include {

    phase: TEST

  }

  transform_param {

    mirror: false

    crop_size:

    mean_file: "mimg_mean.binaryproto"  #均值文件

  }

  data_param {

    source: "mvaldb"   #验证数据

    batch_size:

    backend: LMDB

  }

}

layer {

  name: "conv1"

  type: "Convolution"

  bottom: "data"

  top: "conv1"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  convolution_param {

    num_output:

    kernel_size:

    stride:

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value:

    }

  }

}

layer {

  name: "relu1"

  type: "ReLU"

  bottom: "conv1"

  top: "conv1"

}

layer {

  name: "norm1"

  type: "LRN"

  bottom: "conv1"

  top: "norm1"

  lrn_param {

    local_size:

    alpha: 0.0001

    beta: 0.75

  }

}

layer {

  name: "pool1"

  type: "Pooling"

  bottom: "norm1"

  top: "pool1"

  pooling_param {

    pool: MAX

    kernel_size:

    stride:

  }

}

layer {

  name: "conv2"

  type: "Convolution"

  bottom: "pool1"

  top: "conv2"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  convolution_param {

    num_output:

    pad:

    kernel_size:

    group:

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value: 0.1

    }

  }

}

layer {

  name: "relu2"

  type: "ReLU"

  bottom: "conv2"

  top: "conv2"

}

layer {

  name: "norm2"

  type: "LRN"

  bottom: "conv2"

  top: "norm2"

  lrn_param {

    local_size:

    alpha: 0.0001

    beta: 0.75

  }

}

layer {

  name: "pool2"

  type: "Pooling"

  bottom: "norm2"

  top: "pool2"

  pooling_param {

    pool: MAX

    kernel_size:

    stride:

  }

}

layer {

  name: "conv3"

  type: "Convolution"

  bottom: "pool2"

  top: "conv3"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  convolution_param {

    num_output:

    pad:

    kernel_size:

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value:

    }

  }

}

layer {

  name: "relu3"

  type: "ReLU"

  bottom: "conv3"

  top: "conv3"

}

layer {

  name: "conv4"

  type: "Convolution"

  bottom: "conv3"

  top: "conv4"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  convolution_param {

    num_output:

    pad:

    kernel_size:

    group:

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value: 0.1

    }

  }

}

layer {

  name: "relu4"

  type: "ReLU"

  bottom: "conv4"

  top: "conv4"

}

layer {

  name: "conv5"

  type: "Convolution"

  bottom: "conv4"

  top: "conv5"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  convolution_param {

    num_output:

    pad:

    kernel_size:

    group:

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value: 0.1

    }

  }

}

layer {

  name: "relu5"

  type: "ReLU"

  bottom: "conv5"

  top: "conv5"

}

layer {

  name: "pool5"

  type: "Pooling"

  bottom: "conv5"

  top: "pool5"

  pooling_param {

    pool: MAX

    kernel_size:

    stride:

  }

}

layer {

  name: "fc6"

  type: "InnerProduct"

  bottom: "pool5"

  top: "fc6"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  inner_product_param {

    num_output:

    weight_filler {

      type: "gaussian"

      std: 0.005

    }

    bias_filler {

      type: "constant"

      value: 0.1

    }

  }

}

layer {

  name: "relu6"

  type: "ReLU"

  bottom: "fc6"

  top: "fc6"

}

layer {

  name: "drop6"

  type: "Dropout"

  bottom: "fc6"

  top: "fc6"

  dropout_param {

    dropout_ratio: 0.5

  }

}

layer {

  name: "fc7"

  type: "InnerProduct"

  bottom: "fc6"

  top: "fc7"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  inner_product_param {

    num_output:

    weight_filler {

      type: "gaussian"

      std: 0.005

    }

    bias_filler {

      type: "constant"

      value: 0.1

    }

  }

}

layer {

  name: "relu7"

  type: "ReLU"

  bottom: "fc7"

  top: "fc7"

}

layer {

  name: "drop7"

  type: "Dropout"

  bottom: "fc7"

  top: "fc7"

  dropout_param {

    dropout_ratio: 0.5

  }

}

layer {

  name: "fc8"

  type: "InnerProduct"

  bottom: "fc7"

  top: "fc8"

  param {

    lr_mult:

    decay_mult:

  }

  param {

    lr_mult:

    decay_mult:

  }

  inner_product_param {

    num_output:        #注意：这里需要改成你要分成的类的个数

    weight_filler {

      type: "gaussian"

      std: 0.01

    }

    bias_filler {

      type: "constant"

      value:

    }

  }

}

layer {

  name: "accuracy"

  type: "Accuracy"

  bottom: "fc8"

  bottom: "label"

  top: "accuracy"

  include {

    phase: TEST

  }

}

layer {

  name: "loss"

  type: "SoftmaxWithLoss"

  bottom: "fc8"

  bottom: "label"

  top: "loss"

}

运行以下脚本进行train

#!/usr/bin/env sh

set -e

./build/tools/caffe train \

    --solver=food/food_alexnet/solver.prototxt

、测试

同样，测试需要一个类别标签文件，category.txt，文件内容同上，修改deploy.prototxt 开始测试：

./bin/classification "food/foodnet/deploy.prototxt" "food/foodnet/food_iter_100000.caffemodel" "ming_mean.binaryproto" "test001.jpg"

------------------------------------

---------------- FineTune：

http://www.cnblogs.com/denny402/p/5074212.html

http://www.cnblogs.com/alexcai/p/5469478.html

，注意finetune的时候，最后一层的连接层的名字需要做修改，类别数需要修改，并且学习率应该比较大，因为只有这层的权值是重新训练的，而其他的都是已经训练好了的

、开始训练的时候，最后制定的模型为将要finetune的模型

./build/tools/caffe train -solver examples/money_test/fine_tune/solver.prototxt -weights models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel

其中model指定的是caffenet训练好的model。

caffe使用自己的数据做分类的更多相关文章

Windows下用Caffe跑自己的数据（遥感影像）
1 前言 Caffe对于像我这样的初学者来说是一款非常容易上手的深度学习框架.关于用Caffe跑自己的数据这样的博客已经非常多,感谢前辈们为我们提供的这么好的学习资源.这里我主要结合我所在的行业,说下 ...
用caffe跑自己的数据，基于WINDOWS的caffe
本文详细介绍,如何用caffe跑自己的图像数据用于分类. 1 首先需要安装过程见 http://www.cnblogs.com/love6tao/p/5706830.html 同时依据上面教程,生成了 ...
Python图表数据可视化Seaborn：2. 分类数据可视化-分类散点图|分布图（箱型图|小提琴图|LV图表）|统计图（柱状图|折线图）
1. 分类数据可视化 - 分类散点图 stripplot( ) / swarmplot( ) sns.stripplot(x="day",y="total_bill&qu ...
以P2P网贷为例互联网金融产品如何利用大数据做风控？
以P2P网贷为例互联网金融产品如何利用大数据做风控? 销售环节了解客户申请意愿和申请信息的真实性:适用于信贷员模式. 风控关键点亲见申请人,亲见申请人证件,亲见申请人签字,亲见申请人单位. 审 ...
背水一战 Windows 10 (20) - 绑定: DataContextChanged, UpdateSourceTrigger, 对绑定的数据做自定义转换
[源码下载] 背水一战 Windows 10 (20) - 绑定: DataContextChanged, UpdateSourceTrigger, 对绑定的数据做自定义转换作者:webabcd 介 ...
绑定: DataContextChanged, UpdateSourceTrigger, 对绑定的数据做自定义转换
介绍背水一战 Windows 10 之绑定 DataContextChanged - FrameworkElement 的 DataContext 发生变化时触发的事件 UpdateSourceTr ...
如果把表单数据的校验交给了javascript那么后台还有没有必要对数据做校验呢
现在很多同事,包括我,我表单的数据验证交给了javascript来做,那么新的问题来了,如果交给了javascript那么后台还有没有必要对数据做校验呢
【python cookbook】【数据结构与算法】19.同时对数据做转换和换算
问题:我们需要调用一个换算函数(例如sum().min().max()),但是首先需对数据做转换或者筛选处理解决方案:非常优雅的方法---在函数参数中使用生成器表达式例如: # 计算平方和 num ...
通过读取excel数据和mysql数据库数据做对比（二）-代码编写测试
通过上一步,环境已搭建好了. 下面开始实战, 首先,编写链接mysql的函数conn_sql.py import pymysql def sql_conn(u,pwd,h,db): conn=pymy ...

随机推荐

iOS:CocosPods的装配和配置ReactiveCocoa
关于CocosPods的安装和配置ReactiveCocoa 1. CocoaPods和ReactiveCocoa的安装 CocoaPods是iOS最常用最有名的类库管理工具使用ReactiveCo ...
PHP文件包含漏洞总结
0x00 前言 PHP文件包含漏洞的产生原因是在通过PHP的函数引入文件时,由于传入的文件名没有经过合理的校验,从而操作了预想之外的文件,就可能导致意外的文件泄露甚至恶意的代码注入. 最常见的就属于本 ...
C#之Raw Socket实现网络封包监视
同Winsock1相比,Winsock2最明显的就是支持了Raw Socket套接字类型,使用Raw Socket,可把网卡设置成混杂模式,在这种模式下,我们可以收到网络上的IP包,当然包括目的不是本 ...
【Cocos2d-x 3.0 基础系列一】各类回调函数写法汇总
一.button回调 1. Lambda 表达式,C++11 Lambda 赋予了Cocos2d-x 3.0创建回调函数的灵活性. auto itemNor = Sprite::create(&quo ...
C# 解决窗体假死的状态
异步调用是CLR为开发者提供的一种重要的编程手段,它也是构建高性能.可伸缩应用程序的关键.在多核CPU越来越普及的今天,异步编程允许使用非常少的线程执行很多操作.我们通常使用异步完成许多计算型.IO型 ...
模板：什么是Traits
Traits不是一种语法特性,而是一种模板编程技巧.Traits在C++标准库,尤其是STL中,有着不可替代的作用. 如何在编译期间区分类型下面我们看一个实例,有四个类,Farm.Worke ...
Spine U3D整合流程问题
Spine U3D整合流程问题 What: 公司2d项目开发,动画外包的spine.本来在spine里面一切正常,但是导入u3d运行库的时候动画切换的时候原来的动画是好的,一旦切换了就乱帧了. 如下结 ...
php中的 file_get_contents（‘php://input’）用法
php中的 file_get_contents('php://input')用法: file_get_contents 获取php页面中input内容的值: eg: php: 页面提交了usernam ...
Oracle 存储过程调用返回游标的另一个存储过程。
一个扩展存储过程调用另一个存储过程,示例: 被调用存储过程:最后会返回一个游标,游标返回一个值.调用这个存储过程的存储过程同样需要获取它. procedure SearchBill --根据到货单号查 ...
ASP.NET_SessionId 不相同导致验证码出错
问题: 今天碰到一个比较奇怪的问题,每个页面请求的cookie的ASP.NET_SessionId 不相同,导致验证码检验出错.也就是说每个请求都是一个新的会话,我们把验证码保证在Session[ra ...

caffe使用自己的数据做分类

caffe使用自己的数据做分类的更多相关文章

随机推荐

热门专题