Windows caffe VGG人脸识别

　　caffe自带的例子有mnist和cifar10，cifar10和mnist的运行方式类型，下好图片数据文件后，训练例子中的模型，然后测试模型，也可以自己用图片进行预测分类（自己图片最好是cifar10训练的10种类型）。10种类型如下：

airplane

automobile

bird

cat

deer

dog

frog

horse

ship

truck

其他类型的图片也只能是错误识别，没有意义。

　　进入正题，跑完例子，笔者饥渴的想来点别的分类和识别模型。结合时下热门的人脸识别技术，就决定用知名的VGG人脸模型了。

　　一、VGG介绍

　　http://www.robots.ox.ac.uk/~vgg/software/vgg_face/

　　网站提供了VGGFACE的论文出处，使用的是VGG-VERY-DEEP-16 CNN，它在YouTube网站的人脸识别结果可达到92.8%还是不错的成绩！

　　网站提供了Torch和caffe两种框架的模型，以及MatConvNet文件。

　　二、生成数据

　　使用现有的模型来测试，属于caffe的finetuing(微调模型)。

　　Windows下要将待测图片生成LEVELDB文件，我使用的是 IMM Face Database (240 images) http://www.imm.dtu.dk/~aam/

可自行下载，数据集包含JPG格式的彩图，每人6张图片，共40人，240图片。

　　笔者在caffe/examples/目录下新建vggface目录，只要在caffe/目录下都行，在vggface下再分别创建train和val文件夹，存储训练和测试图片：如 D:\caffe\caffe-master\examples\vggface\train D:\caffe\caffe-master\examples\vggface\val
　　从数据集选择测试图片放入train文件夹，再新建标签文本 train.txt

train.txt存放图片的名称和标签类别，注意类别是从0开始，比如10类就是0-9（有点C数组下标的感觉）

　　train.txt内容可通过.bat命令生成，笔者部分内容：

-1m.jpg

-2m.jpg

-3m.jpg

-4m.jpg

-5m.jpg

-1m.jpg

-2m.jpg

-3m.jpg

-4m.jpg

-5m.jpg

-1m.jpg

-2m.jpg

-3m.jpg

-4m.jpg

-5m.jpg

-1m.jpg

-2m.jpg

-3m.jpg

-4m.jpg

-5m.jpg

　　val文件内的图片和val.txt也是同样操作！

　　接下来是转换为LEVELDB的数据文件，笔者在网上搜索尝试了很多写法，很多都会报错，或者在Windows下使用shell脚本并不是很方便，最后综合了下，如下convertldb.bat可以成功转换。

D:\caffe\caffe-master\Build\x64\Debug\convert_imageset.exe --resize_width= --resize_height= D:\caffe\caffe-master\examples\vggface\train\   D:\caffe\caffe-master\examples\vggface\train\train.txt D:\caffe\caffe-master\examples\vggface\train_leveldb -backend=leveldb

Pause

　　为了还原真实环境我没有在每个目录参数前面换行以显得美观，有的博客将后面3个目录的参数都换行了，贴出来很好看，但是会出现不是内部程序的错误，去掉换行改为空格间隔即可解决！（代码有点长，请拉完观看）

　　convert_imageset.exe是自己在caffe工程里生成的，我没有Realease所以Debug也可以的。

　　--resize_height是为了调整图片的长宽，因为VGG模型要求是224*224大小，如果你自己用OPENCV或MATLAB调整了大小，可以不要这两个参数。

　　后面3个目录分别是训练图片的文件路径；训练图片的标签文件；生成的LEVELDB文件路径；

　　-backend=leveldb　　很重要，确保生成的是LEVELDB格式，默认是IMDB，Windows使用有问题！

成功执行convertldb.bat后，会生成对应文件夹，看.log文件大小不为0也没报错基本没问题。

　　val文件夹的图片也做和train文件夹类似的转换，只需要在convertldb.bat里修改为val文件夹路径即可！

　　有了LEVELDB文件后进入计算均值阶段：

　　也是脚本执行，如 compute_mean.bat

SET GLOG_logtostderr=

D:\caffe\caffe-master\Build\x64\Debug\compute_image_mean.exe -backend=leveldb  D:\caffe\caffe-master\examples\vggface\train_leveldb D:\caffe\caffe-master\examples\vggface\mean.binaryproto

pause

　　计算均值一般不会出错，compute_image_mean.exe也是在caffe工程里通过VS2013生成的。

　　后面两个目录参数依次是： LEVELEDB的文件路径；生成的均值文件路径；caffe的均值文件是xx.binaryproto

　　三、修改网络

　　VGG网络可以使用的网络架构模型和某些基本solver参数，但是数据路径，输入层，输出全连接层之类的还是要根据自己的图片类别进行修改。

　　新建vggface_train_test.protxt，将下载的模型内的VGG_FACE_deploy.prototxt内容复制到vggface_train_test.protxt。对前面的数据层和最后的输出层进行修改：　　

name: "vggface_train_test.prototxt"

layers {

  name: "data"

  type: DATA

  top: "data"

  top: "label"

  include {

    phase: TRAIN

  }

  transform_param {

  mirror: true

  crop_size:

  mean_value:

  mean_value:

  mean_value:

  }

  data_param{

  source: "D:/caffe/caffe-master/examples/vggface/train_leveldb"

  batch_size:

  backend: LEVELDB

  }

}

layers {

  name: "data"

  type: DATA

  top: "data"

  top: "label"

  include {

  phase: TEST

  }

  transform_param{

  mirror: false

  crop_size:

  mean_value:

  mean_value:

  mean_value:

  }

  data_param{

  source: "D:/caffe/caffe-master/examples/vggface/val_leveldb"

  batch_size:

  backend: LEVELDB

  }

}

layers {

  bottom: "data"

  top: "conv1_1"

  name: "conv1_1"

  type: CONVOLUTION

  convolution_param {

    num_output:

    pad:

    kernel_size:

  }

}

　　修改到第一个卷积层conv1_1之前，如上所示，中间的网络层不用修改。

　　最后两层改为如下形式：

layers {

  bottom: "fc7"

  top: "facefc8"

  name: "facefc8"

  type: INNER_PRODUCT

  inner_product_param {

    num_output:

  }

}

layers {

  bottom: "facefc8"

  top: "prob"

  name: "prob"

  type: SOFTMAX

}

　　主要是修改两处： 1.name修改，不能使用之前的fc8会报错，笔者改为facefc8； 2.修改num_output分类数我的类别是5个所以改为5！

　　接下来是建vggface_solver.prototxt，如下：

# The train/test net protocol buffer definition

net: "examples/vggface/vggface_train_test.prototxt"

# test_iter specifies how many forward passes the test should carry out.

test_iter:

test_interval:

test_initialization: false

# The base learning rate, momentum and the weight decay of the network.

base_lr: 0.00005

momentum: 0.9

weight_decay: 0.0002

lr_policy: "step"

stepsize:

gamma: 0.3

average_loss:

# Display every  iterations

display:

max_iter:

# snapshot intermediate results

snapshot:

snapshot_prefix: "examples/vggface/vggmodel"

solver_mode: CPU

　　其中迭代次数，学习率，权值衰减都可以自己修改，学习率一开始要小点，笔者电脑渣为了快速看到结果迭代次数都比较少，建议大家迭代次数都是上百上千比较好！

　　vggface_solver.prototxt写好后，写一个训练finetuing脚本就行，笔者为 vgg_train.bat

cd ../../

"Build/x64/Debug/caffe.exe" train --solver=examples/vggface/vggface_solver.prototxt --weights=examples/vggface/VGG_FACE.caffemodel

pause

　　几点说明：caffe.exe路径自己修改

　　训练网络所以使用 train 关键字，若是测试则为 test

　　要加上--weigths 后面为下载的VGGcaffe模型，表示只是对网络finetuing，如果不加就是训练新的网络了！

　　最后还可以带一个参数　　-gpu=0 表示使用GPU加速，笔者电脑仅CPU所以没写。

成功训练模型后会出现下图的optimization Done 表示结束！

　　同时也会生成对应的 .caffemodel和 .solverstate文件，按迭代次数出现多个如：

　　有了finetuing后的自己模型后就可以使用测试数据进行结果测试，也可以使用C++调用模型进行分类识别操作。

　　测试结果步骤与mnist例子类似，先写到这！

Windows caffe VGG人脸识别的更多相关文章

基于深度学习的人脸识别系统（Caffe+OpenCV+Dlib）【三】VGG网络进行特征提取
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
基于深度学习的人脸识别系统（Caffe+OpenCV+Dlib）【二】人脸预处理
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
人脸识别(基于Caffe)
人脸识别(基于Caffe, 来自tyd) 人脸识别(判断是否为人脸) LMDB(数据库, 为Caffe支持的分类数据源) mkdir face_detect cd face_detect mkdir ...
基于深度学习的人脸识别系统（Caffe+OpenCV+Dlib）【一】如何配置caffe属性表
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
基于深度学习的人脸识别系统系列（Caffe+OpenCV+Dlib）——【四】使用CUBLAS加速计算人脸向量的余弦距离
前言基于深度学习的人脸识别系统,一共用到了5个开源库:OpenCV(计算机视觉库).Caffe(深度学习库).Dlib(机器学习库).libfacedetection(人脸检测库).cudnn(gp ...
PyQt5+Caffe+Opencv搭建人脸识别登录界面
PyQt5+Caffe+Opencv搭建人脸识别登录界面(转载) 最近开始学习Qt,结合之前学习过的caffe一起搭建了一个人脸识别登录系统的程序,新手可能有理解不到位的情况,还请大家多多指教. 我的 ...
人脸识别ArcfaceDemo for Windows 分享
Demo_for_Windows https://github.com/ArcJonSnow/Demo_for_Windows Arcsoft ArcfaceDemo for Windows, VS2 ...
人脸识别 ArcFace Demo [Windows]
Arcsoft ArcfaceDemo for Windows, VS2013 C++ 使用虹软技术开发完成使用步骤: 1.下载SDK包,32位Windows平台将五个SDK包里lib中的文件到 ...
基于人脸识别+IMDB-WIFI+Caffe的性别识别
本文用记录基于Caffe的人脸性别识别过程.基于imdb-wiki模型做finetune,imdb-wiki数据集合模型可从这里下载:https://data.vision.ee.ethz.ch/cv ...

随机推荐

dotTrace 每行执行时间和执行次数
如果代码中出现效率问题,使用dotTrace来跟踪分析代码的效率问题还是很方便的.使用dotTrace不但可以看到每一个方法被调用的次数和总时间,而且可以引入源代码,查看源代码中每一行执行的次数和时间 ...
BZOJ2299 HAOI2011向量（数论）
设最后的组成为x=x0a+x1b,y=y0a+y1b.那么容易发现x0和y0奇偶性相同.x1和y1奇偶性相同.于是考虑奇偶两种情况,问题就变为是否存在x和y使ax+by=c,那么其充要条件是gcd(a ...
使用doxygen静态分析开源代码
doxygen是一款生成开源代码说明文件的工具,因为不需要编译源码,用作代码的分析也十分方便. 一.安装 sudo apt-get install graphviz sudo apt-get inst ...
windows10中远程登录ubuntu16.04的桌面
1. 安装xrdp sudo apt-get install xrdp 2. 安装vnc4server sudo apt-get install vnc4server tightvncserver ...
Spring Shell参考文档
Spring Shell的核心组件是它的插件模型(plugin model).内置命令(built-in commands)和转换器( converters). 1.1 Plugin Model(插件 ...
以太坊链私有链环境搭建（windows）
摸索以太坊区块链技术几个月了.最近打算逐步的把自己学到的东西和大家分享一下.在阅读本文之前,希望大家能对区块链的概念能有所了解.这样操作过程中的环节理解更深入.下面开始进入准备.因为本次是window ...
【BZOJ1296】[SCOI2009]粉刷匠（动态规划）
[BZOJ1296][SCOI2009]粉刷匠(动态规划) 题面 BZOJ 洛谷题解一眼题吧. 对于每个串做一次\(dp\),求出这个串刷若干次次能够达到的最大值,然后背包合并所有的结果即可. # ...
Java: ByteBuffer在多线程中使用需要注意
昨天我改写一个文件缓存方面程序时,用ByteBuffer替换以前用的byte[],在测试的时候抛出异常. 以前的相关代码: class A { byte[] data; ....... public ...
洛谷_Cx的故事_解题报告_第四题70
1.并查集求最小生成树 Code: #include <stdio.h> #include <stdlib.h> struct node { long x,y,c; ...
arcgis创建渔网
创建渔网 1. ArcToolbox > Data Management Tools > Feature Class > Create Finshnet.选择输出要素位置,模 ...

Windows caffe VGG人脸识别

Windows caffe VGG人脸识别的更多相关文章

随机推荐

热门专题