【计算机视觉】如何使用opencv自带工具训练人脸检测分类器

前言

使用opencv自带的分类器效果并不是很好，由此想要训练自己的分类器，正好opencv有自带的工具进行训练。本文就对此进行展开。

步骤

1.查找工具文件；

2.准备样本数据；

3.训练分类器；

具体操作

注意，本文是在windows系统实现的，当然也可以在linux系统进行。

1.查找工具文件；

opencv中的自带的分类器训练工具在开源库中以应用程序的类型呈现的，具体目录如下。

.\opencv2410\build\x64\vc12\bin

可以在该目录下查找到相关的工具文件，有opencv_createsamples、opencv_haartraining、opencv_performance、opencv_traincascade；

其中，opencv_haartraining和opencv_traincascade是opencv开源库用于训练级联分类器的两个程序。opencv_traincascade是一个较新的程序，使用OpenCV2.x API以c++编写，二者的主要区别是opencv_traincascade支持Haar和LBP两种特征，并易于增加其他特征。与Haar特征相比，LBP特征是整数特征，因此训练和检测过程都会比Haar特征快几倍。LBP和Haar特征用于检测的准确率是依赖训练过程中训练数据的质量和训练参数。训练一个与基于Haar特征同样准确度的LBP的分类器是可能的。

另外，opencv_traincascade和opencv_haartraining两个训练程序的输入参数有些微的差别，比如前者是numPos和numNeg，而后者是npos和nneg，同时二者所输出的分类器的文件格式也并不相同，注意区分。新的级联检测器接口(object模块中的CascadeClassifier类)支持这两种格式。opencv_traincascade可以旧格式导出训练好的级联分类器，但是在训练过程被中断后再重启训练过程时，二者不能装载和中断前不同的文件格式。另外，opencv_traincascade程序使用TBB(Threading Building Blocks)来处理多线程，如果希望使用多核并行运算加速，请使用TBB来编译opencv。

opencv_createsamples用来准备用于训练的正样本数据和测试数据，能够生成新旧两个训练程序支持的正样本数据。输出为以*.vec为扩展名的文件，该文件以二进制方式存储图像。

opencv_performance可以用来评估分类器的质量，但是只能评估opencv_haartraining输出的分类器。它读入一组标注好的图像，运行分类器并报告性能。

2.准备样本数据；

训练需要一些样本数据，分别是正样本和负样本。负样本是指不包括目标的图像，正样本是只包含待检测目标的图像。负样本必须手工准备，而原始正样本可以使用opencv_createsamples创建训练器需要的正样本图像。样本图像可以是不同尺寸的，但是不能小于训练窗口的大小。

2.1样本数据要求；

正样本原始图像应该包含要检测的目标对象，比如人脸或者其他，而负样本图像不能包含要检测的目标。正样本图像的背景需要多样化，可以尝试用随机噪点填充背景，避免固定的背景。目标的像素数量肯定要多于背景像素数量的，原始正样本图像尺寸可以不同，但是应该有相同的高宽比。正负样本的格式、尺寸、通道数目可以不同，但是要保证尺寸不能小于训练的参数(即生成vec文件时输入的-w-h参数)。负样本不能包含目标，且应该多样化。正负样本的数目和比例的选取依赖于检测任务，建议在1:2-1:3之间，但这不是硬性规定的。建议开始使用小数目的样例生成级联器然后进行测试，如果效果不佳就可以增加正负样本数量。

2.2生成负样本描述文件；

负样本here(xte1);

在工程目录下，创建一个文件夹用于存放负样本图像，可以不同尺寸、不同通道数、不同格式，但尺寸不能小于正样本训练参数。负样本要尽量多样化，且不能包含要检测的目标对象。

负样本目录结构

/negimg

  img1.jpg

  img2.bmp

negimg.txt

其中，negimg.txt是负样本的描述文件，

E:\work\facedet\facedet-train\negall\GULF_99.bmp

E:\work\facedet\facedet-train\negall\u=,&fm=&gp=.jpg

E:\work\facedet\facedet-train\negall\u=,&fm=&gp=.jpg

生成方式是在图像目录下新建批量生成文件negimg.bat，双击即可；

dir /b/s/p/w *.bmp > num.txt

注意，1)不同的图像格式; 2)避免空行，将最后一行的空行删除；

2.3生成正样本描述文件*.vec；

2.3.1 创建文件夹的过程和负样本基本一样，此处不再赘述。生成正样本描述文件之后，打开描述文件，将jpg全部替换成jpg 1 0 0 20 20，其中jpg是图像格式，1表示对应图像中检测目标数目，[0 0 20 20]表示对应图像中目标位置分别是[left top width height];注意可以有多个目标，不同图像对应的目标数目和位置可能不同，可能需要分别处理；可以使用相对路径，也可以是绝对路径。

正样本描述文件将每张图像上的目标数目，以及每个目标对象的位置信息进行描述，按照以下格式描述。本质上讲，正样本描述文件是用来加速机器学习的。

positive_image_name  num_of_objects x y width height x y width height …

如果一张图像有多个目标，则文件内容为

img/img_with_faces_1.jpg

img/img_with_faces_2.jpg

2.3.2 生成*.vec正样本描述文件；

这个时候就要使用opencv_createsample生成vec文件啦！训练图像正样本目标尺寸的高宽参数一般设置为20*20或者24*24，本文设置为20*20.

opencv_createsamples.exe -vec pos.vec -info posimg.txt -num  -w  -h

-vec是输出文件，内含用于训练的正样本；-info是描述目标所在图像及大小位置的描述文件；-num是生成正样本的数目(应该是所有图像中的目标数目吧？)；

-w和-h是输出样本的目标尺寸，以像素为单位；

3.训练分类器；

3.1 本文使用opencv_traincascade训练一个级联分类器。现在正负样本、正负样本描述文件都已准备好，开始进行训练，只需要设置想要的参数即可；

opencv_traincascade.exe -data xml -vec posall.vec -bg negall.txt -numPos  -numNeg  -mem  -mode ALL -w  -h

其中，xml是存放训练结果的目录；注意，参数-w和-h应该与在生成.vec文件时候设置的-w和-h保持一致，同时写在-numPos和-numNeg的正负样本图像应该都是真正可用的，可打开的。各个参数的意义可参考here，有通用参数、级联参数、Boosted分类器参数、类Haar特征参数、LBP参数；

通用参数：
- -data <cascade_dir_name>
  
  目录名，如不存在训练程序会创建它，用于存放训练好的分类器。
- -vec <vec_file_name>
  
  包含正样本的vec文件名（由 opencv_createsamples 程序生成）。
- -bg <background_file_name>
  
  背景描述文件，也就是包含负样本文件名的那个描述文件。
- -numPos <number_of_positive_samples>
  
  每级分类器训练时所用的正样本数目。要小于正样本总数。
- -numNeg <number_of_negative_samples>
  
  每级分类器训练时所用的负样本数目，可以大于 -bg 指定的图片数目。可以大于负样本总数。
- -numStages <number_of_stages>
  
  训练的分类器的级数。一般取值15-25。
- -precalcValBufSize <precalculated_vals_buffer_size_in_Mb>
  
  缓存大小，用于存储预先计算的特征值(feature values)，单位为MB。
- -precalcIdxBufSize <precalculated_idxs_buffer_size_in_Mb>
  
  缓存大小，用于存储预先计算的特征索引(feature indices)，单位为MB。内存越大，训练时间越短。
- -baseFormatSave
  
  这个参数仅在使用Haar特征时有效。如果指定这个参数，那么级联分类器将以老的格式存储。
级联参数：
- -stageType <BOOST(default)>
  
  级别（stage）参数。目前只支持将BOOST分类器作为级别的类型。
- -featureType<{HAAR(default), LBP}>
  
  特征的类型： HAAR - 类Haar特征； LBP - 局部纹理模式特征。
- -w <sampleWidth>
- -h <sampleHeight>
  
  训练样本的尺寸（单位为像素）。必须跟训练样本创建（使用 opencv_createsamples 程序创建）时的尺寸保持一致。
Boosted分类器参数：
- -bt <{DAB, RAB, LB, GAB(default)}>
  
  Boosted分类器的类型： DAB - Discrete AdaBoost, RAB - Real AdaBoost, LB - LogitBoost, GAB - Gentle AdaBoost。
- -minHitRate <min_hit_rate>
  
  分类器的每一级希望得到的最小检测率。总的检测率大约为 min_hit_rate^number_of_stages。一般取值0.95-0.995。
- -maxFalseAlarmRate <max_false_alarm_rate>
  
  分类器的每一级希望得到的最大误检率。总的误检率大约为 max_false_alarm_rate^number_of_stages.一般取值0.4-0.5。
- -weightTrimRate <weight_trim_rate>
  
  Specifies whether trimming should be used and its weight. 一个还不错的数值是0.95。
- -maxDepth <max_depth_of_weak_tree>
  
  弱分类器树最大的深度。一个还不错的数值是1，是二叉树（stumps）。
- -maxWeakCount <max_weak_tree_count>
  
  每一级中的弱分类器的最大数目。The boosted classifier (stage) will have so many weak trees (<=maxWeakCount), as needed to achieve the given -maxFalseAlarmRate.
类Haar特征参数：
- -mode <BASIC (default) | CORE | ALL>
  
  选择训练过程中使用的Haar特征的类型。 BASIC 只使用右上特征， ALL 使用所有右上特征和45度旋转特征。
LBP特征参数：

LBP特征无参数。

训练完成之后，打开保存-data对应目录，即可看到训练结果。cascade.xml文件即为最终的训练结果，可以用来进行目标检测。

3.2训练过程相关问题；

问题1：

Train dataset for temp stage can not be filled. Branch training terminated.

原因：训练数据在中间训练阶段没有filled，训练分支被终止。此时可以生成cascade.xml文件，终止的原因是训练数据不足，一般已经训练了多个stage。

还有一个原因可能是图像数据的路径有问题，这种情况一般stage0即出现错误。

问题2：

Required leaf false alarm rate achieved. Branch training terminated

原因：负样本数据中包含要检测的目标对象，导致错误预警率过高。此时可以检查正负训练样本数据，是否有误。

接下来就要测试训练的模型能否得到较好的检测效果，请参看here。

参考

1.opencv人脸检测训练分类器及其常见问题-译文-Good；

2.FAQ-opencv-haartraining-原文；

3.人脸检测训练心得；

4.opencv_traincascade支持Haar和LBP特征；

5.如何使用opencv自带工具训练分类器；

6.如何使用工具进行训练；

7.如何训练详解；

8.opencv中文论坛-级联分类器训练；

9.opencv官网-原文；

10.模型训练简介；

完

【计算机视觉】如何使用opencv自带工具训练人脸检测分类器的更多相关文章

opencv人脸检测分类器训练小结
这两天在初学目标检测的算法及步骤,其中人脸检测作为最经典的算法,于是进行了重点研究.该算法最重要的是建立人脸检测分类器,因此我用了一天的时间来学习分类器的训练.这方面的资料很多,但是能按照一个资料运行 ...
基于AdaBoost算法——世纪晟结合Haar-like特征训练人脸检测识别
AdaBoost 算法是一种快速人脸检测算法,它将根据弱学习的反馈,适应性地调整假设的错误率,使在效率不降低的情况下,检测正确率得到了很大的提高. 系统在技术上的三个贡献: 1.用简单的Haa ...
opencv利用Cascade Classifier训练人脸检测器
opencv默认提供了haar特征和lbp特征训练的人脸分类器,但是效果不太好,所以我们可以用opencv提供的跑opencv_traincascade函数来训练一个LBP特征的分类器.(由于open ...
opencv 比较直方图方式进行人脸检测对比
完整opencv(emgucv)人脸.检测.采集.识别.匹配.对比 //成对几何直方图匹配 public static string MatchHist() ...
OpenCV神技——人脸检测，猫脸检测
简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由一系列 C 函数和少量 ...
opencv 美白磨皮人脸检测<转>
1. 简介这学期的计算机视觉课,我们组的课程项目为“照片自动美化”,其中我负责的模块为人脸检测与自动磨皮.功能为:用户上传一张照片,自动检测并定位出照片中的人脸,将照片中所有的人脸进行“磨皮”处理, ...
基于OpenCV读取摄像头进行人脸检测和人脸识别
前段时间使用OpenCV的库函数实现了人脸检测和人脸识别,笔者的实验环境为VS2010+OpenCV2.4.4,opencv的环境配置网上有很多,不再赘述.检测的代码网上很多,记不清楚从哪儿copy的 ...
如何利用OpenCV自带的级联分类器训练程序训练分类器
介绍使用级联分类器工作包括两个阶段:训练和检测. 检测部分在OpenCVobjdetect 模块的文档中有介绍,在那个文档中给出了一些级联分类器的基本介绍.当前的指南描述了如何训练分类器:准备训练数 ...
如何用OpenCV自带的adaboost程序训练并检测目标
参考博文: 1.http://blog.csdn.net/wuxiaoyao12/article/details/39227189 2.http://www.cnblogs.com/easymind2 ...

随机推荐

Java 面向对象之继承和重写OverWrite,重写和重载的区别，抽象类
01继承的概述 A:继承的概念 a:继承描述的是事物之间的所属关系,通过继承可以使多种事物之间形成一种关系体系 b:在Java中,类的继承是指在一个现有类的基础上去构建一个新的类,构建出来的新类被称作 ...
小波变化库——Pywalvets学习笔记
笔记术语(中英对照): 尺度函数:scaling function(又称父函数 father wavelet) 小波函数:wavelet function(又称母函数 mother wavelet) ...
c++ primer plus 第七章课后题答案
#include <iostream> using namespace std; double HAR_AVG(double, double); void TEST(bool); int ...
Windows Update 自动更新设定被锁（变灰）
估计是McAfee自动更改掉的. 真TM烦人. 方法 1 不过找到了回复方法了: http://www.askvg.com/how-to-change-windows-update-settings- ...
CentOS Redhat Linux安装 Oracle Client 的注意点
1) 安装文件要拷贝到本地文件系统执行 2) 虽然不知道 libXmu是什么,但是安装之后,关联包安装了许多,感觉很省心 yum install libXmu.i686 3) 还有找不到的包的话,用 ...
3.4 复杂的x86指令举例
计算机组成 3 指令系统体系结构 3.4 复杂的x86指令举例 x86作为复杂指令系统的代表,自然会有不少相当复杂的指令.在这一节我们将会看到其中有代表性的一些例子. 关于复杂的x86指令,我们这里举 ...
JavaScript--Array; Array.prototype
Array: Javascritp中Array的方法: findIndex()方法返回数组中满足提供的测试函数的第一个元素的索引.否则返回-1. find() 方法返回数组中满足提供的测试函数的第一个 ...
django-celery定时任务以及异步任务and服务器部署并且运行全部过程
Celery 应用Celery之前,我想大家都已经了解了,什么是Celery,Celery可以做什么,等等一些关于Celery的问题,在这里我就不一一解释了. 应用之前,要确保环境中添加了Celery ...
Weird journey CodeForces - 788B (路径计数)
大意:$n$结点$m$条边无向图, 满足 $(1)$经过$m-2$条边$2$次 $(2)$经过其余$2$条边$1$次的路径为好路径, 求所有好路径数相当于边加倍后再删除两条边, 求欧拉路条数首先 ...
c#将Excel数据导入到数据库的实现代码
这篇文章主要介绍了c#将Excel数据导入到数据库的实现代码,有需要的朋友可以参考一下假如Excel中的数据如下: 数据库建表如下: 其中Id为自增字段: 代码: 代码如下: using Syste ...

【计算机视觉】如何使用opencv自带工具训练人脸检测分类器

【计算机视觉】如何使用opencv自带工具训练人脸检测分类器的更多相关文章

随机推荐

热门专题