这两天在初学目标检测的算法及步骤,其中人脸检测作为最经典的算法,于是进行了重点研究。该算法最重要的是建立人脸检测分类器,因此我用了一天的时间来学习分类器的训练。这方面的资料很多,但是能按照一个资料运行出结果的确实没有找到,因此我总结了自己的训练经验。

目标检测分为三个步骤:

1、样本的创建

2、训练分类器

3、利用训练的分类器进行目标检测

第一步:样本的创建

◆     样本分两种: 正样本与负样本(也有人翻译成:正例样本和反例样本),其中正样本是指待检目标样本(例如人脸,汽车,鼻子等),负样本指其它任意图片。

◆     所有样本图片都应该有同一尺寸,如32 * 32,并放在相应文件目录下,

◆     集合文件格式(collection file format)和描述文件格式(description file format)

集合文件格式(collection file format)就是如下形的描述文件:

[filename]

[filename]

[filename]

描述文件格式(description file format)就是如下形的描述文件:

[filename] [# of objects] [[x y width height] [... 2nd object] ...]

[filename] [# of objects] [[x y width height] [... 2nd object] ...]

[filename] [# of objects] [[x y width height] [... 2nd object] ...]

….

(x, y) 指左上角的坐标,width和 height 分别是样本的宽和高,这里我的图片是32*32的,所以两个值都是32

!!!!!!!负样本用集合文件格式描述,正样本用描述文件格式描述。

一、把所有正样本图片放在posdata的文件夹下,把所有负样本图片放在negdata文件夹下

(这里我以人脸图片样本为例)

(注:以上这些32*32 的图片均来自MIT人脸库,可以在csdn下载)

二. 分别为正样本和负样本创建描述文件

A.  为正样本创建描述文件格式文件info.txt,并且把这个文件放在与样本图片同一目录下,例如我的目录为C:/OpenCV2.1/bin/posdata

a)      在命令行下 输入以下命令: dir /b > info.txt

b)      打开info.txt, 选择编辑-》替换,把所有的bmp 换成 bmp 1 0 0 32 32

c)      删除info.txt最后一行的 “info.txt”

B.  为负样本创建集合文件格式文件bg.txt, 并且把这个文件放在与样本图片同一目录下,例如我的目录为I:/negdata

a)      在命令行下 输入以下命令: dir /b > bg.txt

b)      删除bg.txt最后一行的 “bg.txt”

三、创建样本

许多文章都说Opencv 自带有创建样本的exe 文件,但是我的目录下却没有,所以我只能自己生成createsamples.exe文件,首先在opencv解压文件夹里找到opencv->apps->haartraining中createsample.cpp文件,然后将该文件使用的所有.h和.cpp文件都加入到一个工程中,然后编译运行,在编译过程中会有各种错误,可根据错误提示进行相应的改正,其中最主要的是缺少"#include "stdafx.h“",其他的错误就是包含的文件添加不够导致的。 这里我创建10个sample:

将检测的正负样本文件和createsamples.exe文件放到同一根目录下,并在DOS命令下输入以下内容:

命令是: createsamples.exe -info info.txt -vec pos.vec -num 10 -w 20 -h 20

(关于 opencv_createsamples.exe 的参数用法,在参考英文资料网址http://note.sonots.com/SciSoftware/haartraining.html#e134e74e,里有详细介绍;

需要说明的是,我这里用的参数并没有 –bg, 因为根据那份文档,有了 –vec 和 –info 之后,就表示:Create training samples from some (从很多正样本中创建sample, 没有distortions)

四、训练分类器

如果在opencv的解压文件夹里没有找到haartraining.exe文件,则需要自己生成,其生成步骤与前一步createsamples.exe的生成步骤相同。

首先在根目录下建xml文件夹存放训练的分类器,并输入命令:

haartraining.exe -data xml-vec pos.vec -bg negdata0.txt -npos 10 -nneg 10  -mem 512 -model  all -w 20 -h 20

这时会在根目录下的xml文件夹里生成许多.txt文件。

五、将生成的.txt文件制作成.xml文件

首先在opencv解压文件夹里找到opencv->samples->c->convert_cascade.c,将其加入到工程中,编译运行生成convert_cascade.exe文件,并将其放到原来的根目录下,在DOS命令下输入:

convert_cascade --size = "32x32" xml haarcascade.xml

则在根目录下生成该.xml文件。

五、利用生成的.xml分类器进行人脸检测

该代码如下,将lena.jpg放到工程文件夹下,由于本.xml只训练了10张照片,样本数少,所以检测效果很差,但是检测过程是正确且完整的。

#include "stdafx.h"
#include "cv.h"
#include "highgui.h" #include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <assert.h>
#include <math.h>
#include <float.h>
#include <limits.h>
#include <time.h>
#include <ctype.h> #ifdef _EiC
#define WIN32
#endif
IplImage* image;
IplImage* copyimage;
static CvMemStorage* storage = 0;
static CvHaarClassifierCascade* cascade = 0; void detect_and_draw( IplImage* image ); const char* cascade_name = "xml.xml"; int main( int argc, char** argv )
{
cascade = (CvHaarClassifierCascade*)cvLoad( cascade_name, 0, 0, 0 ); if( !cascade )
{
fprintf( stderr, "ERROR: Could not load classifier cascade\n" );
fprintf( stderr,
"Usage: facedetect --cascade=\"<cascade_path>\" [filename|camera_index]\n" );
return -1;
}
storage = cvCreateMemStorage(0); image = cvLoadImage("lena.jpg");
if( !image )return -1; cvNamedWindow("Original Image",1);
cvShowImage("Original Image",image); detect_and_draw( image ); cvWaitKey(0);
cvDestroyWindow("Original Image");
cvDestroyWindow("result"); return 0;
} void detect_and_draw( IplImage* img )
{
static CvScalar colors[] =
{
{{0,0,255}},
{{0,128,255}},
{{0,255,255}},
{{0,255,0}},
{{255,128,0}},
{{255,255,0}},
{{255,0,0}},
{{255,0,255}}
}; double scale = 1.3;
IplImage* gray = cvCreateImage( cvSize(img->width,img->height), 8, 1 );
IplImage* small_img = cvCreateImage( cvSize( cvRound (img->width/scale),
cvRound (img->height/scale)),
8, 1 );
int i; cvCvtColor( img, gray, CV_BGR2GRAY );
cvResize( gray, small_img, CV_INTER_LINEAR );
cvEqualizeHist( small_img, small_img );
cvClearMemStorage( storage ); if( cascade )
{
double t = (double)cvGetTickCount();
CvSeq* faces = cvHaarDetectObjects( small_img, cascade, storage,
1.1, 2, 0/*CV_HAAR_DO_CANNY_PRUNING*/,
cvSize(30, 30) );
t = (double)cvGetTickCount() - t;
printf( "detection time = %gms\n", t/((double)cvGetTickFrequency()*1000.) );
for( i = 0; i < (faces ? faces->total : 0); i++ )
{
CvRect* r = (CvRect*)cvGetSeqElem( faces, i );
CvPoint center;
int radius;
center.x = cvRound((r->x + r->width*0.5)*scale);
center.y = cvRound((r->y + r->height*0.5)*scale);
radius = cvRound((r->width + r->height)*0.25*scale);
cvCircle( img, center, radius, colors[i%8], 3, 8, 0 );
}
} cvShowImage( "result", img );
cvReleaseImage( &gray );
cvReleaseImage( &small_img );
}

  

opencv人脸检测分类器训练小结的更多相关文章

  1. 【计算机视觉】如何使用opencv自带工具训练人脸检测分类器

    前言 使用opencv自带的分类器效果并不是很好,由此想要训练自己的分类器,正好opencv有自带的工具进行训练.本文就对此进行展开. 步骤 1.查找工具文件: 2.准备样本数据: 3.训练分类器: ...

  2. keras系列︱人脸表情分类与识别:opencv人脸检测+Keras情绪分类(四)

    引自:http://blog.csdn.net/sinat_26917383/article/details/72885715 人脸识别热门,表情识别更加.但是表情识别很难,因为人脸的微表情很多,本节 ...

  3. 基于Haar特征的Adaboost级联人脸检测分类器

    基于Haar特征的Adaboost级联人脸检测分类器基于Haar特征的Adaboost级联人脸检测分类器,简称haar分类器.通过这个算法的名字,我们可以看到这个算法其实包含了几个关键点:Haar特征 ...

  4. 照片美妆---基于Haar特征的Adaboost级联人脸检测分类器

    原文:照片美妆---基于Haar特征的Adaboost级联人脸检测分类器 本文转载自张雨石http://blog.csdn.net/stdcoutzyx/article/details/3484223 ...

  5. OpenCV——人脸检测

    OpenCV支持的目标检测的方法: 利用样本的Haar特征进行的分类器训练,得到的级联boosted分类器(Cascade Classification) 1.加载级联分类器 CascadeClass ...

  6. Android+openCV人脸检测2(静态图片)

    前几篇文章中有提到对openCV环境配置,这里再重新梳理导入和使用openCV进行简单的人脸检测(包括使用级联分类器) 一 首先导入openCVLibrary320 二 设置gradle的sdk版本号 ...

  7. opencv人脸检测,旋转处理

    年会签到,拍自己的大头照,有的人可能会拍成横向的,需要旋转,用人脸检测并修正它(图片). 1. 无脑检测步骤为: 1. opencv 读取图片,灰度转换 2. 使用CascadeClassifier( ...

  8. OpenCV人脸检测并把图片写成avi视频

    读出某一个文件夹下“jpg”后缀的全部图片后,用的OpenCV自带的人脸检测检测图片中的人脸,调整图片的大小写成一个avi视频. 主要是要记录一下CvVideoWriter的用法和如何从文件夹中读取某 ...

  9. 人脸检测学习笔记(数据集-DLIB人脸检测原理-DLIB&OpenCV人脸检测方法及对比)

    1.Easily Create High Quality Object Detectors with Deep Learning 2016/10/11 http://blog.dlib.net/201 ...

随机推荐

  1. PHP中的多态

    多态的概念一般是强类型语言来谈的,因为强类型语言它必须要声明参数类型,比如一个手电筒对象的打开方法其参数申明了只能是蓝光,就不能传其他光.但可以用父类渲染的方式使其多态,比如声明一个光的父类,让其它颜 ...

  2. hibernate 联合主键生成机制(组合主键XML配置方式)

    hibernate 联合主键生成机制(组合主键XML配置方式)   如果数据库中用多个字段而不仅仅是一个字段作为主键,也就是联合主键,这个时候就可以使用hibernate提供的联合主键生成策略. 具体 ...

  3. ssm框架整合小结

    1.整合思路 一.Dao层:整合mybatis和spring 需要的jar包: 1.mybatis的jar包 2.Mysql数据库驱动 3.数据库连接池 4.Mybatis和spring的整合包. 5 ...

  4. Servlet中Service方法

    doGet方法只能处理Get方式提交的请求,doPost则可以处理Post方式提交的请求, 一种既可以处理Get方式又可以处理Post方式的提交的请求,它就是Service方法. service方法用 ...

  5. java.util.regex.PatternSyntaxException: Unclosed character class near index解决办法

    使用str.split("[")时,出现java.util.regex.PatternSyntaxException: Unclosed character class near  ...

  6. 3、REST风格的URL

    1.概述 HTTP协议里面,四个表示操作方式的动词:GET.POST.PUT.DELETE,它们分别对应四种基本的操作,GET用来获取资源,POST用来新建资源,PUT用来更新资源,DELETE用来删 ...

  7. 经典K线组合图解 > 正文

    日K线波段中上下影线的箱体操作法(完整) http://video.sina.com.cn/v/b/130809461-2486130757.html!!经典K线组合图解 > 正文 http:/ ...

  8. mysql 插入汉字 异常 Incorrect string value: '\xE8\xA7\x84\xE5\x88\x99' for column 'name'

    今天使用mysql出现 Incorrect string value: '\xE8\xA7\x84\xE5\x88\x99' for column 'name' 异常 通过查找问题,发现是字段编码不支 ...

  9. Html,Css,Javascript及其他的注释方法详解

    一.HTML的注释方法<!-- html注释:START -->内容<!-- html注释:END --> 包含在“<!--”与“-->”之间的内容将会被浏览器忽略 ...

  10. POJ 2065 SETI(高斯消元)

    题目链接:http://poj.org/problem?id=2065 题意:给出一个字符串S[1,n],字母a-z代表1到26,*代表0.我们用数组C[i]表示S[i]经过该变换得到的数字.给出一个 ...