【从零学习openCV】IOS7根据人脸检测
前言:
人脸检測与识别一直是计算机视觉领域一大热门研究方向,并且也从安全监控等工业级的应用扩展到了手机移动端的app。总之随着人脸识别技术获得突破,其应用前景和市场价值都是不可估量的,眼下在学习openCV,自然不能放过这个领域。于是略微了解了下openCV下人脸检測的一些原理。为之后的人脸识别等研究做个小小的铺垫。
原理:
人脸检測属于目标检測(object detection) 的一部分,主要涉及两个方面
- 先对要检測的目标对象进行概率统计,从而知道待检測对象的一些特征,建立起目标检測模型。
- 用得到的模型来匹配输入的图像,假设有匹配则输出匹配的区域
好吧,这样说有点抽象,接下来我们来看看openCV经常使用的haar人脸检測是怎么回事吧
Haar特征
首先,什么是Haar呢?说白了,haar就是一种基于“块”的特征,它最早是由Papageorigiou等人用于人脸描写叙述。眼下经常使用的Haar-like特征能够分为三类:线性特征、边缘特征、点特征(中心特征)、对角线特征。例如以下图所看到的:
显然。边缘特征有4种:x方向。y方向,x倾斜方向,y倾斜方向;线特征有8种,点特征有2种,对角线特征有1种。
每一种特征的计算都是由黑色填充区域的像素值之和与白色填充区域的像素值之和的差值。而计算出来的这个差值就是所谓的Haar-like特征的特征值。
Haar特征是基于"块"的特征,可以减少计算成本。
可是对于一张24*24的图片可以提取的haar特征量很巨大,大概有16万之多。怎样从这么多的特征中提取出对人脸识别真正实用的特征是一个很重要的问题,于是就要使用到Adaboosting算法。
Adaboosting算法
AdaBoost算法是一种迭代的算法。对于一组训练集,通过改变当中每个样本的分布概率,而得到不同的训练集Si,对于每个Si进行训练从而得到一个弱分类器Hi,再将这些若分类器依据不同的权值组合起来,就得到了强分类器。
第一次的时候。每一个样本都是均匀分布,通过训练得到分类器H0,在该训练集中。分类正确的。就减少其分布概率。分类错误的,就提高其分布概率,这样得到的新的训练集S1就主要是针对不太好分类的样本了。再使用S1进行训练,得到分类器H1,依次迭代下去……。设迭代此外为T,则得到T个分类器。
对于每一个分类器的权值,其分类准确性越高,权值越高。
前面说到,一张24*24的图片,能提取到16W多的haar特征。一个弱分类器,实际上就是在这16W多的特征中选取一个特征。用这个特征可以区分出人脸or非人脸,且错误率最低。
比方如今有人脸样本2000张,非人脸样本4000张,这些样本都经过了归一化,大小都是24X24的图像。那么,对于16W中的任一特征fi。我们计算该特征在这2000人脸样本、4000非人脸样本上的值,这样就得到6000个特征值。
将这些特征值排序,然后选取一个最佳的特征值,在该特征值下,对于特征fi来说。样本的加权错误率最低。选择全部特征中,错误率最低的特征,用来推断人脸,这就是一个弱分类器,同一时候用此分类器对样本进行分类。并更新样本的权重。
详细实施步骤例如以下。内容均摘自DylanTsou的博客
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2hhd25faHQ=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" width="514" height="462" alt="">
窗体扫描检測
得到了分类器后就行对图像进行人脸检測了。因为输入的图像往往与分类器训练的图像大小不一致(一般更大)。于是我们须要一个可以滑动的窗体在输入图像上不断移动进行扫描。假设我们训练的图像就是24*24的,滑动窗体就是一个24*24
window,使用这个window扫描一张大图上全部位置。在每一个位置上都使用训练好的分类器回答是不是人脸的问题。
扫描结束之后须要一些重叠的窗体合并(在同一张人脸附近可能有非常多个临近窗体都被推断为包括人脸)。
为了可以提高扫描速度可以使用了逐级删选的方案,就是先開始使用计算成本低的分类器海选(这种分类器包括较少的特征),海选过程中标准较低,尽可能将全部的人脸都删选进来,低标准导致非常多非人脸也被选进来。然后逐渐提高分类器的标准(也就是说使用包括很多其它特征的分类器,同一时候添加了计算成本)这种逐级删选可以减少计算成本。
最后另一个问题: 在一张照片中人脸的大小各有区别不一定就和训练图片大小同样。解决问题的方法是使用不同大小的窗体来检測人脸。 这时候若分类器中的阈值须要随着窗体面积做等比例的变化。
使用openCV进行人脸检測
好了。经过前面的介绍。对人脸检測的原理应该有了大体的了解。其有用openCV实现人脸检測十分简单。
首先OpenCV自带了人脸的Haar特征分类器。
OpenCV安装文件夹中的\data\
haarcascades文件夹下的haarcascade_frontalface_alt.xml与haarcascade_frontalface_alt2.xml都是用来检測人脸的Haar分类器。这个haarcascades文件夹下还有人的全身,眼睛。嘴唇的Haar分类器。
使用人脸的Haar特征分类器很之简单,直接使用cvHaarDetectObjects。以下来看看这个函数的介绍:
函数功能:检測图像中的文件夹
函数原型:
CVAPI(CvSeq*) cvHaarDetectObjects(
const CvArr* image,
CvHaarClassifierCascade* cascade,
CvMemStorage* storage,
double scale_factor CV_DEFAULT(1.1),
int min_neighbors CV_DEFAULT(3),
int flags CV_DEFAULT(0),
CvSize min_size CV_DEFAULT(cvSize(0,0)),
CvSize max_size CV_DEFAULT(cvSize(0,0))
);
參数说明:
const CvArr* image:表示输入图像,使用灰度图能够去除一些噪声,而且加快检測速度。
CvHaarClassifierCascade* cascade:表示Haar特征分类器。能够用cvLoad()函数来从磁盘中载入xml文件作为Haar特征分类器。
CvMemStorage* storage:表示内存存储器,用来统一管理各种动态对象的内存。
double scale_factor:表示在前后两次相继的扫描中。搜索窗体的比例系数。默觉得1.1即每次搜索窗体依次扩大10%
int min_neighbors:表示构成检測目标的相邻矩形的最小个数(默觉得3个)。
假设组成检測目标的小矩形的个数和小于 min_neighbors
- 1 都会被排除。
假设min_neighbors 为 0, 则函数不做不论什么操作就返回全部的被检候选矩形框,这样的设定值一般用在用户自己定义对检測结果的组合程序上。
int flags:要么使用默认值,要么使用CV_HAAR_DO_CANNY_PRUNING,假设设置为CV_HAAR_DO_CANNY_PRUNING,那么函数将会使用Canny边缘检測来排除边缘过多或过少的区域,因此这些区域通常不会是人脸所在区域。
CvSize min_size、max_size:表示检測窗体的最小值和最大值,一般设置为默认就可以。
函数返回值:
函数将返回CvSeq对象。该对象包括一系列CvRect表示检測到的人脸矩形。
案例实战——IOS7人脸检測应用
最终进入正题了,这次的案例是在上篇的基础上稍加改动的。关于怎样在Xcode下配置openCV以及UIImage与cv:Mat和IplImage之间的转化我就不赘述了,详细请參看【从零学习openCV】IOS7下的openCV开发起步(Xcode5.1.1&openCV2.49)
首先我们先将haarcascade_frontalface_alt2.xml导入project文件夹
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2hhd25faHQ=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" width="245" height="40" alt="" style="color:rgb(51,51,51); font-family:KaiTi_GB2312; font-size:14px; line-height:26px; white-space:pre-wrap">
将main.storyboard下的布局改成例如以下形式:
好了,废话不多说,直接上代码:
- (void) opencvFaceDetect {
NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init];
UIImage* img = [image copy];
if(img) {
[self.view bringSubviewToFront:self.indicator];
[self.indicator startAnimating]; //因为人脸检測比較耗时,于是使用载入指示器 cvSetErrMode(CV_ErrModeParent);
IplImage *image = [self CreateIplImageFromUIImage:img]; IplImage *grayImg = cvCreateImage(cvGetSize(image), IPL_DEPTH_8U, 1); //先转为灰度图
cvCvtColor(image, grayImg, CV_BGR2GRAY); //将输入图像缩小4倍以加快处理速度
int scale = 4;
IplImage *small_image = cvCreateImage(cvSize(image->width/scale,image->height/scale), IPL_DEPTH_8U, 1);
cvResize(grayImg, small_image); //载入分类器
NSString *path = [[NSBundle mainBundle] pathForResource:@"haarcascade_frontalface_alt2" ofType:@"xml"];
CvHaarClassifierCascade* cascade = (CvHaarClassifierCascade*)cvLoad([path cStringUsingEncoding:NSASCIIStringEncoding], NULL, NULL, NULL);
CvMemStorage* storage = cvCreateMemStorage(0);
cvClearMemStorage(storage); //关键部分,使用cvHaarDetectObjects进行检測,得到一系列方框
CvSeq* faces = cvHaarDetectObjects(small_image, cascade, storage ,1.1, currentvalue, CV_HAAR_DO_CANNY_PRUNING, cvSize(0,0), cvSize(0, 0)); NSLog(@"faces:%d",faces->total);
cvReleaseImage(&small_image);
cvReleaseImage(&image);
cvReleaseImage(&grayImg); //创建画布将人脸部分标记出
CGImageRef imageRef = img.CGImage;
CGColorSpaceRef colorSpace = CGColorSpaceCreateDeviceRGB();
CGContextRef contextRef = CGBitmapContextCreate(NULL, img.size.width, img.size.height,8, img.size.width * 4,colorSpace, kCGImageAlphaPremultipliedLast|kCGBitmapByteOrderDefault); CGContextDrawImage(contextRef, CGRectMake(0, 0, img.size.width, img.size.height), imageRef); CGContextSetLineWidth(contextRef, 4);
CGContextSetRGBStrokeColor(contextRef, 1.0, 0.0, 0.0, 1); //对人脸进行标记。假设isDoge为Yes则在人脸上贴图
for(int i = 0; i < faces->total; i++) {
NSAutoreleasePool * pool = [[NSAutoreleasePool alloc] init]; // Calc the rect of faces
CvRect cvrect = *(CvRect*)cvGetSeqElem(faces, i);
CGRect face_rect = CGContextConvertRectToDeviceSpace(contextRef, CGRectMake(cvrect.x*scale, cvrect.y*scale , cvrect.width*scale, cvrect.height*scale)); if(isDoge) {
CGContextDrawImage(contextRef, face_rect, [UIImage imageNamed:@"doge.png"].CGImage);
} else {
CGContextStrokeRect(contextRef, face_rect);
} [pool release];
} self.imageView.image = [UIImage imageWithCGImage:CGBitmapContextCreateImage(contextRef)];
CGContextRelease(contextRef);
CGColorSpaceRelease(colorSpace); cvReleaseMemStorage(&storage);
cvReleaseHaarClassifierCascade(&cascade);
} [pool release];
[self.indicator stopAnimating];
}
上面这个函数就是整个人脸检測的核心了,思路非常easy。先将原图像转为灰度图。而且缩小4倍,这样处理的速度可以大大加快。然后就是载入haar分类器,调用cvHaarDetectObjects函数进行检測得到一系列的人脸框(cvRect),最后就是在原图像上把cvRect的地方画出来。
因为整个检測过程相对照较耗时,尤其是图像像素特别大的时候。甚至须要好几秒的时间,所以应该单开线程来调用opencvFaceDetect方法。而且最后用指示器来表示图像正在处理中。
- (IBAction)FaceDetectClicked:(id)sender {
[self.view bringSubviewToFront:self.indicator];
[self.indicator startAnimating];
[NSThread detachNewThreadSelector:@selector(opencvFaceDetect) toTarget:self withObject:nil];
}
终于效果例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvc2hhd25faHQ=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" width="320" height="568" alt="">
近期迷上了doge啊。女神不要怪我。
。
老规矩,整个案例的project代码附上:IOS7下openCV人脸检測demo
(转载请注明作者和出处:Shawn-HT http://blog.csdn.net/shawn_ht 未经同意请勿用于商业用途)
參考文章:
http://www.iteye.com/topic/463668
http://www.douban.com/note/61620214/
http://www.cnblogs.com/dylantsou/archive/2012/08/11/2633483.html
http://blog.csdn.net/morewindows/article/details/8239678
版权声明:本文博客原创文章。博客,未经同意,不得转载。
【从零学习openCV】IOS7根据人脸检测的更多相关文章
- 【从零学习openCV】IOS7下的人脸检測
前言: 人脸检測与识别一直是计算机视觉领域一大热门研究方向,并且也从安全监控等工业级的应用扩展到了手机移动端的app,总之随着人脸识别技术获得突破,其应用前景和市场价值都是不可估量的,眼下在学习ope ...
- 【从零学习openCV】IOS7人脸识别实战
前言 接着上篇<IOS7下的人脸检測>,我们顺藤摸瓜的学习怎样在IOS7下用openCV的进行人脸识别,实际上非常easy,因为人脸检測部分已经完毕,剩下的无非调用openCV的方法对採集 ...
- OpenCV例程实现人脸检测
前段时间看的OpenCV,其实有很多的例子程序,参考代码值得我们学习,对图像特征提取三大法宝:HOG特征,LBP特征,Haar特征有一定了解后. 对本文中的例子程序刚开始没有调通,今晚上调通了,试了试 ...
- OpenCV + python 实现人脸检测(基于照片和视频进行检测)
OpenCV + python 实现人脸检测(基于照片和视频进行检测) Haar-like 通俗的来讲,就是作为人脸特征即可. Haar特征值反映了图像的灰度变化情况.例如:脸部的一些特征能由矩形特征 ...
- OpenCV入门指南----人脸检测
本篇介绍图像处理与模式识别中最热门的一个领域——人脸检测(人脸识别).人脸检测可以说是学术界的宠儿,在不少EI,SCI高级别论文都能看到它的身影.甚至很多高校学生的毕业设计都会涉及到人脸检测.当然人脸 ...
- opencv 美白磨皮人脸检测<转>
1. 简介 这学期的计算机视觉课,我们组的课程项目为“照片自动美化”,其中我负责的模块为人脸检测与自动磨皮.功能为:用户上传一张照片,自动检测并定位出照片中的人脸,将照片中所有的人脸进行“磨皮”处理, ...
- 基于TensorFlow Object Detection API进行迁移学习训练自己的人脸检测模型(二)
前言 已完成数据预处理工作,具体参照: 基于TensorFlow Object Detection API进行迁移学习训练自己的人脸检测模型(一) 设置配置文件 新建目录face_faster_rcn ...
- OpenCV神技——人脸检测,猫脸检测
简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Linux.Windows.Android和Mac OS操作系统上.它轻量级而且高效--由一系列 C 函数和少量 ...
- Android—基于OpenCV+Android实现人脸检测
导读 OpenCV 是一个开源的跨平台计算机视觉库, 采C++语言编写,实现了图像处理和计算机视觉方面的很多通用算法,同时也提供对Python,Java,Android等的支持,这里利用Android ...
随机推荐
- 百度mp3接口
歌曲ID 具体信息接口:http://tingapi.ting.baidu.com/v1/restserver/ting? from=android&version=2.4.0&met ...
- Java开发环境的基本设置
作为Java的刚開始学习的人,不知道其它的刚開始学习的人有没有和我一样的感受:用Java开发须要配置这么复杂 的环境.太难了.第一次配置时,一团混乱.Oracle监听服务打不开了,PLSql连接不上O ...
- Codeforces Round #198 (Div. 2) C. Tourist Problem (数学+dp)
C. Tourist Problem time limit per test 1 second memory limit per test 256 megabytes input standard i ...
- KMP算法---字符串匹配
算法细节详见点击打开链接和点击打开链接 #include <stdio.h> #include <stdlib.h> #define N 7 #define M 15 void ...
- Java、PHP训练场地选择成都传祺播客
传智播客选择九类基础: 1 有不怕炫耀实力,我们会爱一本书,是一个开源项目 2 领先的新技术,让我们的学生走在别人前面,首先推出Hadoop.Unity3D.Nginx. 3 课程广博的知识,深入的技 ...
- 玩转web之servlet(六)---session介绍及简单使用(登录验证中保存信息)
在浏览器与服务器进行交互时,往往需要把涉及到的一些数据保存下来,这时就需要使用cookie或session进行状态管理. 这篇文章先来说说session怎么用,首先在servlet中创建一个sessi ...
- BZOJ 1150 CTSC2007 数据备份Backup 堆+馋
标题效果:给定一个长度n−1n-1的序列,要求选出kk个不相邻的数使得和最小 费用流显然能跑.并且显然过不去- - 考虑用堆模拟费用流 一个错误的贪心是每次取最小.这样显然过不去例子 我们把[每次取最 ...
- iOS 真机调试(最具体的步骤来解决历史,hmt精心打造)
/*************************************************************1************************************* ...
- UVA - 12130 Summits
Description Problem G - Summits Time limit: 8 seconds You recently started working for the largest m ...
- 表的顺序结构---重写Arraylist类
重写ArrayList类,为防止冲突,重写为MyArrayList,未继承Iterable类. public class MyArrayList<AnyType>{ int N=10; A ...