最近的研究要用到定位瞳孔的位置,所以上网搜了下相关的代码。总结如下:

1) 定位瞳孔可以直接使用opencv中的自带的分类器(haarcascade_eye_tree_eyeglasses.xml)来实现,以前听师兄说用opencv自带的这个方法定位瞳孔不准,但我自己做了实验后发现在正面人脸的情况下定位还是很准确的,后面有图。分析了下原因,师兄是他之前实验时感觉不准有可能是他的Opencv版本还不是很高,我这里用的是opencv2.4.4,相信opencv也在它的后续版本中不断的优化它的Machine learning中相关库以提高准确率。

当然,在复杂情况下的人眼精准定位本身就是一个热门的研究课题。所以如果是复杂情况下的精准定位,opencv可能就没那么给力了。

2)用opencv中检测人脸、眼睛、嘴巴等都是用的CascadeClassifier分类器,具体使用时可以使用C的函数,也可以使用opencv中使用C++封装好的类。下面是它们检测目标时的函数形式(从opencv官网复制的)

C: CvSeq* cvHaarDetectObjects(const CvArr* image, CvHaarClassifierCascade* cascade,CvMemStorage* storage, double scale_factor=1.1, int min_neighbors=3, int flags=0, CvSize min_size=cvSize(0,0), CvSize max_size=cvSize(0,0) )

C++: void CascadeClassifier::detectMultiScale(const Mat& image, vector<Rect>& objects, double scaleFactor=1.1, int minNeighbors=3, int flags=0, Size minSize=Size(), Size maxSize=Size())

    这两者最大的区别在于,用C封装的函数要自己手动分配内存,而用C++的形式则不用自己去分配内存,这就是很多同学在网上找到的代码有些要分配内存,有些又不用分配内存的原因。显然C++的形式更简洁,所以我下面的代码也是用的C++的函数。

直接上代码,注意下面的haarcascade_eye_tree_eyeglasses.xml文件在opencv安装目录下的data文件夹中。

完整的代码在http://download.csdn.net/detail/computerme/7680383

  1. <span style="font-size:14px;">#include "highgui.h"
  2. #include "cv.h"
  3. #include <iostream>
  4. #include <stdio.h>
  5. using namespace std;
  6. using namespace cv;
  7. void DetectAndDraw(IplImage* img, CascadeClassifier& cascade);
  8. //String cascadeName = "haarcascade_frontalface_alt.xml";
  9. String cascadeName = "haarcascade_eye_tree_eyeglasses.xml";//nestedCascadeName
  10. int main( )
  11. {
  12. CascadeClassifier cascade;
  13. cascade.load( cascadeName );
  14. cvNamedWindow( "result", 1 );
  15. IplImage* iplImg = cvLoadImage("1.jpg");
  16. DetectAndDraw( iplImg, cascade );
  17. cvWaitKey(0);
  18. cvDestroyWindow("result");
  19. return 0;
  20. }
  21. void DetectAndDraw(IplImage* img, CascadeClassifier& cascade)
  22. {
  23. int i = 0;
  24. double t = 0;
  25. vector<Rect> faces;
  26. const static Scalar colors[] =  { CV_RGB(0,0,255),
  27. CV_RGB(0,128,255),
  28. CV_RGB(0,255,255),
  29. CV_RGB(0,255,0),
  30. CV_RGB(255,128,0),
  31. CV_RGB(255,255,0),
  32. CV_RGB(255,0,0),
  33. CV_RGB(255,0,255)} ;
  34. IplImage* gray = cvCreateImage(cvGetSize(img),8,1);
  35. cvCvtColor( img, gray, CV_BGR2GRAY );
  36. cvEqualizeHist( gray, gray );
  37. t = (double)cvGetTickCount();
  38. cascade.detectMultiScale( gray , faces,
  39. 1.1, 2, 0
  40. //|CV_HAAR_FIND_BIGGEST_OBJECT
  41. //|CV_HAAR_DO_ROUGH_SEARCH
  42. |CV_HAAR_SCALE_IMAGE
  43. ,
  44. Size(30, 30) );
  45. t = (double)cvGetTickCount() - t;
  46. printf( "detection time = %g ms\n", t/((double)cvGetTickFrequency()*1000.) );
  47. for( vector<Rect>::const_iterator r = faces.begin(); r != faces.end(); r++, i++ )
  48. {
  49. Point center;
  50. Scalar color = colors[i%8];
  51. int radius;
  52. //center可以作为瞳孔的坐标
  53. center.x = cvRound(r->x + r->width*0.5);
  54. center.y = cvRound(r->y + r->height*0.5);
  55. //radius = (int)(cvRound(r->width + r->height)*0.25);
  56. radius =2;
  57. cvCircle( img, center, radius, color, 3, 8, 0 );
  58. cvShowImage( "result", img );
  59. }
  60. cvShowImage( "result", img );
  61. }</span>

运行结果:

 

网址:http://blog.csdn.net/computerme/article/details/38142125

用opencv检测人眼并定位瞳孔位置的更多相关文章

  1. iOS开发检测是否开启定位、是否允许消息推送等权限

    1.iOS开发检测是否开启定位: 需要导入: #import <CoreLocation/CoreLocation.h> 代码如下: + (void)openLocationService ...

  2. hp小机定位网卡位置

    rad已经被olrad取代 HPUX下定位网卡位置                                                   一台HP小型机,可能配了多块网卡,在系统中以la ...

  3. 用 Python 和 OpenCV 检测图片上的条形码

      用 Python 和 OpenCV 检测图片上的的条形码 这篇博文的目的是应用计算机视觉和图像处理技术,展示一个条形码检测的基本实现.我所实现的算法本质上基于StackOverflow 上的这个问 ...

  4. TextArea中定位光标位置

    原文:TextArea中定位光标位置 在项目中,遇到一个场景:希望能在TextArea中输入某条记录中的明细(明细较简单,没有附属信息,只用记录顺序和值即可,譬如用"+"号来作为明 ...

  5. 机器学习进阶-光流估计 1.cv2.goodFeaturesToTrack(找出光流估计所需要的角点) 2.cv2.calcOpticalFlowPyrLK(获得光流检测后的角点位置) 3.cv2.add(进行像素点的加和)

    1.cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params)  用于获得光流估计所需要的角点参数说明:old_gray表示输入图片, ...

  6. linux下编译make文件报错“/bin/bash^M: 坏的解释器,使用grep快速定位代码位置

    一.linux下编译make文件报错“/bin/bash^M: 坏的解释器 参考文章:http://blog.csdn.net/liuqiyao_01/article/details/41542101 ...

  7. oops_根据epc定位linux_kernel_panic位置

    韩大卫@吉林师范大学 2014.12.10 转载请表明出处 ***************************************************** 关于内核报错 “Unable t ...

  8. 用 Python 和 OpenCV 检测图片上的条形码(转载)

    原文地址:http://python.jobbole.com/80448/ 假设我们要检测下图中的条形码: # load the image and convert it to grayscale 1 ...

  9. 利用.dSYM跟.app文件准确定位Crash位置

     本文转载至  http://blog.csdn.net/lvxiangan/article/details/28102629       利用.dSYM和.app文件准确定位Crash位置首先,确保 ...

随机推荐

  1. mac 类似Xshell

    ssh -t root@12.23.34.45 -p 22 ssh -t 用户名@IP地址 -p 端口

  2. lodash(二)对象+循环遍历+排序

    前言: lodash(一)中只是研究了array中的多种方法,接下来就是经常用到的循环遍历问题 过程: 1._.forEach(collection, [iteratee=_.identity], [ ...

  3. 进程防结束之PS_CROSS_THREAD_FLAGS_SYSTEM

    有人投到黑防去了,不过黑防不厚道,竟然没给完整的代码,自己整理一份备用吧,驱网.DebugMan.邪八的那群人直接飘过吧. 这种方法的关键在于给线程的ETHREAD.CrossThreadFlags设 ...

  4. 微信公众号支付JSAPI,提示:2支付缺少参数:appId

    因为demo中支付金额是定死的,所以需要调整. 所以在使用的JS上添加了参数传入.这里的传入string类型的参数,直接使用是错误的,对于方法,会出现appid缺少参数的错误 //调用微信JS api ...

  5. Android之ListView分页数据加载

    1.效果如下: 实例如下:  上图的添加数据按钮可以换成一个进度条  因为没有数据所以我加了一个按钮添加到数据库用于测试:一般在服务器拉去数据需要一定的时间,所以可以弄个进度条来提示用户: 点击加载按 ...

  6. Go基础---->go的基础学习(二)

    这里记录的是go中函数的一些基础知识.道听途说终是浅,身临其境方知深. go的基础知识 一.go中函数的基础使用 package main import ( "fmt" " ...

  7. sencha touch 入门系列 (九)sencha touch 视图组件简介

    对于一个普通用户来说,你的项目就是一组简单的视图集合,用户直接通过跟视图进行交互来操作你的应用,对于一个开发人员来说,视图是一个项目的入口,虽然大部分时候最有价值的部分是在model层和control ...

  8. PHP中文字数限制:中文字符串截取(mb_substr)

    一.中文截取:mb_substr() mb_substr( $str, $start, $length, $encoding ) $str,需要截断的字符串 $start,截断开始处,起始处为0 $l ...

  9. stm32的VCC/VDD/VSS/VEE/VBAT的区别

    先看一下stm32vet6的引脚图吧 电路设计以及PCB制作中,经常碰见电源符号:VCC. VDD.VEE.VSS,他们具有什么样的关系那? 一.解释 VCC:C=circuit 表示电路的意思, 即 ...

  10. maven学习(二)(转)

    一.maven父工程与子模块的拆分与聚合原理 问题描述:将ssh工程拆分为多个模块开发 1.1.拆分原理 创建一个maven project(pom),然后在创建三个子模块(maven moudule ...