最近的研究要用到定位瞳孔的位置,所以上网搜了下相关的代码。总结如下:

1) 定位瞳孔可以直接使用opencv中的自带的分类器(haarcascade_eye_tree_eyeglasses.xml)来实现,以前听师兄说用opencv自带的这个方法定位瞳孔不准,但我自己做了实验后发现在正面人脸的情况下定位还是很准确的,后面有图。分析了下原因,师兄是他之前实验时感觉不准有可能是他的Opencv版本还不是很高,我这里用的是opencv2.4.4,相信opencv也在它的后续版本中不断的优化它的Machine learning中相关库以提高准确率。

当然,在复杂情况下的人眼精准定位本身就是一个热门的研究课题。所以如果是复杂情况下的精准定位,opencv可能就没那么给力了。

2)用opencv中检测人脸、眼睛、嘴巴等都是用的CascadeClassifier分类器,具体使用时可以使用C的函数,也可以使用opencv中使用C++封装好的类。下面是它们检测目标时的函数形式(从opencv官网复制的)

C: CvSeq* cvHaarDetectObjects(const CvArr* image, CvHaarClassifierCascade* cascade,CvMemStorage* storage, double scale_factor=1.1, int min_neighbors=3, int flags=0, CvSize min_size=cvSize(0,0), CvSize max_size=cvSize(0,0) )

C++: void CascadeClassifier::detectMultiScale(const Mat& image, vector<Rect>& objects, double scaleFactor=1.1, int minNeighbors=3, int flags=0, Size minSize=Size(), Size maxSize=Size())

    这两者最大的区别在于,用C封装的函数要自己手动分配内存,而用C++的形式则不用自己去分配内存,这就是很多同学在网上找到的代码有些要分配内存,有些又不用分配内存的原因。显然C++的形式更简洁,所以我下面的代码也是用的C++的函数。

直接上代码,注意下面的haarcascade_eye_tree_eyeglasses.xml文件在opencv安装目录下的data文件夹中。

完整的代码在http://download.csdn.net/detail/computerme/7680383

  1. <span style="font-size:14px;">#include "highgui.h"
  2. #include "cv.h"
  3. #include <iostream>
  4. #include <stdio.h>
  5. using namespace std;
  6. using namespace cv;
  7. void DetectAndDraw(IplImage* img, CascadeClassifier& cascade);
  8. //String cascadeName = "haarcascade_frontalface_alt.xml";
  9. String cascadeName = "haarcascade_eye_tree_eyeglasses.xml";//nestedCascadeName
  10. int main( )
  11. {
  12. CascadeClassifier cascade;
  13. cascade.load( cascadeName );
  14. cvNamedWindow( "result", 1 );
  15. IplImage* iplImg = cvLoadImage("1.jpg");
  16. DetectAndDraw( iplImg, cascade );
  17. cvWaitKey(0);
  18. cvDestroyWindow("result");
  19. return 0;
  20. }
  21. void DetectAndDraw(IplImage* img, CascadeClassifier& cascade)
  22. {
  23. int i = 0;
  24. double t = 0;
  25. vector<Rect> faces;
  26. const static Scalar colors[] =  { CV_RGB(0,0,255),
  27. CV_RGB(0,128,255),
  28. CV_RGB(0,255,255),
  29. CV_RGB(0,255,0),
  30. CV_RGB(255,128,0),
  31. CV_RGB(255,255,0),
  32. CV_RGB(255,0,0),
  33. CV_RGB(255,0,255)} ;
  34. IplImage* gray = cvCreateImage(cvGetSize(img),8,1);
  35. cvCvtColor( img, gray, CV_BGR2GRAY );
  36. cvEqualizeHist( gray, gray );
  37. t = (double)cvGetTickCount();
  38. cascade.detectMultiScale( gray , faces,
  39. 1.1, 2, 0
  40. //|CV_HAAR_FIND_BIGGEST_OBJECT
  41. //|CV_HAAR_DO_ROUGH_SEARCH
  42. |CV_HAAR_SCALE_IMAGE
  43. ,
  44. Size(30, 30) );
  45. t = (double)cvGetTickCount() - t;
  46. printf( "detection time = %g ms\n", t/((double)cvGetTickFrequency()*1000.) );
  47. for( vector<Rect>::const_iterator r = faces.begin(); r != faces.end(); r++, i++ )
  48. {
  49. Point center;
  50. Scalar color = colors[i%8];
  51. int radius;
  52. //center可以作为瞳孔的坐标
  53. center.x = cvRound(r->x + r->width*0.5);
  54. center.y = cvRound(r->y + r->height*0.5);
  55. //radius = (int)(cvRound(r->width + r->height)*0.25);
  56. radius =2;
  57. cvCircle( img, center, radius, color, 3, 8, 0 );
  58. cvShowImage( "result", img );
  59. }
  60. cvShowImage( "result", img );
  61. }</span>

运行结果:

 

网址:http://blog.csdn.net/computerme/article/details/38142125

用opencv检测人眼并定位瞳孔位置的更多相关文章

  1. iOS开发检测是否开启定位、是否允许消息推送等权限

    1.iOS开发检测是否开启定位: 需要导入: #import <CoreLocation/CoreLocation.h> 代码如下: + (void)openLocationService ...

  2. hp小机定位网卡位置

    rad已经被olrad取代 HPUX下定位网卡位置                                                   一台HP小型机,可能配了多块网卡,在系统中以la ...

  3. 用 Python 和 OpenCV 检测图片上的条形码

      用 Python 和 OpenCV 检测图片上的的条形码 这篇博文的目的是应用计算机视觉和图像处理技术,展示一个条形码检测的基本实现.我所实现的算法本质上基于StackOverflow 上的这个问 ...

  4. TextArea中定位光标位置

    原文:TextArea中定位光标位置 在项目中,遇到一个场景:希望能在TextArea中输入某条记录中的明细(明细较简单,没有附属信息,只用记录顺序和值即可,譬如用"+"号来作为明 ...

  5. 机器学习进阶-光流估计 1.cv2.goodFeaturesToTrack(找出光流估计所需要的角点) 2.cv2.calcOpticalFlowPyrLK(获得光流检测后的角点位置) 3.cv2.add(进行像素点的加和)

    1.cv2.goodFeaturesToTrack(old_gray, mask=None, **feature_params)  用于获得光流估计所需要的角点参数说明:old_gray表示输入图片, ...

  6. linux下编译make文件报错“/bin/bash^M: 坏的解释器,使用grep快速定位代码位置

    一.linux下编译make文件报错“/bin/bash^M: 坏的解释器 参考文章:http://blog.csdn.net/liuqiyao_01/article/details/41542101 ...

  7. oops_根据epc定位linux_kernel_panic位置

    韩大卫@吉林师范大学 2014.12.10 转载请表明出处 ***************************************************** 关于内核报错 “Unable t ...

  8. 用 Python 和 OpenCV 检测图片上的条形码(转载)

    原文地址:http://python.jobbole.com/80448/ 假设我们要检测下图中的条形码: # load the image and convert it to grayscale 1 ...

  9. 利用.dSYM跟.app文件准确定位Crash位置

     本文转载至  http://blog.csdn.net/lvxiangan/article/details/28102629       利用.dSYM和.app文件准确定位Crash位置首先,确保 ...

随机推荐

  1. 怎样使用es6 export,import不会报错

    如果浏览器支持es6的话,需要加上type="module" <script type="module"> import Store from &q ...

  2. JS 获取中英字符串字节长度

    正则匹配中文字: 这里限定中文字的范围,一般的使用是没什么问题的.如果要求十分严格的话,那么就只能使用更加严谨的代码匹配了 1:/([^\u0000-\u00FF])/g 2:/[^\x00-\xff ...

  3. 百度地图API功能

    984aca5bc78b070e59f34e230f11cf6d http://api.map.baidu.com/api?v=2.0&ak=您的密钥" <html> & ...

  4. 【BZOJ2164】采矿 树链剖分+线段树维护DP

    [BZOJ2164]采矿 Description 浩浩荡荡的cg大军发现了一座矿产资源极其丰富的城市,他们打算在这座城市实施新的采矿战略.这个城市可以看成一棵有n个节点的有根树,我们把每个节点用1到n ...

  5. float和double

    Java中,使用Float.floatToRawIntBits()函数获得一个单精度浮点数的IEEE 754 表示,例如: float fNumber = -5; //获得一个单精度浮点数的IEEE ...

  6. stark - 分页、search、actions

    一.分页 效果图 知识点 1.分页 {{ showlist.pagination.page_html|safe }} 2.page.py class Pagination(object): def _ ...

  7. Drainage Ditches---hdu1532(最大流)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1532 题意: 每次下雨的时候,农场主John的农场里就会形成一个池塘,这样就会淹没其中一小块土地,在这 ...

  8. 深入理解flannel

    1 概述 根据官网的描述,flannel是一个专为kubernetes定制的三层网络解决方案.它主要用于解决容器的跨主机通信问题.首先我们来简单看一下,它是如何工作的. 首先,flannel会利用Ku ...

  9. Ubuntu18.04下安装比特币客户端

    一.下载有两种安装方式:安装包和源码 二.安装1.通过安装包安装在https://bitcoin.org/en/download下载Windows,Mac OSX,Linux对应的安装包.安装过程比较 ...

  10. Tomcat安装(linux系统)

    首先解压: 进入配置文件: 统一tomcat的编码,避免乱码的问题: 保存退出. 注意: 查看打开的端口: /etc/init.d/iptables status 开启端口: iptables -A ...