特征描述提取图像区域上有用信息而忽略无用信息,不同目标下有用信息与无用信息定义不同。这里提取的有用信息用于分类器输入并期望产生正确的分类。

HOG(Histogram of Oriented Gradient) 对图像块生成描述信息 vector,然后将每个图像块指定一个分类(-1, 1),通过大量训练得到一个线性分类器(SVM);针对新图像块首先生成描述 vector,在使用训练分类器对新的描述 vector 分类,实现图像分类。

HOG 首先应用在行人检测,opencv 中 HOGDescriptor 类已经给出了一个默认的分类器(HOGDescriptor::getDefaultPeopleDetector()),通过该分类器可实现图像中行人检测。

当需要对其他物体进行检测时,则需要自定义一个描述信息 vector, 训练分类器,最终实现特定图像分类。

这里首先学习默认描述信息 vector 的生成及分类:

1)行人检测默认图像块为 64 * 128,当需要检测其他尺寸下是否存在行人时,需要将其缩放到默认尺寸,如尺寸 100 * 200, 128 * 256... ,但检测长宽比总为 1:2 的区域;

2)计算图像梯度与梯度方向,形成梯度图与梯度方向图;

3)在  8 * 8 邻域内计算梯度方向直方图,计算方法如下图:

首先将梯度方向取值范围修改为 [0° ,180°),然后划分为 9 个 bins,使用加权方式填充梯度方向直方图;

4)将 16 * 16 邻域内的4个梯度直方图连接成 1 * 36 vector,并将其归一化处理;

以 8 * 8 的步长在 64 * 128 图像块上扫描图像,每次扫描形成一个 1 * 36 vector 并归一化,最终得到 7 * 15 * 36 = 3780 个元素的特征向量;

5)以 1 * 3780 vector 作为图像特征训练 SVM 分类器, SVM 分类器基本原理如下

寻找一个超平面 ,对于任意特征向量 X 可正确分类,W 可通过训练得到;

当训练完成后,针对新的特征向量,满足  为正类,满足  为负类;

在实际检测中,为了提升正类的可信度,可能使用  进行分类, 。

opencv 提供 HOGDescriptor 类已经训练好行人分类器(HOGDescriptor::getDefaultPeopleDetector()),下面对 HOGDescriptor  给出一些解释:

1) HOGDescriptor() : winSize(64,128), blockSize(16,16), blockStride(8,8),

cellSize(8,8), nbins(9), derivAperture(1), winSigma(-1),

histogramNormType(HOGDescriptor::L2Hys), L2HysThreshold(0.2), gammaCorrection(true),

nlevels(HOGDescriptor::DEFAULT_NLEVELS)

        以上代码构造 HOGDescriptor 对象,主要参数意义如下:

winSize:行人区域尺寸,在该尺寸上生成特征向量;对于大于该尺寸的行人,使用缩小到 winSize 尺寸以实现多尺度;应该注意的是,当行人尺寸较小时,无法通过放大到 winSize 尺寸实现检测;

cellSize:在 cellSize 区域上构造梯度方向直方图;

nbins:一个 cellSize 区域上形成梯度直方图的 bins;

        blockSize: 梯度方向直方图归一化尺寸,对 2 * 2 cells 进行归一化;

        blockStride:特征向量扫描步长,每次扫描增加 36 个特征点;
     2)hog.setSVMDetector(HOGDescriptor::getDefaultPeopleDetector()) 设置默认行人分类器参数;
     3)detectMultiScale()检测行人,主要参数如下:
          vector<Rect>& foundLocations:输出检测行人矩形区域;
          vector<double>& foundWeights:输出检测行人置信度;
          double hitThreshold:线性分类器  中  取值,提升正类可信度;
          double scale:计算其他检测尺度,当 scale 越趋近 1,形成更多检测尺度,检测越细致;
          double finalThreshold:丢弃置信度小于 finalThreshold 区域;
    opencv 提供 samples peopledetect 给出了行人检测的使用示例,我修改了参数 hitThreshold = .3 以提升正类可信度,检测结果如下:
        
 

参考资料 https://www.learnopencv.com/histogram-of-oriented-gradients/

https://docs.opencv.org/2.4.10/doc/tutorials/ml/introduction_to_svm/introduction_to_svm.html#introductiontosvms

opencv笔记--HOGDescriptor的更多相关文章

  1. OpenCV笔记大集锦(转载)

    整理了我所了解的有关OpenCV的学习笔记.原理分析.使用例程等相关的博文.排序不分先后,随机整理的.如果有好的资源,也欢迎介绍和分享. 1:OpenCV学习笔记 作者:CSDN数量:55篇博文网址: ...

  2. opencv笔记6:角点检测

    time:2015年10月09日 星期五 23时11分58秒 # opencv笔记6:角点检测 update:从角点检测,学习图像的特征,这是后续图像跟踪.图像匹配的基础. 角点检测是什么鬼?前面一篇 ...

  3. opencv笔记5:频域和空域的一点理解

    time:2015年10月06日 星期二 12时14分51秒 # opencv笔记5:频域和空域的一点理解 空间域和频率域 傅立叶变换是f(t)乘以正弦项的展开,正弦项的频率由u(其实是miu)的值决 ...

  4. opencv笔记4:模板运算和常见滤波操作

    time:2015年10月04日 星期日 00时00分27秒 # opencv笔记4:模板运算和常见滤波操作 这一篇主要是学习模板运算,了解各种模板运算的运算过程和分类,理论方面主要参考<图像工 ...

  5. opencv笔记3:trackbar简单使用

    time:2015年 10月 03日 星期六 13:54:17 CST # opencv笔记3:trackbar简单使用 当需要测试某变量的一系列取值取值会产生什么结果时,适合用trackbar.看起 ...

  6. opencv笔记2:图像ROI

    time:2015年 10月 03日 星期六 12:03:45 CST # opencv笔记2:图像ROI ROI ROI意思是Region Of Interests,感兴趣区域,是一个图中的一个子区 ...

  7. opencv笔记1:opencv的基本模块,以及环境搭建

    opencv笔记1:opencv的基本模块,以及环境搭建 安装系统 使用fedora22-workstation-x86_64 安装opencv sudo dnf install opencv-dev ...

  8. OpenCV基本架构[OpenCV 笔记0]

    最近正在系统学习OpenCV,将不定期发布笔记,主要按照毛星云的<OpenCV3编程入门>的顺序学习,会参考官方教程和文档.学习工具是Xcode+CMake,会对书中一部分内容更正,并加入 ...

  9. 查找并绘制轮廓[OpenCV 笔记XX]

    好久没有更新了,原谅自己放了个假最近又在赶进度,所以...更新的内容是很靠后的第八章,因为最近工作要用就先跳了,后面会更新笔记编号...加油加油! 在二值图像中寻找轮廓 void cv::findCo ...

随机推荐

  1. Centos7 logrotate日志切割

    https://www.cnblogs.com/kevingrace/p/6307298.html 在当前目录下 vim  *****  文件 需要切的日志  /home/soft/app/logs/ ...

  2. 基于CentOS7.x gitlab环境搭建,卸载,汉化 --搭建篇

    gitlab环境搭建,卸载,汉化 --搭建篇 环境搭建 安装依赖软件 yum -y install policycoreutils openssh-server openssh-clients pos ...

  3. 第10组 Beta冲刺 (3/5)(组长)

    1.1基本情况 ·队名:今晚不睡觉 ·组长博客:https://www.cnblogs.com/cpandbb/p/14018630.html ·作业博客:https://edu.cnblogs.co ...

  4. k8s中初始化容器(init container)的作用及其使用方法

    概述 在容器的部署过程中,有的时候需要在容器运行之前进行一些预配置的工作,比如下载配置,判断某些服务是否启动,修改配置等一些准备的工作,想要实现这些功能,在k8s中可以使用初始化容器,在应用容器运行之 ...

  5. C#8.0 可空引用类型

    介绍 我们的项目代码运行时最频繁的错误之一就是 System.NullReferenceException 异常,c#8.0增加的可为空引用类型就是用来帮助开发者降低甚至消除NULL异常.我们需要注意 ...

  6. 聊一聊如何用C#轻松完成一个SAGA分布式事务

    背景 银行跨行转账业务是一个典型分布式事务场景,假设 A 需要跨行转账给 B,那么就涉及两个银行的数据,无法通过一个数据库的本地事务保证转账的 ACID ,只能够通过分布式事务来解决. 市面上使用比较 ...

  7. 详解ElasticAPM实现微服务的链路追踪(NET)

    前言 Elastic APM实现链路追踪,首先要引用开源的APMAgent(APM代理),然后将监控的信息发送到APMServer,然后在转存入ElasticSearch,最后有Kibana展示:具体 ...

  8. 利用JavaScript与正则表达式判断输入账号格式是否正确

    在学习了HTML DOM对象后,做几个小练习来巩固一下所学内容. 正则表达式: 正则表达式,又称规则表达式.(英语:Regular Expression,在代码中常简写为regex.regexp或RE ...

  9. List<Integer>里有可能存String类型元素吗?

    这其实是我遇到的一个线上bug,在这里分享给大家. 如果是用反射,那就很简单了,毕竟泛型只是在编译期进行约束,对运行期是无能为力的. 想想看,如果不使用反射,有没有办法做到呢? 问题起因 在我们公司的 ...

  10. Spring专题1: 静态代理和动态代理

    合集目录 Spring专题1: 静态代理和动态代理 为什么需要代理模式? 代理对象处于访问者和被访问者之间,可以隔离这两者之间的直接交互,访问者与代理对象打交道就好像在跟被访者者打交道一样,因为代理者 ...