EasyPR源码剖析（2）：车牌定位

上一篇主要介绍了车牌识别的整体框架和流程，车牌识别主要划分为了两个过程：即车牌检测和字符识别，而车牌识别的核心环节就是这一节主要介绍的车牌定位，即 Plate Locate。车牌定位主要是将图片中有可能是车牌的区域定位出来，方便后面进一步的处理。测试代码如下：

 int test_plate_locate() {

   cout << "test_plate_locate" << endl;

   const string file = "resources/image/plate_locate.jpg";

   cv::Mat src = imread(file);

   vector<cv::Mat> resultVec;

   CPlateLocate plate;

   int result = plate.plateLocate(src, resultVec);

   if (result == ) {

     size_t num = resultVec.size();

     for (size_t j = ; j < num; j++) {

       cv::Mat resultMat = resultVec[j];

       imshow("plate_locate", resultMat);

       waitKey();

     }

     destroyWindow("plate_locate");

   }

   return result;

 }

CPlateLocate 是实现车牌定位的主要功能类，其构造函数比较简单，主函数是 plateLocate，用于定位车牌区域，具体代码如下：

 //主处理函数

 int CPlateLocate::plateLocate(Mat src, vector<Mat> &resultVec, int index) {

   vector<CPlate> all_result_Plates;

   plateColorLocate(src, all_result_Plates, index);

   plateSobelLocate(src, all_result_Plates, index);

   plateMserLocate(src, all_result_Plates, index);

   for (size_t i = ; i < all_result_Plates.size(); i++) {

     CPlate plate = all_result_Plates[i];

     resultVec.push_back(plate.getPlateMat());

   }

   return ;

 }

从代码中可以看到，CPlateLocate 此处主要使用了以下三种方法，三种方法混合使用，互为补充。

1、颜色定位 plateColorLocate()；

2、sobel算子定位 plateSobelLocate() ；

3、MSER方法，即最大极值稳定区域方法 plateMserLocate()。

为什么要设计三种方法对车牌进行定位，这里有其使用场景的特殊性。最开始的车牌识别系统都是用sobel算子查找垂直边缘的方法进行车牌识别，但是该方法最大的问题在于面对垂直边缘交错的情况下，无法准确地定位车牌。如下图所示：

但是颜色定位也并非万能的，例如在色彩充足，光照足够的情况下，颜色定位的效果很好，但是在面对光线不足的情况，或者蓝色车身的情况时，颜色定位的效果很糟糕。如下图所示：

所以新版本的EasyPR中使用了颜色定位与 Sobel 定位结合的方式。首先进行颜色定位，然后根据条件使用Sobel 进行再次定位，增加整个系统的适应能力。但是有没有可能出现颜色定位和Sobel定位都无法识别车牌的情况呢，当然这种情况是有的，比如对分辨率较大的图片处理仍然不好。再加上颜色定位在面对低光照，低对比度的图像时处理效果大幅度下降，颜色本身也是一个不稳定的特征。因此EasyPR的车牌定位的整体鲁棒性仍然不足。如下图所示：

因此在前面两种方法的基础上又增加了MSER 最大极值稳定区域方法。最大极值稳定区域是由Matas等人提出的一种仿射特征区域提取算法。其提取的区域内部灰度几乎不变但是和背景的对比十分强烈，并且该区域能够在多重阈值下保持形状不变。它是基于分水岭的概念。MSER的基本原理是对一幅灰度图像（灰度值为0～255）取阈值进行二值化处理，阈值从0到255依次递增。阈值的递增类似于分水岭算法中的水面的上升，随着水面的上升，有一些较矮的丘陵会被淹没，类似于二值图像。在得到的所有二值图像中，图像中的某些连通区域变化很小，甚至没有变化，则该区域就被称为最大稳定极值区域。MSER算法的具体描述和实现我们会在后面做详细的介绍。

后续章节我们会分别对这三种车牌定位方法进行详细的介绍。

EasyPR源码剖析（2）：车牌定位的更多相关文章

EasyPR源码剖析（4）：车牌定位之Sobel算子定位
一.简介 sobel算子主要是用于获得数字图像的一阶梯度,常见的应用是边缘检测. Ⅰ.水平变化: 将 I 与一个奇数大小的内核进行卷积.比如,当内核大小为3时, 的计算结果为: Ⅱ.垂直变化: 将: ...
EasyPR源码剖析（7）：车牌判断之SVM
前面的文章中我们主要介绍了车牌定位的相关技术,但是定位出来的相关区域可能并非是真实的车牌区域,EasyPR通过SVM支持向量机,一种机器学习算法来判定截取的图块是否是真的“车牌”,本节主要对相关的技术 ...
EasyPR源码剖析（1）：概述
EasyPR(Easy to do Plate Recognition)是本人在opencv学习过程中接触的一个开源的中文车牌识别系统,项目Git地址为https://github.com/liuru ...
EasyPR源码剖析（5）：车牌定位之偏斜扭转
一.简介通过颜色定位和Sobel算子定位可以计算出一个个的矩形区域,这些区域都是潜在车牌区域,但是在进行SVM判别是否是车牌之前,还需要进行一定的处理.主要是考虑到以下几个问题: 1.定位区域存在一 ...
EasyPR源码剖析（3）：车牌定位之颜色定位
一.简介对车牌颜色进行识别,可能大部分人首先想到的是RGB模型, 但是此处RGB模型有一定的局限性,譬如蓝色,其值是255,还需要另外两个分量都为0,不然很有可能你得到的值是白色.黄色更麻烦,它是由 ...
EasyPR源码剖析（6）：车牌判断之LBP特征
一.LBP特征 LBP指局部二值模式,英文全称:Local Binary Pattern,是一种用来描述图像局部特征的算子,LBP特征具有灰度不变性和旋转不变性等显著优点. 原始的LBP算子定义在像素 ...
EasyPR源码剖析（8）：字符分割
通过前面的学习,我们已经可以从图像中定位出车牌区域,并且通过SVM模型删除“虚假”车牌,下面我们需要对车牌检测步骤中获取到的车牌图像,进行光学字符识别(OCR),在进行光学字符识别之前,需要对车牌图块 ...
EasyPR源码剖析（9）：字符识别
在上一篇文章的介绍中,我们已经通过相应的字符分割方法,将车牌区域进行分割,得到7个分割字符图块,接下来要做的就是将字符图块放入训练好的神经网络模型,通过模型来预测每个图块所表示的具体字符.神经网络的介 ...
HashMap源码剖析
HashMap源码剖析无论是在平时的练习还是项目当中,HashMap用的是非常的广,真可谓无处不在.平时用的时候只知道HashMap是用来存储键值对的,却不知道它的底层是如何实现的. 一.HashM ...

随机推荐

c++数据类型漫谈
在计算机眼里所有数据都是0101,二进制才是物理世界的主宰,c++的数据类型相对其他高级语言是相对较细的,因为是继承C而来,但是c++为什么要设计这么多数据类型呢?因为人类难以理解二进制,这就是数据类 ...
apue第九章之孤儿进程组
1. 为什么会有孤儿进程组的概念,APUE没直接写,但是GNU有规定: 孤儿进程组不可以获得终端,这是为了保证控制进程死掉后他的终端可以安全分配给新session.posix要求向新孤儿进程组中停止状 ...
Struts2高位漏洞升级到struts2.3.32
Struts2高位漏洞升级到struts2.3.32 3月7日带来了一个高危漏洞Struts2漏洞——CVE编号CVE-2017-5638.其原因是由于Apache Struts2的Jakarta M ...
python大法好——多线程
Python 多线程多线程类似于同时执行多个不同程序,多线程运行有如下优点: 使用线程可以把占据长时间的程序中的任务放到后台去处理. 用户界面可以更加吸引人,这样比如用户点击了一个按钮去触发某些事件 ...
Python学习随笔（1）--可视化工具plotly使用
把数据库某列数据取出来,然后再在本地生成html文件形成可视化视图显示 #!/usr/bin/python# coding=utf-8 import pymysqlimport plotly.plot ...
AWS 实战
AWS (Amazon Web Service) 要使用亚马逊的免费云服务 AWS,必须先注册账号,然后绑定信用卡. 创建 AMI(Amazon Machine Image) 选择 EC2 服务 EC ...
tabpanel如何隐藏页签表头以及基本用法总结
tabpanel是extjs中一种比较常用的布局容器控件,也比较简单. ///1:相关的插件, var tabScrollerMenu = Ext.create("Ext.ux.TabScr ...
Functional Language
1.What is functional language? 函数式语言(functional language)一类程序设计语言,是一种非冯·诺伊曼式的程序设计语言.函数式语言主要成分是原始函数.定 ...
Excel VBA ——如何导出数据到excel表格
sub OutPut() Dim FileTitle, MyPath, MyFullName As String Application.ScreenUpdating = false '关闭表格公式的 ...
Python学习—数据库篇之SQL语句
一.数据库级别 1.显示数据库 show databases; 默认数据库: mysql - 用户权限相关数据 test - 用于用户测试数据 information_schema - MySQL本身 ...

EasyPR源码剖析（2）：车牌定位

EasyPR源码剖析（2）：车牌定位的更多相关文章

随机推荐

热门专题