OpenCV 实现图片的水平投影与垂直投影,并进行行分割
对于印刷体图片来说,进行水平投影和垂直投影可以很快的进行分割,本文就在OpenCV中如何进行水平投影和垂直投影通过代码进行说明。
水平投影:二维图像在y轴上的投影
垂直投影:二维图像在x轴上的投影
由于投影的图像需要进行二值化,本文采用积分二值化的方式,对图片进行处理。
具体代码如下:
//积分二值化 void thresholdIntegral (Mat inputMat, Mat& outputMat) { int nRows = inputMat.rows; int nCols = inputMat.cols; // create the integral image Mat sumMat; integral (inputMat, sumMat); ; double T = 0.15; // perform thresholding ; int x1, y1, x2, y2, count, sum; int* p_y1, *p_y2; uchar* p_inputMat, *p_outputMat; ; i < nRows; ++i) { y1 = i - s2; y2 = i + s2; ) { y1 = ; } if (y2 >= nRows) { y2 = nRows - ; } p_y1 = sumMat.ptr<int> (y1); p_y2 = sumMat.ptr<int> (y2); p_inputMat = inputMat.ptr<uchar> (i); p_outputMat = outputMat.ptr<uchar> (i); ; j < nCols; ++j) { // set the SxS region x1 = j - s2; x2 = j + s2; ) { x1 = ; } if (x2 >= nCols) { x2 = nCols - ; } count = (x2 - x1)* (y2 - y1); // I(x,y)=s(x2,y2)-s(x1,y2)-s(x2,y1)+s(x1,x1) sum = p_y2[x2] - p_y1[x2] - p_y2[x1] + p_y1[x1]; if ((int) (p_inputMat[j] * count) < (int) (sum* (1.0 - T))) { p_outputMat[j] = ; } else { p_outputMat[j] = ; } } } } //垂直方向投影 void picshadowx (Mat binary) { Mat paintx (binary.size(), CV_8UC1, Scalar ()); //创建一个全白图片,用作显示 int* blackcout = new int[binary.cols]; memset (blackcout, , binary.cols * ); ; i < binary.rows; i++) { ; j < binary.cols; j++) { ) { blackcout[j]++; //垂直投影按列在x轴进行投影 } } } ; i < binary.cols; i++) { ; j < blackcout[i]; j++) { paintx.at<uchar> (binary.rows--j, i) = ; //翻转到下面,便于观看 } } delete blackcout; imshow ("paintx", paintx); } //水平方向投影并行分割 void picshadowy (Mat binary) { //是否为白色或者黑色根据二值图像的处理得来 Mat painty (binary.size(), CV_8UC1, Scalar ()); //初始化为全白 //水平投影 int* pointcount = new int[binary.rows]; //在二值图片中记录行中特征点的个数 memset (pointcount, , binary.rows * );//注意这里需要进行初始化 ; i < binary.rows; i++) { ; j < binary.cols; j++) { ) { pointcount[i]++; //记录每行中黑色点的个数 //水平投影按行在y轴上的投影 } } } ; i < binary.rows; i++) { ; j < pointcount[i]; j++) //根据每行中黑色点的个数,进行循环 { painty.at<uchar> (i, j) = ; } } imshow ("painty", painty); vector<Mat> result; ; ; bool inblock = false; //是否遍历到字符位置 ; i < painty.rows; i++) { ) //进入有字符区域 { inblock = true; startindex = i; cout << "startindex:" << startindex << endl; } ) //进入空白区 { endindex = i; inblock = false; Mat roi = binary.rowRange (startindex, endindex+); //从而记录从开始到结束行的位置,即可进行行切分 result.push_back (roi); } } ; i < result.size(); i++) { Mat tmp = result[i]; imshow ("test"+to_string (i), tmp); } delete pointcount; } int main (int argc, char* argv[]) { Mat src = cv::imread ("test.jpg"); if (src.empty()) { cerr << "Problem loading image!!!" << endl; ; } imshow("in",src); Mat gray; ) { cv::cvtColor (src, gray, CV_BGR2GRAY); } else { gray = src; } Mat bw2 = Mat::zeros (gray.size(), CV_8UC1); thresholdIntegral (gray, bw2); cv::imshow ("binary integral", bw2); //picshadowx (bw2); picshadowy (bw2); waitKey (); ; }
输入图片:
二值图片:
水平投影:
垂直投影:
行切割:
OpenCV 实现图片的水平投影与垂直投影,并进行行分割的更多相关文章
- python 对图片做垂直投影
Python 对图片做垂直投影 本文利用opencv对图片进行垂直投影,做出垂直投影图,大体思路:打开图片,灰度化,二值化,按列进行统计,新建一个大小和原图一样的图片,按列进行填充: cv2.cv.G ...
- Python + opencv 实现图片文字的分割
实现步骤: 1.通过水平投影对图形进行水平分割,获取每一行的图像: 2.通过垂直投影对分割的每一行图像进行垂直分割,最终确定每一个字符的坐标位置,分割出每一个字符: 先简单介绍一下投影法:分别在水平和 ...
- 用 Python 和 OpenCV 检测图片上的条形码
用 Python 和 OpenCV 检测图片上的的条形码 这篇博文的目的是应用计算机视觉和图像处理技术,展示一个条形码检测的基本实现.我所实现的算法本质上基于StackOverflow 上的这个问 ...
- CSS实现文字和图片的水平垂直居中
关于文字和图片的水平垂直居中,在前端界绝对算是一个老生常谈的问题了,尤其是垂直居中,什么千奇百怪的解法都能想的出来.下面我就总结一些比较常用的方法: 一.文本的水平垂直居中: 1.水平居中: 是不是很 ...
- mysql的水平拆分和垂直拆分
转:http://www.cnblogs.com/sns007/p/5790838.html 1,水平分割: 例:QQ的登录表.假设QQ的用户有100亿,如果只有一张表,每个用户登录的时候数据库都要从 ...
- MYSQL水平拆分与垂直拆分
目前很多互联网系统都存在单表数据量过大的问题,这就降低了查询速度,影响了客户体验.为了提高查询速度,我们可以优化sql语句,优化表结构和索引,不过对那些百万级千万级的数据库表,即便是优化过后,查询速度 ...
- * CSS 视觉格式化(基本框、包含块、盒模型、水平格式化、垂直格式化、行布局、em框、内容区、行间距、行内框、行框)
前言 CSS视觉格式化这个词可能比较陌生,但说起盒模型可能就恍然大悟了.实际上,盒模型只是CSS视觉格式化的一部分.视觉格式化分为块级和行内两种处理方式.理解视觉格式化,可以确定得到的效果是应该显示的 ...
- mysql的水平拆分和垂直拆分 (转)
http://www.cnblogs.com/sns007/p/5790838.html 1,水平分割: 例:QQ的登录表.假设QQ的用户有100亿,如果只有一张表,每个用户登录的时候数据库都要从这1 ...
- mysql数据库的水平拆分与垂直拆分
近端时间在面试,发现很多面试官或者面试都把数据的水平拆分合垂直拆分给搞混了,今天特意写了一篇博客来说说水平拆分和垂直拆分希望对程序猿们有所帮助. 数据库水平与垂直拆分: 垂直(纵向)拆分:是指按功能模 ...
随机推荐
- LaunchScreen.storyboard 换图的问题
之前设置了`LaunchScreen.storyboard`,在这个storyboard中加了一个imageView,里面设置了一张图片launch.png,今天需要更换这个启动图片,我就直接去工程里 ...
- .2-Vue源码起步(2)
接着第一节开始继续吧(GoGoGo) 上一节把mergeOptions函数弄完了,最后返回一个options赋给了vm.$options. 这一节继续跑代码: function initMixin(V ...
- MUI点击事件获取当前对象,及当前对象的属性值
//用惯了jquery,开始用mui还是有些不习惯 //直接贴代码吧 <nav class="mui-bar mui-bar-tab"> <a class=&qu ...
- Leetcode题解(33)
113. Path Sum II 题目 分析: 主要考察二叉树深度优先遍历(DFS),递归调用当前节点的左右结点即可,代码如下(copy网上): /** * Definition for binary ...
- VS2013装扩展RazorGenerator
问题:vs2013工具扩展和更新搜索关键字:Razor Generator查找不到,如图 解决:下载网址:https://github.com/RazorGenerator/RazorGenerato ...
- 转 html5离线储存,application cache,manifest使用体验
html5离线应用application cache 最近在APP里新增一个论坛模块,为了快速地完成,决定将整个论坛模块做成WEB APP,WEB APP最致命的就是用户体验问题,页面跳转和过多的请求 ...
- SQL Server 2008对日期时间类型的改进
微软在备受多年的争议后,终于对日期时间数据类型开刀了,在新版的SQL Server 2008中一口气增加了4种新的日期时间数据类型,包括: Date:一个纯的日期数据类型. Time:一个纯的时间数据 ...
- 修改oracle服务器端字符集
----设置字符集步聚------- conn /as sysdba; shutdown immediate; startup mount; alter system enable restricte ...
- Struts2开发文档
struts2配置 struts2核心配置文件约束 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts ...
- SpringMVC接收复杂对象
SpringMVC接收复杂对象 转载请注明地址:http://www.cnblogs.com/funnyzpc/p/7642977.html 本节内容暂放一边,我先扯点儿,心情好了,代码顺风顺水哈~ ...