机器学习进阶-项目实战-信用卡数字识别 1.cv2.findContour(找出轮廓) 2.cv2.boudingRect(轮廓外接矩阵位置) 3.cv2.threshold(图片二值化操作) 4.cv2.MORPH_TOPHAT(礼帽运算突出线条) 5.cv2.MORPH_CLOSE(闭运算图片内部膨胀) 6. cv2.resize(改变图像大小) 7.cv2.putText(在图片上放上文本)
7. cv2.putText(img, text, loc, text_font, font_scale, color, linestick)
# 参数说明:img表示输入图片,text表示需要填写的文本str格式,loc表示文本在图中的位置,font_size可以使用cv2.FONT_HERSHEY_SIMPLEX,
font_scale表示文本的规格,color表示文本颜色,linestick表示线条大小
信用卡数字识别:
信用卡 数字模板
涉及到的内容:主要是采用模板匹配的思想
思路:
第一部分:数字模板提取数字
第一步:读入图片
第二步:进行灰度化和二值化处理,这里的二值化使用的cv2.THRESH_BINARY_INV, 将黑色的数字转换为白色
第三步:使用cv2.findContours获得轮廓信息
第四步:对contours根据外接矩阵的x的位置,从左到右进行排序
第五步:遍历contours,使用cv2.boudingRect外接矩形获得轮廓的位置信息,提取数字轮廓的图片,与索引组成轮廓信息的字典
import cv2
import numpy as np
import my_utis def cv_show(img, name):
cv2.imshow(name, img)
cv2.waitKey(0)
cv2.destroyAllWindows() # 第一部分:数字模板准备
# 第一步:读入图片
template = cv2.imread('images/ocr_a_reference.png')
# 第二步:进行灰度值和二值化转换
gray = cv2.cvtColor(template, cv2.COLOR_BGR2GRAY)
cv_show(gray, 'gray')
# 将黑色转换为白色,将白色转换为黑色
thresh = cv2.threshold(gray, 10, 255, cv2.THRESH_BINARY_INV)[1]
cv_show(thresh, 'thresh') # 第三步:找出轮廓值使用cv2.findContours找出轮廓值,cv2.RETR_EXTERNAL表示图像的外轮廓
binary, contours, h = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) # 第四步:对轮廓值进行排序, 因为contours轮廓不是按循序排列的,因此根据contours所在的位置从左到右进行排序
contours = my_utis.contours_sort(contours) # 第五步: 遍历模板,使用cv2.boudingRect获得轮廓的位置,提取位置对应的图片,与数字结合构造成模板字典
dict_template = {}
for i, contour in enumerate(contours):
# 画出其外接矩阵,获得其位置信息
x, y, w, h = cv2.boundingRect(contour)
template_img = binary[y:y+h, x:x+w]
# 使用cv2.resize变化模板的大小
template_img = cv2.resize(template_img, (55, 88))
# cv_show(template_img, 'template_img')
dict_template[i] = template_img
第二部分:对图片进行预处理,提取包含数字信息的4个轮廓的位置信息
第一步:读入图片
第二步:调用函数,扩大图片的面积,并进行灰度化
第三步:使用礼帽tophat 原始图片 - 先腐蚀后膨胀的图片,为了去除背景,使得线条更加的突出
第四步:使用sobel算子cv2.Sobel 找出图片中的边缘信息,即进行图像的梯度运算
第五步:使用闭运算 先膨胀再腐蚀, 将图片上的一些相近的数字进行相连,使得其连成一块
第六步:使用cv2.threshold 将图片进行二值化操作
第七步:再次使用闭运算对图片中的内部缺失的位置再次进行填充,使用不同的卷积核
第八步:重新计算轮廓值,遍历轮廓,根据长宽比和长宽的数值,筛选出符合条件的轮廓的locs,并对locs根据x的大小进行排序
# 第二部分:对图片进行预处理,提取包含数字信息的轮廓块 rectKernel = np.ones([3, 9]) # 构造的卷积核,用于进行闭运算,和礼帽运算
sqKernel = np.ones([6, 6]) # 构造的卷积核,用于进行闭运算 # 第一步: 读入图片
img = cv2.imread('images/cr'
'edit_card_01.png')
# 第二步:扩大图片的维度,进行灰度化转换
img = my_utis.resize(img, width=300)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) print(gray.shape)
#第三步:使用礼帽操作,使得亮度更加的明显
tophat = cv2.morphologyEx(gray, cv2.MORPH_TOPHAT, rectKernel)
cv_show(tophat, 'tophat') # 第四步:使用sobel算子获得边缘信息,ksize=-1表示sobel算子的维度为(3, 3)
sobel = cv2.Sobel(tophat, cv2.CV_64F, 1, 0, ksize=-1) # 取绝对值操作
sobel = np.absolute(sobel)
sobel_img = 255 * (sobel - sobel.min()) / (sobel.max() - sobel.min())
sobel_img = np.uint8(sobel_img) cv_show(sobel_img, 'sobel_img') # 第五步:使用闭操作, 先腐蚀,再膨胀将字母进行合并
close = cv2.morphologyEx(sobel_img, cv2.MORPH_CLOSE, rectKernel) cv_show(close, 'close') # 第六步:进行二值化操作
binary = cv2.threshold(close, 0, 255, cv2.THRESH_BINARY|cv2.THRESH_OTSU)[1] cv_show(binary, 'binary') # 第七步:再使用闭操作,对内部空白区域进行填充
close2 = cv2.morphologyEx(binary, cv2.MORPH_CLOSE, sqKernel) cv_show(close2, 'close2') # 第八步:使用cv2.findContours进行轮廓的识别
binary, contours, h = cv2.findContours(close2, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
locs = []
# 循环轮廓,将符合条件的contours加入
for i, contour in enumerate(contours):
x, y, w, h = cv2.boundingRect(contour)
acr = int(w/h)
if acr > 2.5 and acr < 4.0:
if (w > 40 and w<55) and (h > 10 and h < 20):
locs.append((x, y, w, h)) # 对locs根据x从左到右进行排序
locs = sorted(locs, key=lambda x: x[0])
第三部分:遍历每个locs,提取其中的数字,与模板数字做匹配,判断数字属于模板中的哪个数字
第一步:遍历locs,使用loc中的x,y, w, h 获得信用卡中的对应图片
第二步:对图片进行二值化操作
第三步:使用cv2.findContours,找出其中的轮廓,对轮廓进行排序
第四步:循环轮廓,使用外接矩形的位置信息, x1, y1, w1, h1, 获得当前轮廓对应的数字,此时已经获得了需要预测数字的单个图片
第五步:循环数字模板,使用cv2.matchTemplate进行模板匹配,使用cv2.minMaxLoc获得最大的得分值,使用np.argmax输出可能性最大的数字
print(np.shape(locs))
# 第三部分:遍历每个locs,对其中的数字进行匹配, 判断数字属于模板中的哪个数字
predict_number = []
predict_loc = []
for i, loc in enumerate(locs):
# 第一步:获得轮廓对应的数字块的图片
x, y, w, h = loc
loc_img = gray[y-5 : y+h+5, x-5: x+w+5]
# 第二步:对数字块的图片进行二值化操作
thresh = cv2.threshold(loc_img, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]
# 第三步:进行轮廓检测, 并对轮廓进行排序操作
binary, contours, h = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
# 对轮廓检测的结果按照从左到右的顺序进行排序
contours = my_utis.contours_sort(contours)
# 第四步:遍历轮廓, 使用轮廓的外接矩阵获得数字图片,并使用cv2.resize改变图片的大小
for i, contour in enumerate(contours):
scores = []
x1, y1, w1, h1 = cv2.boundingRect(contour)
predict_loc.append((x1-6+x, y1-6+y, w1+2, h1+2))
contour_img = thresh[y1:y1+h1, x1:x1+w1]
contour_img = cv2.resize(contour_img, (55, 88))
# cv_show(contour_img, 'contour')
# 进行模板匹配
# 第五步:遍历数字模板,使用matchTemplate找出与图片匹配度最高的数字
for templates in dict_template.values():
ret = cv2.matchTemplate(contour_img, templates, cv2.TM_CCOEFF_NORMED) _, score, _, _ = cv2.minMaxLoc(ret)
scores.append(score)
predict_number.append(str((np.argmax(scores))))
第四部分:在原始的图片进行作图操作
第一步:使用cv2.rectangle画出矩阵
第二步:使用cv2.putText加上文字信息
for i in range(len(predict_number)):
x, y, w, h = predict_loc[i]
# 第一步:画出矩形框
cv2.rectangle(img, (x, y), (x+w, y+h), (0, 0, 255), 1)
print(predict_number[i])
# 第二步:在图片上加上文本
cv2.putText(img, predict_number[i], (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2) cv_show(img, 'img')
最终的效果图
import cv2
import numpy as np def contours_sort(contours, method=0):
if method == 0:
contours = sorted(contours, key=lambda x:cv2.boundingRect(x)[0])
else:
contours = sorted(contours, key=lambda x:cv2.boundingRect(x)[0], reverse=True) return contours def resize(image, width=None, height=None, inter=cv2.INTER_AREA): h, w = image.shape[:2]
if width is None and height is None:
return image
if width is None:
r = height / float(h)
dim = (int(w * r), height)
else:
r = width / w
dim = (width, int(r * h))
resized = cv2.resize(image, dim, interpolation=inter)
return resized
调用的函数my_utis.py
机器学习进阶-项目实战-信用卡数字识别 1.cv2.findContour(找出轮廓) 2.cv2.boudingRect(轮廓外接矩阵位置) 3.cv2.threshold(图片二值化操作) 4.cv2.MORPH_TOPHAT(礼帽运算突出线条) 5.cv2.MORPH_CLOSE(闭运算图片内部膨胀) 6. cv2.resize(改变图像大小) 7.cv2.putText(在图片上放上文本)的更多相关文章
- 机器学习进阶-案例实战-答题卡识别判 1.cv2.getPerspectiveTransform(获得投射变化后的H矩阵) 2.cv2.warpPerspective(H获得变化后的图像) 3.cv2.approxPolyDP(近似轮廓) 4.cv2.threshold(二值变化) 7.cv2.countNonezeros(非零像素点个数)6.cv2.bitwise_and(与判断)
1.H = cv2.getPerspectiveTransform(rect, transform_axes) 获得投射变化后的H矩阵 参数说明:rect表示原始的位置左上,右上,右下,左下, tra ...
- python图片二值化提高识别率
import cv2from PIL import Imagefrom pytesseract import pytesseractfrom PIL import ImageEnhanceimport ...
- 深度学习实践-强化学习-bird游戏 1.np.stack(表示进行拼接操作) 2.cv2.resize(进行图像的压缩操作) 3.cv2.cvtColor(进行图片颜色的转换) 4.cv2.threshold(进行图片的二值化操作) 5.random.sample(样本的随机抽取)
1. np.stack((x_t, x_t, x_t, x_t), axis=2) 将图片进行串接的操作,使得图片的维度为[80, 80, 4] 参数说明: (x_t, x_t, x_t, x_t) ...
- [置顶] c#验证码识别、图片二值化、分割、分类、识别
c# 验证码的识别主要分为预处理.分割.识别三个步骤 首先我从网站上下载验证码 处理结果如下: 1.图片预处理,即二值化图片 *就是将图像上的像素点的灰度值设置为0或255. 原理如下: 代码如下: ...
- 机器学习进阶-案例实战-停车场车位识别-keras预测是否停车站有车
import numpy import os from keras import applications from keras.preprocessing.image import ImageDat ...
- 机器学习入门-数值特征-进行二值化变化 1.Binarizer(进行数据的二值化操作)
函数说明: 1. Binarizer(threshold=0.9) 将数据进行二值化,threshold表示大于0.9的数据为1,小于0.9的数据为0 对于一些数值型的特征:存在0还有其他的一些数 二 ...
- 机器学习进阶-阈值与平滑-图像阈值 1. cv2.threshold(进行阈值计算) 2. 参数type cv2.THRESH_BINARY(表示进行二值化阈值计算)
1. ret, dst = cv2.thresh(src, thresh, maxval, type) 参数说明, src表示输入的图片, thresh表示阈值, maxval表示最大值, type表 ...
- 【转载】opencv 二值化函数——cv2.threshold
https://blog.csdn.net/weixin_38570251/article/details/82079080 threshold:固定阈值二值化, ret, dst = cv2.thr ...
- 机器学习进阶-案例实战-图像全景拼接-图像全景拼接(RANSCA) 1.sift.detectAndComputer(获得sift图像关键点) 2.cv2.findHomography(计算单应性矩阵H) 3.cv2.warpPerspective(获得单应性变化后的图像) 4.cv2.line(对关键点位置进行连线画图)
1. sift.detectAndComputer(gray, None) # 计算出图像的关键点和sift特征向量 参数说明:gray表示输入的图片 2.cv2.findHomography(kp ...
随机推荐
- vue2.0变化
之前有很多的vue知识总结都是围绕1.0版本实现的,下面主要总结一下2.0相对于1.0的一些变化. 组件定义 在vue1.0中,我们有使用vue.extend()来创建组件构造器继而创建组件实例,如下 ...
- IDC:机房监控系统
ylbtech-IDC:机房监控系统 机房监控系统主要是针对机房所有的设备及环境进行集中监控和管理的,其监控对象构成机房的各个子系统:动力系统.环境系统.消防系统.保安系统.网络系统等. 1.返回顶部 ...
- Scrapy学习篇(二)之常用命令行工具
简介 Scrapy是通过Scrapy命令行工具进行控制的,包括创建新的项目,爬虫的启动,相关的设置,Scrapy提供了两种内置的命令,分别是全局命令和项目命令,顾名思义,全局命令就是在任意位置都可以执 ...
- PowerDesigner最基础的使用方法入门学习(一)
1:入门级使用PowerDesigner软件创建数据库(直接上图怎么创建,其他的概念知识可自行学习) 我的PowerDesigner版本是16.5的,如若版本不一样,请自行参考学习即可.(打开软件即是 ...
- Jmeter(三十五)聚合报告
Jmeter的聚合报告是一个非常nice的listener,接口测试以及性能测试方面都会用到这个nice的监听器. 那么优秀在什么地方呢?上图 日常工作中可能只关注这部分内容: 可是这里边的指标真的都 ...
- css样式,高斯模糊
.blur-container.blur-3 { --bg: url("background.jpg"); background-image: var(--bg); } .blur ...
- Hadoop 2.x常用端口及查看方法
Hadoop集群的各部分一般都会使用到多个端口,有些是daemon之间进行交互之用,有些是用于RPC访问以及HTTP访问.而随着Hadoop周边组件的增多,完全记不住哪个端口对应哪个应用,特收集记录如 ...
- centos7 真实机安装后没有网卡解决办法
我们在真实机安装完centos7版本后,会发现没有网卡,只有lo口 因为真实机不同你在虚拟机里面,这个时候我们不能连网,更加不要说配置什么静态ip了 是什么原因呢,是因为有些真实机安装了centos系 ...
- HBase核心知识和应用案例
Hbase 热点问题? Hbase 预分区 Hbase Rowkey 设计原则 Hbase 常见避免热点问题方法 Hbase 总结 Hbase 连续查询的Rowkey设计 Hbase 随机查询的Row ...
- kafka的API操作
在集群的接收端 启动producer 在consumer这边能接收到producer发来的数据