机器学习进阶-项目实战-信用卡数字识别 1.cv2.findContour(找出轮廓) 2.cv2.boudingRect(轮廓外接矩阵位置) 3.cv2.threshold(图片二值化操作) 4.cv2.MORPH_TOPHAT(礼帽运算突出线条) 5.cv2.MORPH_CLOSE(闭运算图片内部膨胀) 6. cv2.resize(改变图像大小) 7.cv2.putText(在图片上放上文本)

7. cv2.putText(img, text, loc, text_font, font_scale, color, linestick)

# 参数说明：img表示输入图片，text表示需要填写的文本str格式，loc表示文本在图中的位置，font_size可以使用cv2.FONT_HERSHEY_SIMPLEX,

font_scale表示文本的规格，color表示文本颜色，linestick表示线条大小

信用卡数字识别：

信用卡数字模板
涉及到的内容:主要是采用模板匹配的思想

思路：

第一部分：数字模板提取数字

第一步：读入图片

第二步：进行灰度化和二值化处理，这里的二值化使用的cv2.THRESH_BINARY_INV，将黑色的数字转换为白色

第三步：使用cv2.findContours获得轮廓信息

第四步：对contours根据外接矩阵的x的位置，从左到右进行排序

第五步：遍历contours，使用cv2.boudingRect外接矩形获得轮廓的位置信息，提取数字轮廓的图片，与索引组成轮廓信息的字典

import cv2

import numpy as np

import my_utis

def cv_show(img, name):

    cv2.imshow(name, img)

    cv2.waitKey(0)

    cv2.destroyAllWindows()

# 第一部分：数字模板准备

# 第一步：读入图片

template = cv2.imread('images/ocr_a_reference.png')

# 第二步：进行灰度值和二值化转换

gray = cv2.cvtColor(template, cv2.COLOR_BGR2GRAY)

cv_show(gray, 'gray')

# 将黑色转换为白色，将白色转换为黑色

thresh = cv2.threshold(gray, 10, 255, cv2.THRESH_BINARY_INV)[1]

cv_show(thresh, 'thresh')

# 第三步：找出轮廓值使用cv2.findContours找出轮廓值，cv2.RETR_EXTERNAL表示图像的外轮廓

binary, contours, h = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

# 第四步：对轮廓值进行排序， 因为contours轮廓不是按循序排列的，因此根据contours所在的位置从左到右进行排序

contours = my_utis.contours_sort(contours)

# 第五步： 遍历模板，使用cv2.boudingRect获得轮廓的位置，提取位置对应的图片，与数字结合构造成模板字典

dict_template = {}

for i, contour in enumerate(contours):

    # 画出其外接矩阵，获得其位置信息

    x, y, w, h = cv2.boundingRect(contour)

    template_img = binary[y:y+h, x:x+w]

    # 使用cv2.resize变化模板的大小

    template_img = cv2.resize(template_img, (55, 88))

    # cv_show(template_img, 'template_img')

    dict_template[i] = template_img

第二部分：对图片进行预处理，提取包含数字信息的4个轮廓的位置信息

第一步：读入图片

第二步：调用函数，扩大图片的面积，并进行灰度化

第三步：使用礼帽tophat 原始图片 - 先腐蚀后膨胀的图片，为了去除背景，使得线条更加的突出

第四步：使用sobel算子cv2.Sobel 找出图片中的边缘信息，即进行图像的梯度运算

第五步：使用闭运算先膨胀再腐蚀，将图片上的一些相近的数字进行相连，使得其连成一块

第六步：使用cv2.threshold 将图片进行二值化操作

第七步：再次使用闭运算对图片中的内部缺失的位置再次进行填充,使用不同的卷积核

第八步：重新计算轮廓值，遍历轮廓，根据长宽比和长宽的数值，筛选出符合条件的轮廓的locs，并对locs根据x的大小进行排序

# 第二部分：对图片进行预处理，提取包含数字信息的轮廓块

rectKernel = np.ones([3, 9])  # 构造的卷积核，用于进行闭运算，和礼帽运算

sqKernel = np.ones([6, 6])  # 构造的卷积核，用于进行闭运算

# 第一步: 读入图片

img = cv2.imread('images/cr'

                 'edit_card_01.png')

# 第二步：扩大图片的维度，进行灰度化转换

img = my_utis.resize(img, width=300)

gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

print(gray.shape)

#第三步：使用礼帽操作，使得亮度更加的明显

tophat = cv2.morphologyEx(gray, cv2.MORPH_TOPHAT, rectKernel)

cv_show(tophat, 'tophat')

# 第四步：使用sobel算子获得边缘信息，ksize=-1表示sobel算子的维度为(3, 3)

sobel = cv2.Sobel(tophat, cv2.CV_64F, 1, 0, ksize=-1)

# 取绝对值操作

sobel = np.absolute(sobel)

sobel_img = 255 * (sobel - sobel.min()) / (sobel.max() - sobel.min())

sobel_img = np.uint8(sobel_img)

cv_show(sobel_img, 'sobel_img')

# 第五步：使用闭操作, 先腐蚀，再膨胀将字母进行合并

close = cv2.morphologyEx(sobel_img, cv2.MORPH_CLOSE, rectKernel)

cv_show(close, 'close')

# 第六步：进行二值化操作

binary = cv2.threshold(close, 0, 255, cv2.THRESH_BINARY|cv2.THRESH_OTSU)[1]

cv_show(binary, 'binary')

# 第七步：再使用闭操作，对内部空白区域进行填充

close2 = cv2.morphologyEx(binary, cv2.MORPH_CLOSE, sqKernel)

cv_show(close2, 'close2')

# 第八步：使用cv2.findContours进行轮廓的识别

binary, contours, h = cv2.findContours(close2, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

locs = []

# 循环轮廓，将符合条件的contours加入

for i, contour in enumerate(contours):

    x, y, w, h = cv2.boundingRect(contour)

    acr = int(w/h)

    if acr > 2.5 and acr < 4.0:

        if (w > 40 and w<55) and (h > 10 and h < 20):

            locs.append((x, y, w, h))

# 对locs根据x从左到右进行排序

locs = sorted(locs, key=lambda x: x[0])

第三部分：遍历每个locs，提取其中的数字，与模板数字做匹配，判断数字属于模板中的哪个数字

第一步：遍历locs，使用loc中的x,y, w, h 获得信用卡中的对应图片

第二步：对图片进行二值化操作

第三步：使用cv2.findContours,找出其中的轮廓，对轮廓进行排序

第四步：循环轮廓，使用外接矩形的位置信息, x1, y1, w1, h1, 获得当前轮廓对应的数字，此时已经获得了需要预测数字的单个图片

第五步：循环数字模板，使用cv2.matchTemplate进行模板匹配，使用cv2.minMaxLoc获得最大的得分值，使用np.argmax输出可能性最大的数字

print(np.shape(locs))

# 第三部分：遍历每个locs，对其中的数字进行匹配， 判断数字属于模板中的哪个数字

predict_number = []

predict_loc = []

for i, loc in enumerate(locs):

    # 第一步：获得轮廓对应的数字块的图片

    x, y, w, h = loc

    loc_img = gray[y-5 : y+h+5, x-5: x+w+5]

    # 第二步：对数字块的图片进行二值化操作

    thresh = cv2.threshold(loc_img, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)[1]

    # 第三步：进行轮廓检测， 并对轮廓进行排序操作

    binary, contours, h = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # 对轮廓检测的结果按照从左到右的顺序进行排序

    contours = my_utis.contours_sort(contours)

    # 第四步：遍历轮廓， 使用轮廓的外接矩阵获得数字图片，并使用cv2.resize改变图片的大小

    for i, contour in enumerate(contours):

        scores = []

        x1, y1, w1, h1 = cv2.boundingRect(contour)

        predict_loc.append((x1-6+x, y1-6+y, w1+2, h1+2))

        contour_img = thresh[y1:y1+h1, x1:x1+w1]

        contour_img = cv2.resize(contour_img, (55, 88))

        # cv_show(contour_img, 'contour')

        # 进行模板匹配

        # 第五步：遍历数字模板，使用matchTemplate找出与图片匹配度最高的数字

        for templates in dict_template.values():

            ret = cv2.matchTemplate(contour_img, templates, cv2.TM_CCOEFF_NORMED)

            _, score, _, _ = cv2.minMaxLoc(ret)

            scores.append(score)

        predict_number.append(str((np.argmax(scores))))

第四部分：在原始的图片进行作图操作

第一步：使用cv2.rectangle画出矩阵

第二步：使用cv2.putText加上文字信息

for i in range(len(predict_number)):

    x, y, w, h = predict_loc[i]

    # 第一步：画出矩形框

    cv2.rectangle(img, (x, y), (x+w, y+h), (0, 0, 255), 1)

    print(predict_number[i])

    # 第二步：在图片上加上文本

    cv2.putText(img, predict_number[i], (x, y-10), cv2.FONT_HERSHEY_SIMPLEX, 0.65, (0, 0, 255), 2)

cv_show(img, 'img')

最终的效果图

import cv2

import numpy as np

def contours_sort(contours, method=0):

    if method == 0:

        contours = sorted(contours, key=lambda x:cv2.boundingRect(x)[0])

    else:

        contours = sorted(contours, key=lambda x:cv2.boundingRect(x)[0], reverse=True)

    return contours

def resize(image, width=None, height=None, inter=cv2.INTER_AREA):

    h, w = image.shape[:2]

    if width is None and height is None:

        return image

    if width is None:

        r = height / float(h)

        dim = (int(w * r), height)

    else:

        r = width / w

        dim = (width, int(r * h))

    resized = cv2.resize(image, dim, interpolation=inter)

    return resized

调用的函数my_utis.py

机器学习进阶-项目实战-信用卡数字识别 1.cv2.findContour(找出轮廓) 2.cv2.boudingRect(轮廓外接矩阵位置) 3.cv2.threshold(图片二值化操作) 4.cv2.MORPH_TOPHAT(礼帽运算突出线条) 5.cv2.MORPH_CLOSE(闭运算图片内部膨胀) 6. cv2.resize(改变图像大小) 7.cv2.putText(在图片上放上文本)的更多相关文章

机器学习进阶-案例实战-答题卡识别判 1.cv2.getPerspectiveTransform(获得投射变化后的H矩阵) 2.cv2.warpPerspective(H获得变化后的图像) 3.cv2.approxPolyDP(近似轮廓) 4.cv2.threshold(二值变化) 7.cv2.countNonezeros(非零像素点个数)6.cv2.bitwise_and(与判断)
1.H = cv2.getPerspectiveTransform(rect, transform_axes) 获得投射变化后的H矩阵参数说明:rect表示原始的位置左上,右上,右下,左下, tra ...
python图片二值化提高识别率
import cv2from PIL import Imagefrom pytesseract import pytesseractfrom PIL import ImageEnhanceimport ...
深度学习实践-强化学习-bird游戏 1.np.stack(表示进行拼接操作) 2.cv2.resize(进行图像的压缩操作) 3.cv2.cvtColor(进行图片颜色的转换) 4.cv2.threshold(进行图片的二值化操作) 5.random.sample(样本的随机抽取)
1. np.stack((x_t, x_t, x_t, x_t), axis=2) 将图片进行串接的操作,使得图片的维度为[80, 80, 4] 参数说明: (x_t, x_t, x_t, x_t) ...
[置顶] c#验证码识别、图片二值化、分割、分类、识别
c# 验证码的识别主要分为预处理.分割.识别三个步骤首先我从网站上下载验证码处理结果如下: 1.图片预处理,即二值化图片 *就是将图像上的像素点的灰度值设置为0或255. 原理如下: 代码如下: ...
机器学习进阶-案例实战-停车场车位识别-keras预测是否停车站有车
import numpy import os from keras import applications from keras.preprocessing.image import ImageDat ...
机器学习入门-数值特征-进行二值化变化 1.Binarizer(进行数据的二值化操作)
函数说明: 1. Binarizer(threshold=0.9) 将数据进行二值化,threshold表示大于0.9的数据为1,小于0.9的数据为0 对于一些数值型的特征:存在0还有其他的一些数二 ...
机器学习进阶-阈值与平滑-图像阈值 1. cv2.threshold(进行阈值计算) 2. 参数type cv2.THRESH_BINARY(表示进行二值化阈值计算)
1. ret, dst = cv2.thresh(src, thresh, maxval, type) 参数说明, src表示输入的图片, thresh表示阈值, maxval表示最大值, type表 ...
【转载】opencv 二值化函数——cv2.threshold
https://blog.csdn.net/weixin_38570251/article/details/82079080 threshold:固定阈值二值化, ret, dst = cv2.thr ...
机器学习进阶-案例实战-图像全景拼接-图像全景拼接(RANSCA) 1.sift.detectAndComputer(获得sift图像关键点) 2.cv2.findHomography(计算单应性矩阵H) 3.cv2.warpPerspective(获得单应性变化后的图像) 4.cv2.line(对关键点位置进行连线画图)
1. sift.detectAndComputer(gray, None) # 计算出图像的关键点和sift特征向量参数说明:gray表示输入的图片 2.cv2.findHomography(kp ...

随机推荐

修改String中的内容
例子:有一个字符串"abcdef",现在想让字符串中的字符各自加1,求修改后的字符 String 在Java中是不可修改的. 方法1:将String 变为字符数组,通过修改字符数组 ...
Dubbo(2)发布Dubbo服务
主要参考Dubbo源码包里面的dubbo-demo源码: 1.项目结构: 2.pom.xml中的依赖: <project xmlns="http://maven.apache.org/ ...
（转载）通向架构师的道路（第四天）之Tomcat性能调优-让小猫飞奔
转载自:https://blog.csdn.net/lifetragedy/article/details/7708724 参考文章:tomcat以及常用web容器线程池的实现原理https://bl ...
webpack + vuejs（都是1.0的版本）基本配置（一）
开始之前本文包含以下技术,文中尽量给与详细的描述,并且附上参考链接,读者可以深入学习: 1.webpack12.Vue.js13.npm4.nodejs —- 这个就不给连接了,因为上面的连接都是在 ...
UE4 材质Lerp节点解疑
转自:http://www.manew.com/thread-46268-1-1.html 1.A是一个灰色,B是一个红色,Alpha是一个颜色图 A到B是0到1,也就是黑到白,所以,alpha图,黑 ...
迭代器&可迭代对象
迭代器能够被next调用, 并不断返回值的一个对象惰性排序, 一次只获取一个数据, (占用一个空间)迭代器可以遍历无限量的数据特点: 1.惰性序列, 节省内存 2.遍历使用next, 方向不可逆 ...
saliency map [转]
基于Keras实现的代码文档 (图+说明) "Deep Inside Convolutional Networks: Visualising Image Classification Mod ...
Apache CLI Demo
1. Options private Options options = new Options(); 2. option (1) way1 launcher.options.addOption(&q ...
mysql短日期长时间转换为短日期
fabutime 2018-09-26 15:27:03 date_format( fabutime,\'%Y-%m-%d\') as fabutime fabutime 2018-09-2 ...
干货 | 100+个NLP数据集大放送，再不愁数据！
奉上100多个按字母顺序排列的开源自然语言处理文本数据集列表(原始未结构化的文本数据),快去按图索骥下载数据自己研究吧! 数据集 Apache软件基金会公开邮件档案:截止到2011年7月11日全部公开 ...

随机推荐

热门专题