OpenCV笔记（5）(定位票据并规范化、调库扫描文本)

一、定位和变换票据

定位照片中的不规范票据或矩形文本，并将其变换为正规矩形，以供OCR识别。

# -*- coding:utf-8 -*-

__author__ = 'Leo.Z'

import cv2 as cv

import numpy as np

def show_img(img, win_name):

    cv.imshow(win_name, img)

    cv.waitKey(0)

    cv.destroyAllWindows()

def image_process(img_path):

    # 读入图像

    img = cv.imread(img_path)

    show_img(img, 'img')

    # 转换为灰度图

    gray = cv.cvtColor(img, cv.COLOR_RGB2GRAY)

    # 高斯模糊，消除一些噪声

    gray = cv.GaussianBlur(gray, (5, 5), 0)

    show_img(gray, 'gray')

    # 寻找边缘

    edged = cv.Canny(gray, 50, 120)

    show_img(edged, 'edged')

    # 形态学变换，由于光照影响，有很多小的边缘需要进行腐蚀和膨胀处理

    kernel = np.ones((5, 5), np.uint8)

    morphed = cv.dilate(edged, kernel, iterations=3)

    morphed = cv.erode(morphed, kernel, iterations=3)

    show_img(morphed, 'morphed')

    # 找轮廓

    morphed_copy = morphed.copy()

    cnts, _ = cv.findContours(morphed_copy, cv.RETR_TREE, cv.CHAIN_APPROX_NONE)

    # 排序，并获取其中最大的轮廓

    if len(cnts) is not 0:

        cnts = sorted(cnts, key=cv.contourArea, reverse=True)[:1]

    else:

        print("Did not find contours\n")

        return

    # 用周长的0.1倍作为阈值，对轮廓做近似处理，使其变成一个矩形

    epsilon = 0.1 * cv.arcLength(cnts[0], True)

    approx = cv.approxPolyDP(cnts[0], epsilon, True)

    # 在原图的拷贝上画出轮廓

    ticket_copy = img.copy()

    cv.drawContours(ticket_copy, [approx], -1, (255, 0, 0), 2)

    show_img(ticket_copy, 'ticket_copy')

    # 获取透视变换的原坐标

    if approx.shape[0] is not 4:

        print("Found a non-rect\n")

        return

    src_coor = np.reshape(approx, (4, 2))

    src_coor = np.float32(src_coor)

    # 右上,左上,左下,右下 坐标

    (tr, tl, bl, br) = src_coor

    # 计算宽

    w1 = np.sqrt((tr[0] - tl[0]) ** 2 + (tr[1] - tl[1]) ** 2)

    w2 = np.sqrt((br[0] - bl[0]) ** 2 + (br[1] - bl[1]) ** 2)

    # 求出比较大的w

    max_w = max(int(w1), int(w2))

    # 计算高

    h1 = np.sqrt((bl[0] - tl[0]) ** 2 + (bl[1] - tl[1]) ** 2)

    h2 = np.sqrt((br[0] - tr[0]) ** 2 + (br[1] - tr[1]) ** 2)

    # 求出比较大的h

    max_h = max(int(h1), int(h2))

    # 透视变换的目标坐标

    dst_coor = np.array([[max_w - 1, 0], [0, 0], [0, max_h - 1], [max_w - 1, max_h - 1]], dtype=np.float32)

    # 求转换矩阵

    trans_mat = cv.getPerspectiveTransform(src_coor, dst_coor)

    # 进行转换，将图中对应坐标的图片截取出来，并转换到dst_coor大小

    warped = cv.warpPerspective(img, trans_mat, (max_w, max_h))

    return warped

if __name__ == '__main__':

    wrap = image_process('zhengshu.png')

    show_img(wrap, 'result')

效果如下：

注意：本例是一个相对简单的示例，对于背景复杂，或票据与背景灰度相近时，可能效果不好。本例只作为前面学习内容的一个综合案例。如果要用到实际环境中需要结合更多技术，使其具有更好的鲁棒性。

二、使用OCR库实现文本扫描

我们使用一个名叫Tesseract的OCR库来实现图片上的文本扫描。

1.下载一个版本的Tesseract ：https://digi.bib.uni-mannheim.de/tesseract/

2.安装并将安装目录加到环境变量path中，假设为

D:/Dev_apps/Tesseract-OCR/tesseract.exe

3.在pycharm中安装pytesseract，并修改D:\......\Lib\site-packages\pytesseract\pytesseract.py中的

tesseract_cmd = 'D:/Dev_apps/Tesseract-OCR/tesseract.exe'

在python中使用该库：（可以将已经预处理完毕的图像，例如小票发票等使用该OCR库进行处理）

import pytesseract

img = cv.imread('piao6.png')

# 使用tesseract来处理图片，并获取文本

text = pytesseract.image_to_string(img)

print(text)

OpenCV笔记（5）(定位票据并规范化、调库扫描文本)的更多相关文章

opencv笔记6：角点检测
time:2015年10月09日星期五 23时11分58秒 # opencv笔记6:角点检测 update:从角点检测,学习图像的特征,这是后续图像跟踪.图像匹配的基础. 角点检测是什么鬼?前面一篇 ...
python+opencv实现车牌定位
写在前面 HIT大三上学期视听觉信号处理课程中视觉部分的实验三,经过和学长们实验的对比发现每一级实验要求都不一样,因此这里标明了是2019年秋季学期的视觉实验三. 由于时间紧张,代码没有进行任何优化, ...
OpenCV笔记大集锦（转载）
整理了我所了解的有关OpenCV的学习笔记.原理分析.使用例程等相关的博文.排序不分先后,随机整理的.如果有好的资源,也欢迎介绍和分享. 1:OpenCV学习笔记作者:CSDN数量:55篇博文网址: ...
opencv笔记5:频域和空域的一点理解
time:2015年10月06日星期二 12时14分51秒 # opencv笔记5:频域和空域的一点理解空间域和频率域傅立叶变换是f(t)乘以正弦项的展开,正弦项的频率由u(其实是miu)的值决 ...
opencv笔记4：模板运算和常见滤波操作
time:2015年10月04日星期日 00时00分27秒 # opencv笔记4:模板运算和常见滤波操作这一篇主要是学习模板运算,了解各种模板运算的运算过程和分类,理论方面主要参考<图像工 ...
opencv笔记3：trackbar简单使用
time:2015年 10月 03日星期六 13:54:17 CST # opencv笔记3:trackbar简单使用当需要测试某变量的一系列取值取值会产生什么结果时,适合用trackbar.看起 ...
opencv笔记2：图像ROI
time:2015年 10月 03日星期六 12:03:45 CST # opencv笔记2:图像ROI ROI ROI意思是Region Of Interests,感兴趣区域,是一个图中的一个子区 ...
opencv笔记1：opencv的基本模块，以及环境搭建
opencv笔记1:opencv的基本模块,以及环境搭建安装系统使用fedora22-workstation-x86_64 安装opencv sudo dnf install opencv-dev ...
Windows phone 8 学习笔记(8) 定位地图导航
原文:Windows phone 8 学习笔记(8) 定位地图导航 Windows phone 8 已经不使用自家的bing地图,新地图控件可以指定制图模式.视图等.bing地图的定位误差比较大,在模 ...

随机推荐

# 「NOIP2010」关押罪犯（二分图染色+二分答案）
「NOIP2010」关押罪犯(二分图染色+二分答案) 洛谷 P1525 描述:n个罪犯(1-N),两个罪犯之间的仇恨值为c,m对仇恨值,求怎么分配使得两件监狱的最大仇恨值最小. 思路:使最大xxx最小 ...
JavaEE--JavaWeb三大组件Servlet、Filter、Listener
Servlet.Filter.Listener是JavaEE Web服务规定的服务器动态组件,由开发者编写由Web容器创建,并保证单例以及线程安全性,其中加载顺序为Linstener -> Fl ...
JSP和JSTL视图解析器
使用JSTL users.jsp <%@ page language="java" contentType="text/html; charset=UTF-8&qu ...
[转载]ubuntu常用命令
1.帮助 --help简单的帮助 help command 较详细的帮助 man command 最详细的帮助2.ls 命令 ls -a 显示全部的文件及文件夹 ...
Maven将java打包成jar并且运行笔记
Maven项目打包成jar并且运行笔记首先创建一个maven项目运行成功后,有两种方式将项目进行打包. 第一种方式: 在IDEA编辑器中maven项目进行打包: 这里显示jar包中没有主清单属性, ...
关于获取jquery对象的长度
/* 17:10 2019/8/6 @author zhangxingshuo jQuery:"write less, do more" homepage: https://jqu ...
一个div多个图表共用一个图例
想实现一个图例(公司名),点击让div中三个图表进行显示相应的数据,并渲染到图表中(公司数据可能很多,让其默认显示三条数据),并且每个图表都有相应的标题和datazoom区域展示,点击下拉框会进行相应 ...
从命令行运行postman脚本
为什么要在命令行中运行可以在无UI界面的服务器上运行可以在持续集成系统上运行运行准备导出collection 安装nodejs和npm(或cnpm) 安装Newman 运行及生成测试报告支持4 ...
mock.js 模拟数据
1. 劫持请求,返回模拟数据: 用于前后台对接前数据模拟相比于静态json文件而言:代码完成后不必修改源文件对应的接口调用.可模拟增删改查 2.实例代码 <!doctype html> ...
v-bind:value="diy" 添加到 <input type="button" /> 中可以,添加到<button />中不可以,diy是data中的数据
v-bind:value="diy" 添加到 <input type="button" /> 中可以, 添加到<button />中不可 ...

OpenCV笔记（5）(定位票据并规范化、调库扫描文本)

一、定位和变换票据

二、使用OCR库实现文本扫描

OpenCV笔记（5）(定位票据并规范化、调库扫描文本)的更多相关文章

随机推荐

热门专题