Python图文识别技术【入门必学】

Python图文识别技术分享

使用 tesseract-ORC 识别文字，识别率不算太高，需要自我训练 tessdata 数据，才能更精确的识别你想要让电脑认识出来的文字！
ps：另外很多人在学习Python的过程中，往往因为遇问题解决不了从而导致自己放弃，为此我建了个Python全栈开发交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,不懂的问题有老司机解决哦，一起相互监督共同进步

接下来看代码：

import os

import pytesseract

from PIL import Image

from collections import defaultdict

#pip install pytesseract

#pip install pillow

# tesseract.exe所在的文件路径

pytesseract.pytesseract.tesseract_cmd = 'C://Program Files (x86)/Tesseract-OCR/tesseract.exe'

# 获取图片中像素点数量最多的像素

def get_threshold(image):

    pixel_dict = defaultdict(int)

    # 像素及该像素出现次数的字典

    rows, cols = image.size

    for i in range(rows):

        for j in range(cols):

            pixel = image.getpixel((i, j))

            pixel_dict[pixel] += 1

    count_max = max(pixel_dict.values())  # 获取像素出现出多的次数

    pixel_dict_reverse = {v: k for k, v in pixel_dict.items()}

    threshold = pixel_dict_reverse[count_max]  # 获取出现次数最多的像素点

    return threshold

# 按照阈值进行二值化处理

# threshold: 像素阈值

def get_bin_table(threshold):

    # 获取灰度转二值的映射table

    table = []

    for i in range(256):

        rate = 0.1  # 在threshold的适当范围内进行处理

        if threshold * (1 - rate) <= i <= threshold * (1 + rate):

            table.append(1)

        else:

            table.append(0)

    return table

# 去掉二值化处理后的图片中的噪声点

def cut_noise(image):

    rows, cols = image.size  # 图片的宽度和高度

    change_pos = []  # 记录噪声点位置

    # 遍历图片中的每个点，除掉边缘

    for i in range(1, rows - 1):

        for j in range(1, cols - 1):

            # pixel_set用来记录该店附近的黑色像素的数量

            pixel_set = []

            # 取该点的邻域为以该点为中心的九宫格

            for m in range(i - 1, i + 2):

                for n in range(j - 1, j + 2):

                    if image.getpixel((m, n)) != 1:  # 1为白色,0位黑色

                        pixel_set.append(image.getpixel((m, n)))

            # 如果该位置的九宫内的黑色数量小于等于4，则判断为噪声

            if len(pixel_set) <= 4:

                change_pos.append((i, j))

    # 对相应位置进行像素修改，将噪声处的像素置为1（白色）

    for pos in change_pos:

        image.putpixel(pos, 1)

    return image  # 返回修改后的图片

# 识别图片中的数字加字母

# 传入参数为图片路径，返回结果为：识别结果

def OCR_lmj(img_path):

    image = Image.open(img_path)  # 打开图片文件

    imgry = image.convert('L')  # 转化为灰度图

    # 获取图片中的出现次数最多的像素，即为该图片的背景

    max_pixel = get_threshold(imgry)

    # 将图片进行二值化处理

    table = get_bin_table(threshold=max_pixel)

    out = imgry.point(table, '1')

    # 去掉图片中的噪声（孤立点）

    out = cut_noise(out)

    # 保存图片

    # out.save('E://figures/img_gray.jpg')

    # 仅识别图片中的数字

    # text = pytesseract.image_to_string(out, config='digits')

    # 识别图片中的数字和字母

    text = pytesseract.image_to_string(out)

    # 去掉识别结果中的特殊字符

    exclude_char_list = ' .:\\|\'\"?![],()~@#$%^&*_+-={};<>/¥'

    text = ''.join([x for x in text if x not in exclude_char_list])

    # print(text)

    return text

def main():

    # 识别指定文件目录下的图片

    # 图片存放目录figures

    dir = 'D:\\ProjectSVN\\ChuanShengGuoJi\\trunk\CSGJ\\image2'

    # 遍历figures下的png,jpg文件

    for file in os.listdir(dir):

        if file.endswith('.png') or file.endswith('.jpg'):

            image_path = '%s/%s' % (dir, file)  # 图片路径

            answer = file.split('.')[0]  # 图片名称，即图片中的正确文字

            recognizition = OCR_lmj(image_path)  # 图片识别的文字结果

            print((answer, recognizition))

main()

以上就是分享的代码，都明白了没？另外很多人在学习Python的过程中，往往因为遇问题解决不了从而导致自己放弃，为此我建了个Python全栈开发交流.裙：一久武其而而流一思（数字的谐音）转换下可以找到了，里面有最新Python教程项目可拿,不懂的问题有老司机解决哦，一起相互监督共同进步

本文的文字及图片来源于网络加上自己的想法,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

Python图文识别技术【入门必学】的更多相关文章

Python 入门必学经典知识点笔记【肯定有你不知道的】
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:实验楼 Python 作为近几年越来越流行的语言,吸引了大量的学员开始学 ...
[新手必备]Python 基础入门必学知识点笔记
Python 作为近几年越来越流行的语言,吸引了大量的学员开始学习,为了方便新手小白在学习过程中,更加快捷方便的查漏补缺.根据网上各种乱七八糟的资料以及实验楼的 Python 基础内容整理了一份极度适 ...
使用Code First建模自引用关系笔记 asp.net core上使用redis探索(1) asp.net mvc控制器激活全分析语言入门必学的基础知识你还记得么？反射
使用Code First建模自引用关系笔记原文链接一.Has方法: A.HasRequired(a => a.B); HasOptional:前者包含后者一个实例或者为null HasR ...
Python入门必学：数据类型和变量的用法
什么是数据类型?计算机顾名思义就是可以做数学计算的机器,因此,计算机程序理所当然地可以处理各种数值.但是,计算机能处理的远不止数值,还可以处理文本.图形.音频.视频.网页等各种各样的数据,不同的数据, ...
Python入门必学：字符串和编码正确的使用方法
字符编码,我们已经讲过了,字符串也是一种数据类型,但是,字符串比较特殊的是还有一个编码问题. 因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理.最早的计算机在设计时采用8个比特 ...
Python入门必学：递归函数正确的操作使用方法，案例详解
递归函数,在函数内部,可以调用其他函数.如果一个函数在内部调用自身本身,这个函数就是递归函数. 举个例子,我们来计算阶乘n! = 1 x 2 x 3 x ... x n,用函数fact(n)表示,可以 ...
Python入门必学，用Python练习画个美队盾牌
0 环境 Python版本:3.6.6 操作系统:Mac OS Mojave 10.14.2 1 引言最近我媳妇每天晚上吃饭时候也拿手机看,上厕所也在看. 看着看着还会笑?WTF?你在干嘛呢? 没错 ...
Python之Flask项目开发【入门必学】
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理.作者:藤藤菜丶 Flask 安装Flask模块创建一个Flask项目运行 ...
Python之数据分析工具包介绍以及安装【入门必学】
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 首先我们来看 Mac版按照需求大家依次安装,如果你还没学到数据分析,建议你 ...

随机推荐

第一个vi
选择——VI 在前面板选择波形图表在程序框图中选择while循环,框住波形图在编程-数值中选择随机数,连接随机数与波形图在编程-定时子选项卡中选择--等待下一个整数倍,在数值中选择常量选项,数值 ...
springboot jar文件打zip包运行linux环境中
1.添加打包配置文件 1.1 assembly.xml <assembly xmlns="http://maven.apache.org/plugins/maven-assembly ...
python+matplotlib制作雷达图3例分析和pandas读取csv操作
1.例一图1 代码1 #第1步:导出模块 import numpy as np import matplotlib.pyplot as plt from matplotlib import font ...
go基础_函数
函数的基本写法 func add(a int, b int) int { return a + b } 如果2个参数的类型一样,可以简写为 func add(a, b int) int { retur ...
mtrace 简介
内存泄露问题一般会再长时间运行的程序中暴露出来.而且一般很难定位和查找. linux 提供mtrace/muntrace来检测程序是否有内存泄露.一般来说要检测哪一段代码是否有内存泄露,就可以用这一对 ...
【Python】猜数小游戏
有点沙雕 temp=input("猜猜我心里想的是哪个数字?") guess=int (temp) if guess==8: print("你是我肚里的蛔虫么?" ...
公告 & 留言板 & 随想录
欢迎dalao在评论区留言 \(Q \omega Q\) 公告部分: 博客文章的更新一般被放在周末当然还是可能会咕自从改了博客的主题之后,文章中的引用好像都会显示出一堆乱码. 由于之前写过的博文不 ...
Python - 字符串为多行时，转换为列表
例如一个IP代理池,这是个字符串,有多行 120.236.137.65:8060 193.112.208.216:8118 121.8.98.198:80 121.8.98.197:80 121.8. ...
restful api的那些事
1.restful api 简介传统api: 2.http状态码 3.数据结构格式 4.不可预知的api错误解决方案: 如使用框架,可写个类,重构错误提示.如TP框架可继承Handle并重载rend ...
如何在JDBC Connection Configuration配置组件上添加控件
如何在JDBC Connection Configuration配置组件上添加控件最近项目刚上线,闲来无事又把Jmeter的源码拿出来研究研究,最初的目的是想扒一扒Jmeter里数据库处理的逻辑是怎 ...

Python图文识别技术【入门必学】

Python图文识别技术【入门必学】的更多相关文章

随机推荐

热门专题