pytesseract 识别率低提升方法

一.跟换识别语言包

下载地址https://github.com/tesseract-ocr/tessdata

二.修改图片的灰度

from PIL import Image

from PIL import ImageEnhance

import pytesseract

img = Image.open('sanyecao.jpg')

img = img.convert('RGB')  #这里也可以尝试使用L

enhancer = ImageEnhance.Color(img)

enhancer = enhancer.enhance(0)

enhancer = ImageEnhance.Brightness(enhancer)

enhancer = enhancer.enhance(2)

enhancer = ImageEnhance.Contrast(enhancer)

enhancer = enhancer.enhance(8)

enhancer = ImageEnhance.Sharpness(enhancer)

img = enhancer.enhance(20)

text=pytesseract.image_to_string(img)

三.结合cv2,np对于图片处理后在进行读取

这个情况有很多种,也不说了,可以自己去尝试,简单写个调整图片亮度

#调整亮度

filename = "sanyecao.jpg"

img = cv2.imread(filename, 0)

print(np.shape(img))

kernel = np.ones((1,1), np.uint8)

dilate = cv2.dilate(img, kernel, iterations=1)

cv2.imwrite('new_dilate.jpg', dilate)

#还有些常用的方法

cv2.Canny

cv2.erode

cv2.rectangle

original_img = cv2.imread("qingwen.png", 0)

# canny(): 边缘检测

img1 = cv2.GaussianBlur(original_img,(3,3),0)

canny = cv2.Canny(img1, 50, 150)

# 形态学：边缘检测

_,Thr_img = cv2.threshold(original_img,210,255,cv2.THRESH_BINARY)#设定红色通道阈值210（阈值影响梯度运算效果）

kernel = cv2.getStructuringElement(cv2.MORPH_RECT,(5,5))         #定义矩形结构元素

gradient = cv2.morphologyEx(Thr_img, cv2.MORPH_GRADIENT, kernel) #梯度

cv2.imshow("original_img", original_img)

cv2.imshow("gradient", gradient)

cv2.imshow('Canny', canny)

pytesseract 识别率低提升方法的更多相关文章

Python3.x：pytesseract识别率提高（样本训练）
Python3.x:pytesseract识别率提高(样本训练) 1,下载并安装3.05版本的tesseract 地址:https://sourceforge.net/projects/tessera ...
tesseract-ocr 提高验证码识别率手段之---识别码库训练方法
本文是对tesseract-ocr 使用的进一步技术升级说明,使用默认的识别库识别率比较低怎么办? 不用着急,tesseract-ocr本身的工具中提供了使用你提供的素材进行人工修正以提高识别率的方法 ...
Android Zxing 转换竖屏扫描且提高识别率
最近的一个Android需要用到扫码功能,用的是Zxing开源库.Zxing的集成就不说了,但是Zxing默认的是横屏扫码,在实际生产中并不适用,需要改为竖屏扫描. 转竖屏步骤: 1>. And ...
深入学习使用ocr算法识别图片中文字的方法
公司有个需求,简单点说需要从一张图片中识别出中文,通过python来实现,当然其他程序也行,只要能实现,而小编主要学习python,所以就提了python.一个小白在网上遨游了一天,终于找到一丝丝思绪 ...
Python的开源人脸识别库：离线识别率高达99.38%
Python的开源人脸识别库:离线识别率高达99.38% github源码:https://github.com/ageitgey/face_recognition#face-recognitio ...
Python的开源人脸识别库：离线识别率高达99.38%（附源码）
Python的开源人脸识别库:离线识别率高达99.38%(附源码) 转https://cloud.tencent.com/developer/article/1359073 11.11 智慧上云 ...
微软亚洲实验室一篇超过人类识别率的论文：Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification ImageNet Classification
在该文章的两大创新点:一个是PReLU,一个是权值初始化的方法.下面我们分别一一来看. PReLU(paramter ReLU) 所谓的PRelu,即在 ReLU激活函数的基础上加入了一个参数,看一个 ...
组合方法(ensemble method) 与adaboost提升方法
组合方法: 我们分类中用到非常多经典分类算法如:SVM.logistic 等,我们非常自然的想到一个方法.我们是否可以整合多个算法优势到解决某一个特定分类问题中去,答案是肯定的! 通过聚合多个分类器的 ...
android实现图片识别的几种方法
实现android图像识别的几种方法点击这里下载第一种代码最近完成了毕业设计,论文名为基于图像识别的移动人口管理系统.编写过程中学到了几种图像识别的技术,先写下来与大家分享. 第一种,直接使用免费 ...

随机推荐

「快学SpringBoot」配置文件的加载顺序和配置项默认值设置
前言有的时候,配置信息是我们无法在开发过程中就能确定的.比如,给客户开发的项目,客户需要根据自身的情况自定义配置,如数据库配置,加密密钥配置等等.这时候,就需要把配置文件放在外面,让用户自定义配置部 ...
windows下创建/删除服务
windows下创建/删除服务 1. windows下创建/删除服务 1.1. 创建服务命令格式: sc [servername] create Servicename [Optio ...
#5649，list&parallel
// チケット5649 START // 画面項目.アカウント種別が0.1以外の場合のみ if(!CommonConstants.ACCOUNT_TYPE_SYSTEM_NEXT.equals(for ...
十四 OGNL的概述
1 什么是OGNL? 对象图导航语言(对象图,以任意一个对象为根,通过OGNL;可以访问与这个对象关联的其他对象).比EL表达式强大很多倍. 可以存取对象的任意属性.调用对象的方法,遍历整个对象的结构 ...
Python学习笔记009
不换行 print("Hello,world!",end='')print("Hello,world!",end='')print("Hello,wo ...
c++拷贝构造函数（翁恺c++公开课[26-27]学习笔记）
这节课在p26.拷贝构造中讲的很清楚,建议大家耐心的去看下. 什么时候会发生拷贝构造: 对象之间的初始化赋值使用对象作为变量进行函数传参(通常使用引用来传参从而减去不必要的拷贝构造,提高效率和代码健 ...
AWS-DDNS
1. DDNS 2. 在 Linux 实例上设置动态 DNS 2.1 Ubuntu 2.2 Amazon Linux 2 2.3 Arch Linux 2.4 其他Linux系统 3. 更多相关 1. ...
Python使用正则表达式（Regular Expression）超详细
一.导入re库 python使用正则表达式要导入re库. import re在re库中.正则表达式通常被用来检索查找.替换那些符合某个模式(规则)的文本.ps:另外很多人在学习Python的过程中,往 ...
Java日志介绍(2)-Log4j
Log4j是Apache的一个开源项目,官网地址为http://logging.apache.org/log4j/1.2/index.html.通过使用Log4j,可控制日志信息输出到控制台.文件.数 ...
HTTP关键词收集
[HTTP协议][客户端][服务器端][HTTPS][Web服务器][域名][DNS][IP地址][虚拟服务器][虚拟主机][中转服务器][HTTP/1.1规范][域名解析][Web托管服务][代理] ...

pytesseract 识别率低提升方法

pytesseract 识别率低提升方法

一.跟换识别语言包

二.修改图片的灰度

三.结合cv2,np对于图片处理后在进行读取

pytesseract 识别率低提升方法的更多相关文章

随机推荐

热门专题