如何用python运用ocr技术来识别文字

要先安装ocr技术，也就是光学符号识别，通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其他印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的文本的技术（我在百度百科抄的），市面上大多数的文本识别，都基本是ocr技术。那用python怎么搞呢？

1、安装环境

我们要先安装Tesseract，大家可以参考https://cuiqingcai.com/31102.html（不要安装tesserocr，有坑），大家可以按照这上面的步骤一步步安装，就是像我一样使用ubuntu的人，用git命令下载tessdata时要先下载git，然后github下载极慢，经常动不动下一半报错失败，你先输入sudo vi /etc/hosts，抄https://www.cnblogs.com/blog-dyn/p/16071670.html里面的ip进去，之后按下esc，输入:wq(这里面的vi可以是vim，建议大家学习一下vim,效率很高)，在之后刷新DNS，输入sudo systemctl restart systemd-resolved，下载应该会快一点（总之我的电脑有用），然后pip安装：

pip3 install pytesseract

还要安装Pillow库，来做图像处理：

pip3 install Pillow

如果安装过慢，可以换源，可参考https://www.cnblogs.com/HeavyShield/p/12294179.html

2、正片

如下面的程序

 1 #导入

 2 import pytesseract#ocr库

 3 from PIL import Image#PIL库

 4

 5 #导入图片

 6 add_image = input("图片地址......")

 7 try:#异常处理

 8     image = Image.open(add_image)

 9 except FileNotFoundError:

10     print("no such file or dictionary!")

11 else:

12     result = pytesseract.image_to_string(image, lang="chi_sim+eng")#ocr识别

13     with open("test.txt","w") as fp:

14         fp.write(result)#存入txt

导入库应该没什么问题， image = Image.open(add_image) 来新建一个目标图片的Image对象，然后神之一笔来啦， result = pytesseract.image_to_string(image, lang="chi_sim+eng") 中image_to_string将图片中的文字转为文本，括号中第一项为目标图片的Image对象，lang设置识别的语言，这里"chi_sim+eng"为简体中文和英语。最后的结果存入result，没啦！区区几行代码，我们便识别出图像中的文字并存储到文件中

3、可以干什么

对于爬虫来说，登录的验证码需要填写才能进入网站，有一些网站还使用像

的验证码，你可以通过requests来爬取图片，然后人工填写验证码上传，如果使用ocr技术，可以大大提高爬取的效率，不必每一个验证码亲历亲为。此外还可以得到像

这样的代码，不必一个字一个字地去敲（大家可以以这两个思路来做一下作业）

如何用python运用ocr技术来识别文字的更多相关文章

ABBYY OCR技术教电脑阅读缅甸语（下）
文本行检测到之后,我们开始寻找单词和字母之间的间隙,这一次,我们运用了水平直方图,将大的间隙假设为单词之间的空隙,小的间隙理解为字母之间的空隙,检测缅甸文本中的空隙几乎没有出现问题,不像泰语,几乎没有 ...
Python爬虫入门教程 56-100 python爬虫高级技术之验证码篇2-开放平台OCR技术
今日的验证码之旅今天你要学习的验证码采用通过第三方AI平台开放的OCR接口实现,OCR文字识别技术目前已经比较成熟了,而且第三方比较多,今天采用的是百度的. 注册百度AI平台官方网址:http:/ ...
使用Python进行OCR -- 识别图片中的文字
工具 Tesseract pytesseract tesserocr 朋友需要一个工具,将图片中的文字提取出来.我帮他在网上找了一些OCR的应用,都不好用.所以准备自己研究,写一个Web APP供他使 ...
【OCR技术系列之八】端到端不定长文本识别CRNN代码实现
CRNN是OCR领域非常经典且被广泛使用的识别算法,其理论基础可以参考我上一篇文章,本文将着重讲解CRNN代码实现过程以及识别效果. 数据处理利用图像处理技术我们手工大批量生成文字图像,一共360万 ...
你知道现在有一种新的OCR技术叫“移动端车牌识别”吗？
核心内容:车牌识别.OCR识别技术.移动端车牌识别.手机端车牌识别.安卓车牌识别.Android车牌识别.iOS车牌识别一.移动端车牌识别OCR技术研发原理移动端车牌识别是基于OCR识别的一种应用 ...
【OCR技术系列之四】基于深度学习的文字识别（3755个汉字）
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...
关于python 使用腾讯云OCR 通用印刷体识别
腾讯的python SDK没有通用印刷体识别,所以参考了别人识别网上图片的方式:https://www.cnblogs.com/semishigure/p/7690789.html 但是咱们使用的基本 ...
【OCR技术系列之七】端到端不定长文字识别CRNN算法详解
在以前的OCR任务中,识别过程分为两步:单字切割和分类任务.我们一般都会讲一连串文字的文本文件先利用投影法切割出单个字体,在送入CNN里进行文字分类.但是此法已经有点过时了,现在更流行的是基于深度学习 ...
【OCR技术系列之四】基于深度学习的文字识别
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...
【OCR技术系列之一】字符识别技术总览
最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解.所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解. 什么是OCR? OC ...

随机推荐

KingbaseES V8R6集群运维案例之---securecmd连接需要密码问题
KingbaseES V8R6集群运维案例之---securecmd连接需要密码问题案例说明: 在KingbaseES V8R6集群可以使用securecmdd代替sshd实现集群主机节点间的通讯, ...
Java生成Json字符串
public class Test01 { public static void main(String[] args) { // StringBuilder responseMsg = new St ...
Scala编译原理
1 package com.atguigu.chapter01; 2 /** 3 * 4 */ 5 //main 方法名 6 //小括号表示参数列表 7 // 参数声明方式: java -> 类 ...
Java也可以像python般range出连续集合
Java lamada:IntStream --range(int startInclusive, int endExclusive):前包后不包 IntStream.range(0, 10).for ...
el-table设置列属性fixed导致滚动条无法拖动-骨灰级
一.前言说明网上一搜索,千篇一律的设置el-table__fixed,如: .el-table__fixed { // 左固定列 height: auto !important; bottom: 1 ...
C++ 开发者必读经典书籍推荐
如果你正在学习C++,那么一本好的教材或参考书可以事半功倍.以下是几本我个人推荐的C++书籍或视频 C++基础看书 C++ Primer C++程序设计语言 Effective C++ More E ...
C# Dev GridControl小结
1. 如何解决单击记录整行选中的问题 View->OptionsBehavior->EditorShowMode 设置为:Click 2. 如何新增一条记录 (1).gridView.Ad ...
Linux程序崩溃自启动方法
linux进程挂掉后,可以通过配置 systemd 来自动启动服务 1.创建 systemd 服务文件,例如:huyang.service,需要放置在系统文件夹 /etc/systemd/system ...
c++ 暂停2秒，等待2秒
std::chrono::milliseconds stopTime(2000); std::this_thread::sleep_for(stopTime);
pyqt5报错：qt.qpa.plugin: Could not find the Qt platform plugin "windows" in "" This ap
环境: win10 Python 3.7.5 vs code 解决方法: 新建环境变量,然后重启 vs code 就可以了 QT_QPA_PLATFORM_PLUGIN_PATH C:\Users\ ...

如何用python运用ocr技术来识别文字

如何用python运用ocr技术来识别文字的更多相关文章

随机推荐

热门专题