使用 Python 识别并提取图像中的文字

1. 介绍

介绍使用 python 进行图像的文字识别，将图像中的文字提取出来，可以帮助我们完成很多有趣的事情。

2. 必备工具

tesseract-ocr

下载地址： https://github.com/UB-Mannheim/tesseract/wiki

tesseract-ocr 是一个开源的图片OCR识别库，功能及其强大，支持多国语言。

更高级的用法，它还支持机器学习算法，通过训练的方式，使OCR识别更加智能化及准确。

python 库

使用安装 pytesseract 和 pillow 库：

pip install pytesseract

pip install pillow

3. 开发使用

使用 python 配合 tesseract 识别文字中的图像可以非常简单，几行代码就可以搞定。

例如，识别下面这张图片：

首先导入 pytesseract 和 pillow 库

import pytesseract

from PIL import Image

然后指定 tesseract 目录：

pytesseract.pytesseract.tesseract_cmd = 'f:/tessert/tesseract.exe'

然后使用 pillow 库加载图片：

img = Image.open('test.png')

最后使用 tesseract 识别图像的文字:

text = pytesseract.image_to_string(img, lang='chi_sim')

print(text)

最后的结果是：

可以看到，有偏差，但是基本上都识别出来了。

4. 总结

这里只是入门级的介绍，当然还有问题，比如彩色图像识别一般效果不好，对比度低的图像识别也不一定好，这就需要我们对图片进行处理后再来识别。比如提取灰度图片，锐化图片等操作，具体涉及到的是数字图像处理的领域了，这个后面有机会再讨论。

使用 Python 识别并提取图像中的文字的更多相关文章

Zybo智能小车识别图像中的文字
智能小车识别图像中的文字 [TOC] 运行平台这次的内容是基于Xilinx公司的Zybo开发板以及其配套的Zrobot套件开发 Zybo上面的sd卡搭载了Ubuntu12.04LTS的linux版本 ...
利用百度文字识别API识别图像中的文字
本文将会介绍如何使用百度AI开放平台中的文字识别服务来识别图片中的文字.百度AI开放平台的访问网址为:http://ai.baidu.com/ ,为了能够使用该平台提供的AI服务,你需要事先注册一 ...
python笔记之提取网页中的超链接
python笔记之提取网页中的超链接对于提取网页中的超链接,先把网页内容读取出来,然后用beautifulsoup来解析是比较方便的.但是我发现一个问题,如果直接提取a标签的href,就会包含jav ...
MATLAB·提取图像中多个目标
基于matlab工具箱提取图像中的多目标特征(代码如下): 代码前面部分为提取图像的边界信息,调用了后面的遍历函数Pixel_Search,函数实现方法见后~ %%ROI Testing close ...
（转）使用Python和OpenCV检测图像中的物体并将物体裁剪下来
原文链接:https://blog.csdn.net/liqiancao/article/details/55670749 介绍硕士阶段的毕设是关于昆虫图像分类的,代码写到一半,上周五导师又给我新的 ...
Python之通配符--提取文件中的内容并输出
前言:我的学习进度其实没有那么快的,因为现在是网络工程师实习,只有晚上一点时间和周末有空,所以周一到周天的学习进度很慢,今天之所以突然跳到通配符是因为工作需要,大体讲一下我的工作需求:网络工程师就是写 ...
python利用正则表达式提取文本中特定内容
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...
CNN如何识别一幅图像中的物体
让我们对卷积神经网络如何工作形成更好直观感受.我们先看下人怎样识别图片,然后再看 CNNs 如何用一个近似的方法来识别图片. 比如说,我们想把下面这张图片识别为金毛巡回犬. 一个需要被识别为金毛巡 ...
python学习笔记——提取网页中的信息正则表达式re
被用来检索\替换那些符合某个模式(规则)的文本,对于文本过滤或规则匹配,最强大的就是正则表达式,是python爬虫里必不可少的神兵利器. 1 正则表达式re基本规则 [0-9] 任意一个数字,等价\d ...

随机推荐

docker入门3:基础操作(2)
-- 容器删除 docker rm CONTAIN_ID|CONTAIN_NAME -- 镜像删除 docker rmi IMAGE_ID|IMAGE_NAME -- 进入容器 docker exec ...
ubuntu grub 操作
系统开机时,按住 shift 进入 grub 1. 什么是 Grub GNU GRUB(GRand Unified Bootloader 简称"GRUB")是一个来自GNU项目的多 ...
C++中的类与对象模型
一,C/C++内存模型 1.内存模型分类栈区:由编译器自动分配和释放,用来存放函数的参数,局部变量.存放在栈中的数据只在当前函数及下一层函数中有效,函数一旦结束,这些数据就被释放了. 堆区:由程序员 ...
Visual Studio Code同时debug多种代码的方式
今天看了一下,猜应该是configurations里面多写一个就行,试了下,真的可以同时debug Python和Go代码. 可以打断点.单步执行Python和Go代码. launch.json 如下 ...
SpringBoot、Groovy
Java——搭建自己的RESTful API服务器(SpringBoot.Groovy) 这又是一篇JavaWeb相关的博客,内容涉及: SpringBoot:微框架,提供快速构建服务的功能 Sp ...
Windows Presentation Foundation(WPF)中的数据绑定（使用XmlDataProvider作控件绑定）
原文:Windows Presentation Foundation(WPF)中的数据绑定(使用XmlDataProvider作控件绑定) ------------------------------ ...
WPF Clip实现百叶窗
原文:WPF Clip实现百叶窗效果图; 后台代码: public MainWindow() { InitializeComponent(); ...
通过浏览器调用Android要么iOS应用
在做移动应用的单点登录时间,需要点击浏览器中启动链接APP和参数传递APP其中,用于处理相应的接口,现在,通过浏览器调用Android和iOS在应用过程中实现理清固化博客.为了查询. 一:通过浏览器调 ...
SQL查询表结构相关语句
--查看列注释select * from all_col_comments where table_name=upper('XXXXX')--查看表结构select * from user_tab_c ...
get与post一些特殊情况下
p=574"> 文章已经迁移至http://androiddevelop.cn/?p=574 版权声明:本文博客原创文章.博客,未经同意,不得转载.