python图像处理：pytesseract和PIL

大概介绍下相关模块的概念：

Python-tesseract 是光学字符识别Tesseract OCR引擎的Python封装类。能够读取任何常规的图片文件(JPG, GIF ,PNG , TIFF等)并解码成可读的语言。在OCR处理期间不会创建任何临文件

PIL （Python Imaging Library）是 Python 中最常用的图像处理库，目前版本为 1.1.7，我们可以在这里下载学习和查找资料。

Image 类是 PIL 库中一个非常重要的类，通过这个类来创建实例可以有直接载入图像文件，读取处理过的图像和通过抓取的方法得到的图像这三种方法。

python对图像的处理比较常见的是用pytesseract识别验证码，要安装pytesseract库，必须先安装其依赖的PIL及tesseract-ocr，其中PIL为图像处理库，而后面的tesseract-ocr则为google的ocr识别引擎。下载链接：http://www.waitalone.cn/python-php-ocr.html 该链接文档描述了如何配置相关环境，以及识别验证码的python代码，总结起来就三步：安装PIL.exe；安装tesseract-ocr-setup.exe;安装pip install pytesseract

1、识别图片简单的示例

 import Image

 import pytesseract

 image=Image.open("1.jpg")    #打开验证码图片

 image.load()        #加载一下图片，防止报错，此处可省略
6 image.show() 　　　　#调用show来展示图片，调试用，可省略

7 vcode=pytesseract.image_to_string(image)

8 print vcode

我按照该代码示例实际操作时报了2个错误：

1、The _imaging C module is not installed

是因为环境配置的问题，我的系统是win7 64bit，开始的时候只安装了PIL-1.1.7.win-amd64-py2.7.exe，把PIL-1.1.7.win32-py2.7.exe安装后，在python命令行输入：import _imaging，如果不报错则问题应该就解决了

2、在 win 7 下使用 PIL 中的 Image 模块的 show() 函数时，报如下错：

解决方法：将 PIL 安装目录下的 ImageShow.py 文件的第 99 行：（我的 python 安装在 C:\python 2.7， ImageShow.py 文件在：C:\Python27\Lib\site-packages\PIL\ImageShow.py）

return "start /wait %s && del /f %s" % (file, file)

替换为：

return "start /wait %s && PING 127.0.0.1 -n 5 > NUL && del /f %s" % (file, file)

2、实际情况中，电脑本地并没有验证码图片，都是从网页中的验证码图片链接抓取的，实际示例：

 import urllib2

 import pytesseract

 import Image

 import time

 fp=urllib2.urlopen('https://vcs.suning.com/vcs/imageCode.htm?uuid=1e68d06a-1134-410b-9606-f0eb4ae23bbe')　　#示例网址的验证码图片地址

 print fp

 name="D:\\curl\\1.jpg"

 f=open(name,'wb')

 f.write(fp.read())　　　　　　#读取验证码图片并保存为1.jpg

 time.sleep(2)

 f.close()

 fl=open(name,'rb')

 image=Image.open(fl)

 image.show()

 #image.load()

 vcode=pytesseract.image_to_string(image)

 print vcode

 fl.close()

以上本亲测可行，不过验证码识别率不是很高，简单的图片识别率还是可以的

附录：Image模块用法介绍【转】

1. 简介。

图像处理是一门应用非常广的技术，而拥有非常丰富第三方扩展库的 Python 当然不会错过这一门盛宴。PIL （Python Imaging Library）是 Python 中最常用的图像处理库，目前版本为 1.1.7，我们可以在这里下载学习和查找资料。

Image 类是 PIL 库中一个非常重要的类，通过这个类来创建实例可以有直接载入图像文件，读取处理过的图像和通过抓取的方法得到的图像这三种方法。

2. 使用。

导入 Image 模块。然后通过 Image 类中的 open 方法即可载入一个图像文件。如果载入文件失败，则会引起一个 IOError ；若无返回错误，则 open 函数返回一个 Image 对象。现在，我们可以通过一些对象属性来检查文件内容，即：

1 >>> import Image
2  >>> im = Image.open("j.jpg")
3  >>> print im.format, im.size, im.mode
4 JPEG (440, 330) RGB

这里有三个属性，我们逐一了解。

format : 识别图像的源格式，如果该文件不是从文件中读取的，则被置为 None 值。

size : 返回的一个元组，有两个元素，其值为象素意义上的宽和高。

mode : RGB（true color image），此外还有，L（luminance），CMTK（pre-press image）。

现在，我们可以使用一些在 Image 类中定义的方法来操作已读取的图像实例。比如，显示最新载入的图像：

1 >>>im.show()
2  >>>

输出原图：

3. 函数概貌。

3.1 Reading and Writing Images : open( infilename ) , save( outfilename )

3.2 Cutting and Pasting and Merging Images :

crop() : 从图像中提取出某个矩形大小的图像。它接收一个四元素的元组作为参数，各元素为（left, upper, right, lower），坐标系统的原点（0, 0）是左上角。

paste() :

merge() :

1 >>> box = (100, 100, 200, 200)
2  >>> region = im.crop(box)
3  >>> region.show()
4  >>> region = region.transpose(Image.ROTATE_180)
5  >>> region.show()
6  >>> im.paste(region, box)
7  >>> im.show()

其效果图为：

旋转一幅图片：

 1 def roll(image, delta):
 2     "Roll an image sideways"
 3 
 4     xsize, ysize = image.size
 5 
 6     delta = delta % xsize
 7     if delta == 0: return image
 8 
 9     part1 = image.crop((0, 0, delta, ysize))
10     part2 = image.crop((delta, 0, xsize, ysize))
11     image.paste(part2, (0, 0, xsize-delta, ysize))
12     image.paste(part1, (xsize-delta, 0, xsize, ysize))
13 
14     return image

3.3 几何变换。

3.3.1 简单的几何变换。

1 >>>out = im.resize((128, 128))                     #
2  >>>out = im.rotate(45)                             #逆时针旋转 45 度角。
3  >>>out = im.transpose(Image.FLIP_LEFT_RIGHT)       #左右对换。
4  >>>out = im.transpose(Image.FLIP_TOP_BOTTOM)       #上下对换。
5  >>>out = im.transpose(Image.ROTATE_90)             #旋转 90 度角。
6  >>>out = im.transpose(Image.ROTATE_180)            #旋转 180 度角。
7 >>>out = im.transpose(Image.ROTATE_270)            #旋转 270 度角。

各个调整之后的图像为：

图片1：

图片2：

图片3：

图片4：

3.3.2 色彩空间变换。

convert() : 该函数可以用来将图像转换为不同色彩模式。

3.3.3 图像增强。

Filters : 在 ImageFilter 模块中可以使用 filter 函数来使用模块中一系列预定义的增强滤镜。

1 >>> import ImageFilter
2 >>> imfilter = im.filter(ImageFilter.DETAIL)
3 >>> imfilter.show()

3.4 序列图像。

即我们常见到的动态图，最常见的后缀为 .gif ，另外还有 FLI / FLC 。PIL 库对这种动画格式图也提供了一些基本的支持。当我们打开这类图像文件时，PIL 自动载入图像的第一帧。我们可以使用 seek 和 tell 方法在各帧之间移动。

1 import Image
2 im.seek(1)        # skip to the second frame
3 
4 try:
5     while 1:
6         im.seek( im.tell() + 1)
7         # do something to im
8 except EOFError:
9     pass

3.5 更多关于图像文件的读取。

最基本的方式：im = Image.open("filename")

类文件读取：fp = open("filename", "rb"); im = Image.open(fp)

字符串数据读取：import StringIO; im = Image.open(StringIO.StringIO(buffer))

从归档文件读取：import TarIO; fp = TarIo.TarIO("Image.tar", "Image/test/lena.ppm"); im = Image.open(fp)

基本的 PIL 目前就练习到这里。其他函数的功能可点击这里进一步阅读。

扩展阅读：python如何下载网页图片

http://blog.csdn.net/wudishine/article/details/11528791

python图像处理：pytesseract和PIL的更多相关文章

Python图像处理库：PIL中Image,ImageDraw等基本模块介绍
Python图像处理库:PIL中Image,ImageDraw等基本模块介绍标签: 图像处理PILPYTHON 2016-08-19 10:58 461人阅读评论(0) 收藏举报分类: 其他 ...
Windows安装Python图像处理库：PIL模块
平常一般都在Linux下用Python,今天女票突然说让帮忙把一些图片全部弄成一个分辨率的,作为程序员,这种重复的工作还是交给计算机吧. 废话不多说,打开Cmd看下Windows的python下面是否 ...
Python图像处理库PIL中图像格式转换（一）
在数字图像处理中,针对不同的图像格式有其特定的处理算法. 所以,在做图像处理之前,我们须要考虑清楚自己要基于哪种格式的图像进行算法设计及事实上现.本文基于这个需求.使用python中的图像处理库PIL ...
Python图像处理之验证码识别
在上一篇博客Python图像处理之图片文字识别(OCR)中我们介绍了在Python中如何利用Tesseract软件来识别图片中的英文与中文,本文将具体介绍如何在Python中利用Tesseract ...
Python图像处理库：Pillow 初级教程
Python图像处理库:Pillow 初级教程 2014-09-14 翻译 http://pillow.readthedocs.org/en/latest/handbook/tutorial.html ...
Python图像处理之图片文字识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同 ...
【python图像处理】图像的缩放、旋转与翻转
[python图像处理]图像的缩放.旋转与翻转图像的几何变换,如缩放.旋转和翻转等,在图像处理中扮演着重要的角色,python中的Image类分别提供了这些操作的接口函数,下面进行逐一介绍. 1.图 ...
python 图像处理(从安装Pillow开始)
python2.x及以下用的是PIL(图像处理库是 PIL(Python Image Library)),最新版本是 1.1.7 可在http://www.pythonware.com/produc ...
Python图像处理库(1)
转自:http://www.ituring.com.cn/tupubarticle/2024 第 1 章基本的图像操作和处理本章讲解操作和处理图像的基础知识,将通过大量示例介绍处理图像所需的 Py ...
Python图像处理库Pillow入门
http://python.jobbole.com/84956/ Pillow是Python里的图像处理库(PIL:Python Image Library),提供了了广泛的文件格式支持,强大的图像处 ...

随机推荐

java Multimap
实现 { "a": [ , , ], "b": [ , ] } 当然, HashMap<String, List<Integer>> 是 ...
Http请求帮助类
using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Net ...
JS 格林威治时间格式（GMT)格式化
Date.prototype.format = function (format) { var o = { "M+": this.getMonth() + 1, //month & ...
[日常] Go语言圣经--复数,布尔值,字符串习题
go语言圣经-复数 1.我们把形如a+bi(a,b均为实数)的数称为复数,其中a称为实部,b称为虚部,i称为虚数单位.两种精度的复数类型:complex64和complex128,分别对应float3 ...
HDFS 命令大全
目录概要用户命令 dfs 命令追加文件内容查看文件内容得到文件的校验信息修改用户组修改文件权限修改文件所属用户本地拷贝到 hdfs hdfs 拷贝到本地获取目录,文件数量及大小 h ...
SORT AGAIN（hdu2523）
SORT AGAIN Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total ...
N皇后问题hdu2553（dfs）
N皇后问题 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others) Total Subm ...
Mybatis中trim标签的用法
select * from t_user <trim prefix="WHERE" prefixOverrides="and"> <if te ...
CSS计数器(序列数字字符自动递增)详解———张鑫旭
by zhangxinxu from http://www.zhangxinxu.com本文地址:http://www.zhangxinxu.com/wordpress/?p=4303 一.挖坟不可耻 ...
关于HTML框架(frameset)的一些基本用法
frameset 定义 W3C是这样定义frameset框架的,通过使用框架,你可以在同一个浏览器窗口中显示不止一个页面.每份HTML文档称为一个框架,并且每个框架都独立于其他的框架.注意,这是HTM ...

python图像处理：pytesseract和PIL

python图像处理：pytesseract和PIL的更多相关文章

随机推荐

热门专题