pytesser以及其依赖插件下载地址:链接: http://pan.baidu.com/s/1i3zgpjJ 密码: ueyy

在学习Webdriver的过程中遇到验证码的识别问题,问了度娘知道了pytesser能用于验证码的识别,而且代码用起来比较简单,就查了好多资料整了一天终于配置好了,记录一下。

首先安装vc 2008外部运行库(全名不记得了)vcsetup_V9.0.30729.1.239631479.exe,不然安装PIL会提示找不到xxx.bat文件,文件名也忘记了。

接着就安装PIL了,本机环境 win7 64位系统,Python2.7,安装PIL时发现没有对应的版本,查到PIL的替代:Pillow,找到对应版本安装

pytesser同时依赖tesseract-ocr,自然是继续安装tesseract-ocr了

这些都安装完了之后就是pytesser的问题了,只需要把pytesser解压到Python安装目录(自己新建工程的话就解压到工程目录就ok)就行,另外注意一下pytesser.py中第六行的import Image,改成from PIL import Image(因为我们安装的不是原版的PIL而是pillow所以要把这个也改一下)

做完这些就能使用啦!

from pytesser import *

image=Image.open("D:\\ProgramFiles\\Python27\\workspace\\fnord.tif")

print image_to_string(image)

aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAnYAAAA4CAIAAAD/+yKbAAADMUlEQVR4nO3d0XHjIBQFUOqiIFpIG3SxHfCZRlRBqmA/HFtIxna0O8/JOOdMPpInCTyZYa5BskkdAAiQvvsFAMBrErEAEELEAkAIEQsAIUQsAIQQsfCtWkmjXE/lpea0cz7Ue18PllJynZ+fcl22HQwtHOj3sx3gsDFi25+U6mQwHa0DByw1X0KslTXQxvrpj+n56Ryxl0Qtrffex6tPh1vZhOW03wftAEfsZ7HvOb2l/H41oo7Wr83eHadcF3X131C/PzQ2UXpKtrXeyjj73J1/5RKNu0tKO7W0jMVpv3famb74H/V/Vld/Zv3hAJktFC+1pvS2HdX/Uge+YIy6mtdgW0f11eBax/vVoWk0nvNzk9a3+r3TDnDIzXuxHzW/zdaBj9Yvftq7D3X1Z9bvDMLxktkscz+L3V+7PTqJxqE0Hr3V7812Hr34n/B/Vld/Zv3hAJlH7EfN01np0Trw0DqbbCUNuXZ/QfhsH4XX0bh7sCntF6L3/d5qBzjqKmKtEsNzjVG6DCu2u4hdF3vHd8+P76HuJ8GXC271e6Md4LD9E8WzZ5eO1oEvu8wxz0FYc0q5zhamLhE7X6zaXlJa397OXbad1Xm/83aAf+JzsQAQQsQCQAgRCwAhRCwAhBCxABBCxAJACBELACFELACEELEAEMJ+sQAQ4nn7xQLAr2K/WAAI8bz9YgHgV7FfLACEsF8sAISwXywAhPC5WAAIIWIBIISIBYAQIhYAQohYAAghYgEghIgFgBAiFgBCTCK2lZ7S509pUR2X1FOOahwAvt31Fyj2/KzkKyIWgNe1idhx/prOs8yl9pR6GQ6NM9uaJ/VTMdfPa9dDS8/D/FjEAvDCvjSLPSVlO/9++c7/mtffe9su/LY1pHv7XHAuqV82u7NQDMBr+2rErjdl2zlWl57L5rRW1gRdT+s3Kk9ckQaA5xOxABDiPyK295qHTN09vnQdsb2X4X5tKxaKAXhlm4gdn11KqafSe18fWSrtfIc1DRPZNPmET0mbdsZ4Hht3OxaAF+arJwAghIgFgBAiFgBCiFgACCFiASCEiAWAECIWAEKIWAAIIWIBIISIBYAQfwGo93kdAMkVLAAAAABJRU5ErkJggg==" alt="" />

pytesser的使用的更多相关文章

  1. Python 利用pytesser模块识别图像文字

    使用的是python的pytesser模块,原先想做的是图片中文识别,搞了一段时间了,在中文的识别上还是有很多问题,这里做记录分享. pytesser,OCR in Python using the ...

  2. pytesser图片文本识别

    python图片文本识别使用的工具是PIL和pytesser.因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用pythonxy,这个工具的介绍可参考baidu. pytess ...

  3. python pytesser 的安装

      安装包: 需要安装的包主要有两个: PIL 和 pytesser . PIL模块的安装不多说 pytesser 模块的安装: 下载后得到 "pytesser_v0.0.1.zip&quo ...

  4. Python验证码通过pytesser识别

    Python安装包: 需要安装的包主要有两个: PIL 和 pytesser .tesseract (1).安装PIL:下载地址:http://www.pythonware.com/products/ ...

  5. python识别验证码——PIL,pytesser,pytesseract的安装

    1.使用Python识别验证码需要安装Python的图像处理模块(PIL.pytesser.pytesseract) (安装过程需要pip,在我的Python中已经安装pip了,pip的安装就不在赘述 ...

  6. 利用pytesser识别图形验证码

    简单识别 1.一般思路 验证码识别的一般思路为: 图片降噪 图片切割 图像文本输出 1.1 图片降噪 所谓降噪就是把不需要的信息通通去除,比如背景,干扰线,干扰像素等等,只剩下需要识别的文字,让图片变 ...

  7. Windows下Pytesser安装

    安装流程   详细步骤 安装PIL 32位机器:去到PIL官网进行安装 64位机器:建议使用Pillow代替PIL,PIL官网的安装包在64位机器下无法找到,安装Pillow也非常简单,使用pip就可 ...

  8. 在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字

    仓库地址:https://github.com/RobinDavid/Pytesser brew install tesseract sudo pip install opencv-python 安装 ...

  9. Python 安装 pytesser 处理验证码出现的问题

    今天这个问题困扰了我好久,开始直接用 pip install pytesseract 安装了 pytesseract 然后出现了如下错误 Traceback (most recent call las ...

随机推荐

  1. ADB server didn't ACK的问题

    今天出现eclipse用手机调试时,一直起不来,出现ADB server didn't ACK,提示restart adb或者重启eclipse,按照原来的,查看了任务管理器中,没发现已经启动的adb ...

  2. .htaccess文件的妙用

    .htaccess是Apache HTTP Server系统级别的配置文件,通常用来实现主机本身以外的一些功能的,比如说重定向.Gzip.以及访问限制等等………… 1.重定向(301跳转) 相信这个功 ...

  3. MySQL 面试基础

    相关:http://blog.csdn.net/u013252072/article/details/52912385          http://blog.csdn.net/zhangliang ...

  4. 如何在word2007中并排查看对比显示两个文档

    使用word编辑或修改文件时,有时会需要对两个文档进行对比,此时就应该使用并排查看功能. 点击“视图”菜单中的“并排查看” 所打开的两个文档就会同时打开,并排显示 可点击“同步滚动”设置或取消同步滚动

  5. TOJ1693(Silver Cow Party)

    Silver Cow Party   Time Limit(Common/Java):2000MS/20000MS     Memory Limit:65536KByte Total Submit: ...

  6. 韩玉琪 《Linux内核分析》MOOC课程

    http://www.cnblogs.com/hyq20135317/p/5422516.html http://mooc.study.163.com/course/USTC-1000029000

  7. hdu 4622 Reincarnation(后缀数组)

    hdu 4622 Reincarnation 题意:还是比较容易理解,给出一个字符串,最长2000,q个询问,每次询问[l,r]区间内有多少个不同的字串. (为了与论文解释统一,这里解题思路里sa数组 ...

  8. 利用switch语句进行多选一判断。

    <!doctype html> <meta http-equiv="content-type" content="text/html" cha ...

  9. sublime text插件

    BracketHighlighter : 该插件提供配对标签,或大括号或字符引号的配对高亮显示,加强系统高亮 SublimeTmpl: 文件模版.安装后,文件---> New File (Sub ...

  10. oracle数组定义与使用

    定义固定长度的一维数组 type type_array is varray(10) of varchar2(20); 1.varray(10)表示定义长度为10的数组 2.varchar2(20)表示 ...