pytesser以及其依赖插件下载地址:链接: http://pan.baidu.com/s/1i3zgpjJ 密码: ueyy

在学习Webdriver的过程中遇到验证码的识别问题,问了度娘知道了pytesser能用于验证码的识别,而且代码用起来比较简单,就查了好多资料整了一天终于配置好了,记录一下。

首先安装vc 2008外部运行库(全名不记得了)vcsetup_V9.0.30729.1.239631479.exe,不然安装PIL会提示找不到xxx.bat文件,文件名也忘记了。

接着就安装PIL了,本机环境 win7 64位系统,Python2.7,安装PIL时发现没有对应的版本,查到PIL的替代:Pillow,找到对应版本安装

pytesser同时依赖tesseract-ocr,自然是继续安装tesseract-ocr了

这些都安装完了之后就是pytesser的问题了,只需要把pytesser解压到Python安装目录(自己新建工程的话就解压到工程目录就ok)就行,另外注意一下pytesser.py中第六行的import Image,改成from PIL import Image(因为我们安装的不是原版的PIL而是pillow所以要把这个也改一下)

做完这些就能使用啦!

from pytesser import *

image=Image.open("D:\\ProgramFiles\\Python27\\workspace\\fnord.tif")

print image_to_string(image)

aaarticlea/png;base64,iVBORw0KGgoAAAANSUhEUgAAAnYAAAA4CAIAAAD/+yKbAAADMUlEQVR4nO3d0XHjIBQFUOqiIFpIG3SxHfCZRlRBqmA/HFtIxna0O8/JOOdMPpInCTyZYa5BskkdAAiQvvsFAMBrErEAEELEAkAIEQsAIUQsAIQQsfCtWkmjXE/lpea0cz7Ue18PllJynZ+fcl22HQwtHOj3sx3gsDFi25+U6mQwHa0DByw1X0KslTXQxvrpj+n56Ryxl0Qtrffex6tPh1vZhOW03wftAEfsZ7HvOb2l/H41oo7Wr83eHadcF3X131C/PzQ2UXpKtrXeyjj73J1/5RKNu0tKO7W0jMVpv3famb74H/V/Vld/Zv3hAJktFC+1pvS2HdX/Uge+YIy6mtdgW0f11eBax/vVoWk0nvNzk9a3+r3TDnDIzXuxHzW/zdaBj9Yvftq7D3X1Z9bvDMLxktkscz+L3V+7PTqJxqE0Hr3V7812Hr34n/B/Vld/Zv3hAJlH7EfN01np0Trw0DqbbCUNuXZ/QfhsH4XX0bh7sCntF6L3/d5qBzjqKmKtEsNzjVG6DCu2u4hdF3vHd8+P76HuJ8GXC271e6Md4LD9E8WzZ5eO1oEvu8wxz0FYc0q5zhamLhE7X6zaXlJa397OXbad1Xm/83aAf+JzsQAQQsQCQAgRCwAhRCwAhBCxABBCxAJACBELACFELACEELEAEMJ+sQAQ4nn7xQLAr2K/WAAI8bz9YgHgV7FfLACEsF8sAISwXywAhPC5WAAIIWIBIISIBYAQIhYAQohYAAghYgEghIgFgBAiFgBCTCK2lZ7S509pUR2X1FOOahwAvt31Fyj2/KzkKyIWgNe1idhx/prOs8yl9pR6GQ6NM9uaJ/VTMdfPa9dDS8/D/FjEAvDCvjSLPSVlO/9++c7/mtffe9su/LY1pHv7XHAuqV82u7NQDMBr+2rErjdl2zlWl57L5rRW1gRdT+s3Kk9ckQaA5xOxABDiPyK295qHTN09vnQdsb2X4X5tKxaKAXhlm4gdn11KqafSe18fWSrtfIc1DRPZNPmET0mbdsZ4Hht3OxaAF+arJwAghIgFgBAiFgBCiFgACCFiASCEiAWAECIWAEKIWAAIIWIBIISIBYAQfwGo93kdAMkVLAAAAABJRU5ErkJggg==" alt="" />

pytesser的使用的更多相关文章

  1. Python 利用pytesser模块识别图像文字

    使用的是python的pytesser模块,原先想做的是图片中文识别,搞了一段时间了,在中文的识别上还是有很多问题,这里做记录分享. pytesser,OCR in Python using the ...

  2. pytesser图片文本识别

    python图片文本识别使用的工具是PIL和pytesser.因为他们使用到很多的python库文件,为了避免一个个工具的安装,建议使用pythonxy,这个工具的介绍可参考baidu. pytess ...

  3. python pytesser 的安装

      安装包: 需要安装的包主要有两个: PIL 和 pytesser . PIL模块的安装不多说 pytesser 模块的安装: 下载后得到 "pytesser_v0.0.1.zip&quo ...

  4. Python验证码通过pytesser识别

    Python安装包: 需要安装的包主要有两个: PIL 和 pytesser .tesseract (1).安装PIL:下载地址:http://www.pythonware.com/products/ ...

  5. python识别验证码——PIL,pytesser,pytesseract的安装

    1.使用Python识别验证码需要安装Python的图像处理模块(PIL.pytesser.pytesseract) (安装过程需要pip,在我的Python中已经安装pip了,pip的安装就不在赘述 ...

  6. 利用pytesser识别图形验证码

    简单识别 1.一般思路 验证码识别的一般思路为: 图片降噪 图片切割 图像文本输出 1.1 图片降噪 所谓降噪就是把不需要的信息通通去除,比如背景,干扰线,干扰像素等等,只剩下需要识别的文字,让图片变 ...

  7. Windows下Pytesser安装

    安装流程   详细步骤 安装PIL 32位机器:去到PIL官网进行安装 64位机器:建议使用Pillow代替PIL,PIL官网的安装包在64位机器下无法找到,安装Pillow也非常简单,使用pip就可 ...

  8. 在Mac上 python中使用tesseract OCR (Pytesser) 识别图片中的文字

    仓库地址:https://github.com/RobinDavid/Pytesser brew install tesseract sudo pip install opencv-python 安装 ...

  9. Python 安装 pytesser 处理验证码出现的问题

    今天这个问题困扰了我好久,开始直接用 pip install pytesseract 安装了 pytesseract 然后出现了如下错误 Traceback (most recent call las ...

随机推荐

  1. Little Kings - SGU 223(状态压缩)

    题目大意:在一个N*N的棋盘上放置M个国王,已知国王会攻击与它相邻的8个格子,要求放置的额国王不能相互攻击,求放置的方式有多少种. 分析:用dp[row][state][nOne],表示本行状态sta ...

  2. 层层递进Struts1(八)之总结

    先来看一下Struts1学习总结的思维导图,画的主要是Struts1中的重点和博客分布,如下所示: 系列博客的侧重点是: Struts1是什么? 为什么要使用它? 如何使用Struts1? Strut ...

  3. oracle DG 主备切换语句整理

    今日花了一下午时间进行了Oracle DataGuard的切换练习,参考了网上好多文章,最后将一些语句进行摘录,以备以后查询使用.之后有时间会带来Oracle DG的搭建和切换全过程文章. DataG ...

  4. Codeforces Round #387(div 2)

    A =w= B VOV C QoQ D 题意:贝尔兰冬天很冷,那么司机要换上冬天专用轮胎才能开车.假设冬天一共有n天,有一套冬天专用轮胎,仅能使用k天,这套轮胎不管什么温度都能用,而夏天用的轮胎只能在 ...

  5. List<T>分组一

    using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.D ...

  6. hdu-5009-Paint Pearls-dp

    由题意我们能够知道,花费最多为n. 所以单次最多涂掉sqrt(n)种颜色. dp[i]:涂到第i个位置.之前的花费最少为多少. biao[i][j]:在第i个位置,往前涂j-1种颜色,涂到哪个位置. ...

  7. Java读取WEB-INF目录下的properties配置文件

    如何在Java代码中读取WEB-INF目录下的properties配置文件,下文给出了一个解决方案. 我们习惯将一些配置信息写在配置文件中,比如将数据库的配置信息URL.User和Password写在 ...

  8. Scope Chain(作用域链)

    本章,我们讨论一下ECMAScript中的作用域链 , 开门见山. 什么是作用域链 i.ECMAScript是允许创建内部函数的,甚至能从父函数中返回这些函数.作用域链正是内部上下文中所有变量对象(及 ...

  9. css考核点整理(二)-css层叠机制

    css层叠机制 外边距重叠就是margin-collapse. 在CSS当中,相邻的两个盒子(可能是兄弟关系也可能是祖先关系)的外边距可以结合成一个单独的外边距.这种合并外边距的方式被称为折叠,并且因 ...

  10. iOS 数据持久化(2):SQLite3

    @import url(http://i.cnblogs.com/Load.ashx?type=style&file=SyntaxHighlighter.css); @import url(/ ...