Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考

在自动化测试或者安全渗透测试中，Captcha验证码的问题经常困扰我们，还好现在OCR和AI逐渐发展起来，在这块解决上越来越支撑到位。

我推荐的几种方式，一种是对于简单的验证码，用开源的一些OCR图片处理包即可，对于复杂的识别率要求非常高的，可以考虑百度等公司的OCR有偿服务（当然注册后好像每天可以免费试用上百次，普通测试够用了）。

本人环境： win10,python3.x, pip( python3安装版会自带), pycharm, tesseract-ocr-setup-3.02.02.exe，

pytesser3 ，pytesseract ,selenium(chrome浏览器以及匹配版本的浏览器驱动geckodriver.exe),pillow 5.3,pillow-PIL 0.1

注意事项：

A.务必单独下载安装tesseract-ocr-setup-3.02.02.exe（会自动配置好PATH环境变量），安装好后可以运行DOS命令执行

tesseract G:\temp\captcha\image_code.png g:\temp\abc_123 digits_numbers

tesseract 要识别的图片识别出来后字符的保存文件，默认为.txt ， tesseract安装后Tesseract-OCR\tessdata\configs\路径有个digits文件，可以定义识别白名单，比如只识别数字等，使用后可以提高识别率，可以在原来文件直接改，我这里是复制后修改并且重新命名为digits_numbers，如果不使用白名单命令行可以不加digits_numbers

B.在pytesser3目录下的__init__.py文件里，要修改好以下这行，主要是配置好tesseract.exe的安装路径，注意.exe不需要写

#请务必修改下面的tesseract的name 换成你安装的ocr路径，谢谢！
tesseract_exe_name = 'D:\\programs\\Tesseract-OCR\\tesseract' # Name of
#tesseract_exe_name = 'c:\\Program Files (x86)\\Tesseract-OCR\\tesseract'

以下是pycharm下的工程包和OCR核心源码，至于后续识别后如何登陆就是普通的接口测试或者selenium等UI自动化范畴了，此处省略一万字。如果连UI自动化都不精，不建议直接做这个，赶快回家看书去。

from selenium import webdriver
import pytesser3
import os
import sys, time
from PIL import Image, ImageEnhance

url = "http://登陆的URL"

driver = webdriver.Chrome()

time.sleep(2)

driver.get(url)

time.sleep(5)

try:
    account = driver.find_element_by_id('_account')
    password = driver.find_element_by_id('_password')
    region = driver.find_element_by_id('_regionId')
    captcha = driver.find_element_by_id('_captcha')
except:
    print("查找元素出现异常")

#  网页截图 + 验证码截图
try:
    driver.get_screenshot_as_file('G:\\temp\\page\\loginPage1.png')  # 比较好理解
    im = Image.open('G:\\temp\\page\\loginPage1.png')
    box = (884, 684, 1024, 734)  # 设置要裁剪的区域，这个坐标是验证码图片这个长方形的左上角坐标和右下角坐标，不懂可以问UI美工，用图形编辑工具很容易获得
    region = im.crop(box)  # 此时，region是一个新的图像对象。
    region.save("G:\\temp\\captcha\\image_code.png")
except:
    print("网页截图 + 验证码截图出现异常")

driver.close()
# --------------------图片增强+自动识别简单验证码-----------------------------
# 防止图片还没保存好，就开始识别
time.sleep(3)
im = Image.open("G:\\temp\\captcha\\image_code.png")
imgry = im.convert('L')  # 图像加强，二值化
sharpness = ImageEnhance.Contrast(imgry)  # 对比度增强
sharp_img = sharpness.enhance(2.0)
sharp_img.save("G:\\temp\\captcha\\image_code.png")

time.sleep(2)

def image_file_to_string(file):
    cwd = os.getcwd()
    try:
        os.chdir("D:\\programs\\Tesseract-OCR")
        return pytesser3.image_file_to_string(file)
    finally:
        os.chdir(cwd)

# code即为识别出的图片数字str类型

code = image_file_to_string("G:\\temp\\captcha\\image_code.png")

time.sleep(1)
print(code)

后续省略一万字，自己用次code去完成接下来的自动化登陆即可.... 
有些复杂点的图片验证码识别率不高，是的，一开始我就说了，

改进参考：

1. 真正应用的时候可以考虑把打开浏览器，截图等事情换个实现方式，使用内核浏览器操作，而非真正打开可见的浏览器，这样更快。

2. OCR识别部分还需要用你要实现产品的验证码样本进行tesseract的进一步学习训练，或者换用商用OCR工具，识别率更高

Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考的更多相关文章

python+selenium，实现带有验证码的自动化登录功能
python+selenium的环境准备,请自行安装完成,这里直接贴代码,方便做项目时直接使用. import time from selenium import webdriver from PIL ...
Python+Selenium学习--自动化测试模型
前言一个自动化测试框架就是一个集成体系,在这一体系中包含测试功能的函数库.测试数据源.测试对象识别标准,以及种可重用的模块.自动化测试框架在发展的过程中经历了几个阶段,模块驱动测试.数据驱动测试.对 ...
Python爬虫入门教程 58-100 python爬虫高级技术之验证码篇4-极验证识别技术之一
目录验证码类型官网最新效果找个用极验证的网站拼接验证码图片编写自动化代码核心run方法模拟拖动方法图片处理方法初步运行结果拼接图图片存储到本地 @ 验证码类型今天要搞定的验证码 ...
Python+Selenium UI自动化测试环境搭建及使用
一什么是Selenium ? Selenium 是一个浏览器自动化测试框架,它主要用于web应用程序的自动化测试,其主要特点如下:开源.免费:多平台.浏览器.多语言支持:对web页面有良好的支持:AP ...
配置Python+selenium+firefox自动化测试
1.安装python.默认安装 2.安装pip.下载pip-1.5.4包,解压pip-1.5.4,放在C盘,进入pip目录-->键入命令:python setup.py install 再进入 ...
python selenium web自动化测试完整项目实例
问题: 好多想不到的地方,中间经历了一次重构,好蛋疼: xpath定位使用的不够熟练,好多定位问题,只能靠强制等待解决: 存在功能重复的方法,因为xpath定位不同,只能分开写,有时间可以继续优化: ...
python selenium+phantomJS自动化测试环境
0x00配置phantomJS 1. 在windows平台下此种方法是弹浏览器进行自动化测试的. 1.下载谷歌的驱动 https://chromedriver.storage.googleapis. ...
python + selenium webdriver 自动化测试之环境异常处理（持续更新）
1.webdriver版本与浏览器版本不匹配,在执行的时候会抛出如下错误提示 selenium.common.exceptions.WebDriverException: Message: unkno ...
python + selenium + unittest 自动化测试框架 -- 入门篇
. 预置条件: 1. python已安装 2. pycharm已安装 3. selenium已安装 4. chrome.driver 驱动已下载二.工程建立 1. New Project:建立自己的 ...

随机推荐

简单记录下3PC
三PC分为三个阶段:CanCommit,PreCommit, DoCommit 整个分布式系统中,有一个组织者,其他属于参与者,当一个组织者挂了,会从其他可用site中选一个组织者出来,降低阻塞,避免 ...
js 动态添加外部js css 到head标签
function appendJQCDN() { var head = document.head || document.getElementsByTagName('head')[0]; var s ...
html5 meta标签的认知储备
在开发移动或者PC端的时候除了'<meta charset="UTF-8">'这个设置编码格式的meta标签,还有一些其他方面的设置一.<meta name=& ...
Excel中如何匹配另外一个Excel中的数据
场景: 我在Excel中想展示通过一列匹配到另外Excel中的数据.对于程序员来说,就是left join 出 B表的数据. 但是在Excel中怎么做呢,我又不想每次都在把数据导入到数据库中操作. 这 ...
Oracle 11.2.0.4.0 Dataguard部署和日常维护(6)-Dataguard Snapshot篇
1. 检查当前主备库同步状态 on primary select ads.dest_id,max(sequence#) "Current Sequence", max(log_se ...
ORA-04068 / ORA-04065 / ORA-06508 详细说明
关于在运行ORACLE 包发生ORA-04068 / ORA-04065 / ORA-06508 代码异常的原因只有一个,那就是包含了全局变量/常量的包,在会话保留期间被执行了编译. 对于此类错误,我 ...
ubuntu14静态ip配置
0.配置ip需要掌握的一些基本指令打开/创建文件 sudo vim ... 插入信息 i 保存并强制退出先按Esc,再键入:wq!,回车 1.使用命令 sudo vi ...
Hadoop---日志服务器
Hadoop---日志服务器 1.历史服务器: 启动: 1)测试使用: 1.做一个任务: 2.接受任务: 3.执行任务: 4.执行任务完成: 2)日志文件产生: 成功后: 失败后: 点击进入His ...
青蛙跳N阶(变态跳)
https://www.nowcoder.com/questionTerminal/22243d016f6b47f2a6928b4313c85387 描述一只青蛙一次可以跳上1级台阶,也可以跳上2级 ...
PyCharm+QTDesigner+PyUIC使用教程
我们在PyCharm安装配置Qt Designer+PyUIC教程中已配置好了PyCharm+QTDesigner+PyUIC环境这里在此基上我们演示如何使用这些工具,编写一个图形界面程序: 程序主 ...

Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考

Python&selenium&tesseract自动化测试随机码、验证码（Captcha）的OCR识别解决方案参考的更多相关文章

随机推荐

热门专题