selenium如何识别验证码

一：前面的文章写了如何右键另存为图片，把验证码存为图片后，接下来就是要做，怎么把图片上的内容获取到，借住tesseract工具

1.下载tesseract：http://sourceforge.net/projects/tesseract-ocr/

2.安装tesseract，安装成功后，最好重启电脑，因为eclipse要读取path，在cmd输入tesseract.exe，出现参数列表则安装成功（不出现的话，就查看下系统path下是否有安装路径）

3.将tesseract.exe命令保存为bat文件，bat内容为

@echo off

tesseract.exe yzm.png 1 -l

exit

验证码图片的位置最后放在项目的根目录下

4.java调用该bat文件

　　　 String cmd = "cmd /c start d://yanzhengm.bat";

      try {

		Runtime.getRuntime().exec(cmd);

	} catch (IOException e) {

		// TODO Auto-generated catch block

		e.printStackTrace();

	}

运行成功后，会生成一个1.txt文件，该文件保存了验证码的文本内容

5.java读取文件获得文本内容

二：上面的方法是右键另存为保存验证码图片后，再识别图片验证码，下面介绍用坐标的方法保存验证码图片

package com.imgyzm;

import java.awt.Rectangle;

import java.awt.image.BufferedImage;

import java.io.File;

import java.io.IOException;

import javax.imageio.ImageIO;

import org.apache.commons.io.FileUtils;

import org.openqa.selenium.By;

import org.openqa.selenium.OutputType;

import org.openqa.selenium.Point;

import org.openqa.selenium.TakesScreenshot;

import org.openqa.selenium.WebDriver;

import org.openqa.selenium.WebElement;

import org.openqa.selenium.chrome.ChromeDriver;

import org.openqa.selenium.io.FileHandler;

import org.openqa.selenium.support.ui.ExpectedCondition;

import org.openqa.selenium.support.ui.WebDriverWait;

import org.testng.annotations.AfterTest;

import org.testng.annotations.BeforeTest;

import org.testng.annotations.Test;

/**

 * @author QiaoJiaofei

 * @version 创建时间：2015年8月27日 上午10:29:57

 * 类说明

 */

public class TestYzmByElementPoint {

    WebDriver dr;

    @BeforeTest

    public void before() {

        String key = "webdriver.chrome.driver";

        String value = "D:/BaiduYunDownload/selenium/chromedriver.exe";

        System.setProperty(key, value);

        dr = new ChromeDriver();

        dr.manage().window().maximize();

    }

    @Test

    public void test1() {

        dr.get("http://172.16.30.242:5555/register.shtml");

        WebDriverWait wait = new WebDriverWait(dr,10);

        WebElement element = wait.until(new ExpectedCondition<WebElement>() {

            @Override

            public WebElement apply(WebDriver arg0) {

                // TODO Auto-generated method stub

                return arg0.findElement(By.id("codeimg"));

            }

        });

        File scrFile = ((TakesScreenshot)dr).getScreenshotAs(OutputType.FILE);

        //WebElement element = dr.findElement(By.id("codeimg"));

        try {

            Point p = element.getLocation();

            int width = element.getSize().getWidth();

            int higth = element.getSize().getHeight();

            Rectangle rect = new Rectangle(width, higth);

            BufferedImage img = ImageIO.read(scrFile);

            BufferedImage dest = img.getSubimage(p.getX(), p.getY(), width, higth);

            ImageIO.write(dest, "png", scrFile);

            Thread.sleep(1000);

            File fng = new File("D:/ddd/yzm.png");

            if(fng.exists()){

                fng.delete();

            }

            FileUtils.copyFile(scrFile, fng);

            Runtime rt = Runtime.getRuntime();

            rt.exec("cmd.exe /C  tesseract.exe D:\\ddd\\yzm.png  D:\\ddd\\yzm -1 ");

            Thread.sleep(1000);

            File file = new File("D:\\ddd\\yzm.txt");

            if(file.exists()) {

                FileHandler fh = new FileHandler();

                String s = fh.readAsString(file).trim();

                System.out.println(s);

            } else {

                System.out.print("yzm.txt不存在");

            }

        } catch (Exception e) {

            // TODO Auto-generated catch block

            e.printStackTrace();

        }

    }

    @AfterTest

    public void after() {

        dr.quit();

    }

}

selenium如何识别验证码的更多相关文章

python利用selenium库识别点触验证码
利用selenium库和超级鹰识别点触验证码(学习于静谧大大的书,想自己整理一下思路) 一.超级鹰注册:超级鹰入口 1.首先注册一个超级鹰账号,然后在超级鹰免费测试地方可以关注公众号,领取1000积分 ...
Python之selenium+pytesseract 实现识别验证码自动化登录脚本
今天写自己的爆破靶场WP时候,遇到有验证码的网站除了使用pkav的工具我们同样可以通过py强大的第三方库来实现识别验证码+后台登录爆破,这里做个笔记~~~ 0x01关于selenium seleniu ...
Python Selenium、PIL、pytesser 识别验证码
思路: 使用Selenium库把带有验证码的页面截取下来利用验证码的xpath截取该页面的验证码对验证码图片进行降噪.二值化.灰度化处理后再使用pytesser识别使用固定的账户密码对比验证码正 ...
Selenium+Tesseract-OCR智能识别验证码爬取网页数据
1.项目需求描述通过订单号获取某系统内订单的详细数据,不需要账号密码的登录验证,但有图片验证码的动态识别,将获取到的数据存到数据库. 2.整体思路 1.通过Selenium技术,无窗口模式打开浏览器 ...
selenium自动化 | 借助百度AI开放平台识别验证码登录职教云
#通过借助百度AI开放平台识别验证码登录职教云 from PIL import Image from aip import AipOcr import unittest # driver.get(zj ...
python 识别验证码自动登陆
# python 3.5.0 # 通过Chrom浏览器访问发起请求 # 需要对应版本的Chrom和chromdriver # 作者:linyouyi from selenium import webd ...
selenium基础-图形验证码
selenium基础-图形验证码一.图形验证码作用设计的初衷其实就是为了防自动化,防止一些人利用自动工具恶意攻击网站二.图形验证码是由客户端生成还是由服务器端生成的? 图形验证码是由服务器端生成 ...
【转载】loadrunner使用system()函数调用Tesseract-OCR识别验证码遇到的问题
俗话说前人栽树,后人乘凉,此话一点不假,结合云层的一遍文章:http://bbs.51testing.com/thread-533920-1-1.html,知道还有一个Tesseract-OCR可以用 ...
C#识别验证码技术-Tesseract
相信大家在开发一些程序会有识别图片上文字(即所谓的OCR)的需求,比如识别车牌.识别图片格式的商品价格.识别图片格式的邮箱地址等等,当然需求最多的还是识别验证码.如果要完成这些OCR的工作,需要你掌握 ...

随机推荐

javascript: Jquery each loop with json array or object
http://www.codeproject.com/Articles/779303/JSON-and-Microsoft-technologies http://www.codeproject.co ...
Uxf框架引入Rest控制器特性
引入Rest风格接口的特性,主要是为了适应平台化和移动化开发的需要. 移植自ThinkPHP项目的RestAction. REST(Representational State Transfer表述性 ...
FL2440驱动添加（4）LED 驱动添加
硬件信息:FL2440板子,s3c2440CPU带四个LED,分别在链接GPB5,GPB6,GPB8,GPB10 内核版本:linux-3.8.0 led驱动代码如下: 值得注意地方地方: 1,定时器 ...
[小北De编程手记] : Lesson 07 - Selenium For C# 之窗口处理
在实际的自动化测试过程中,我们会遇见许多需要对窗口进行处理的情况.比如,点击删除某条信息的时候系统会显示一个Alert框.或者点击某个超链接时会在浏览器中打开一个新的页面.这一篇,来和大家分享一下Se ...
如何在在SharePoint 2013/2010 解决方案中添加 ashx (HttpHandler)
本文讲述如何在在SharePoint 2013/2010 解决方案中添加 ashx (HttpHandler). 一般处理程序(HttpHandler)是·NET众多web组件的一种,ashx是其扩 ...
oracle断电重启之ORA-00600[4194]
1.问题描述 Oracle服务器断电重启以后无法数据库无法正常连接,使用sqlplus envision/envision连接报错.常见的错误有以下这些: ORA-12518: TNS:listene ...
Android项目实战（九）：CustomShapeImageView 自定义形状的ImageView
一个两年前出来的第三方类库,具有不限于圆形ImageView的多种形状ImageView,项目开发必备 github下载地址:https://github.com/MostafaGazar/Custo ...
关于android4.3 Intel X86 Atom System Image的下载
今天建立android4.3模拟器的时候发现没有android4.3 Intel X86 Atom System Image可选,打开android SDK Manager 于是希望重现选择下载安装, ...
HDFS主要特性和体系结构
引言 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统.它和现有的分布式文件系统有很多共同点.但同时,它和其他的分布式文件系统 ...
【读书笔记】iOS-NSData
Cocoa为我们提供了NSData类,该类包装了大量字节,你可以获得数据的长度和指向字节起始位置的指针,因为NSData是一个对象,适用于常规的内存管理行为.因此,如果将数据块传递给一个函数或方法,可 ...

selenium如何识别验证码

selenium如何识别验证码的更多相关文章

随机推荐

热门专题