现在大多数网站都采用了验证码来防止暴力破解或恶意提交。但验证码真的就很安全吗?真的就不能被机器识别??
我先讲讲我是怎么实现站外提交留言到一个网站的程序。
这个网站的留言版大致如下:

我一看这种简单的4位数字验证码,马上就感觉到有戏了。直觉告诉我让电脑来识别这些图片验证码据对简单o(∩_∩)o...
首先我马上在这个页面用右键菜单看源代码

知道验证码获取页面后 你可以直接用 http://www.XXXX.com/imgchk/validatecode.asp
这样去访问你会发现你打开的就是一个验证码图片。

对的其实返回的就是图片文件的2进制流而已。接着先用右键保存一张验证码的图片。因为要开始分析这张图片了,什么用什么工具?PhotoShop????不用就一般的画图工具就可以了。我们要搞清楚的是这几个数字分别占几个像素就可以了。

可以看出 一个数字5*9

也就是45个像素。恩 这就可以了
另外我们可以看出默认区域就是白色
(姑且说是白色因为我们肉眼看就是白色)
那么我的程序识别原理就是固定去扫描这45个像素点。看每个点的颜色是不是和默认的颜色一致
一致的话就标记为0 ,不一致就标记为1 。
如一个数子是2 那么我的程序扫描出来的图像就应该是:
011110
100001
000001
000001
000010
000100
001000
010000
100000
111111
如果一个数字是7那么扫描出来的图像就是:
111111
100001
000010
000010
000100
000100
001000
001000
010000
010000

恩,就这么简单呵呵。下面给出图像 扫描的java类 (不好意思,在我会的语言里面除开java就剩sql了)

package com.util;

//~--- JDK imports ------------------------------------------------------------

import com.sun.image.codec.jpeg.JPEGCodec;
import com.sun.image.codec.jpeg.JPEGEncodeParam;
import com.sun.image.codec.jpeg.JPEGImageEncoder;

import java.awt.*;
import java.awt.image.*;

import java.io.*;
import java.io.FileOutputStream;
import java.io.OutputStream;

import java.net.*;

import javax.imageio.*;
import javax.imageio.ImageIO;

public class ImgIdent {

// 数字字符比特表

private final long[][] NUMERIC = {

},    // '0'

},    // '1'

},     // '2'

},     // '3'

},     // '4'

},    // '5'

},    // '6'

},    // '7'

},    // '8'

}

};                               // '9'

// 字框高
;

// 字框横向间隙
;

// 字框纵向间隙
;

// 字框宽
;

private int           IntImgHeight;

private BufferedImage img;

private int           intBgColor;

private int           intCharColor;

private int           intImgWith;

private int           intMaxX;

private int           intMaxY;

private int           intMinX;

private int           intMinY;

// 座标原点
    private Point  pOrigin;

private String strNum;

public ImgIdent(BufferedImage img) throws IOException {

this.img = img;

init();

}

public ImgIdent(File file) throws IOException {

img = ImageIO.read(file);

init();

}

public ImgIdent(URL url) throws IOException {

img = ImageIO.read(url);

init();

}

private void init() {

// 得到图象的长度和宽度
        intImgWith   = img.getWidth();

IntImgHeight = img.getHeight();

// 得到图象的背景颜色
);

// System.out.println(intBgColor);

// 初始化图象原点座标
);

}

private void getBaseInfo() {

System.out.println(intBgColor + "|" + intCharColor);

System.out.println(intMinX + "|" + intMinY + "|" + intMaxX + "|" + intMaxY);

}

private Point[] getCharRange(int intNo) {

// 左上右下点座标
);

Point pBottomRight );

// 左上点
);

pTopLeft.y = pOrigin.y;

// 右下点
;

pBottomRight.y ;

return new Point[] { pTopLeft, pBottomRight };

}

private char getBit(int x, int y) {

int intCurtColor;

intCurtColor = img.getRGB(x, y);

//System.out.println("[" + x + "," + y + "]" + intCurtColor + "==" + intBgColor + "==>" + (Math.abs(intCurtColor) >7308252));
//      return (Math.abs(intCurtColor) >= 5689325)
//              ? '0'
//              : '1';
        return (intCurtColor == intBgColor)

'

: ';

// 5689325    6008535
    }

private String getCharString(int intNo) {

// 本字符的左上右下点座标
        Point[] p            = getCharRange(intNo);

Point   pTopLeft     ];

Point   pBottomRight ];

// 换算边界值
        int intX1, intY1, intX2, intY2;

intX1 = pTopLeft.x;

intY1 = pTopLeft.y;

intX2 = pBottomRight.x;

intY2 = pBottomRight.y;

//      System.out.println("intX1=" + intX1);
//      System.out.println("intY1=" + intY1);
//      System.out.println("intX2=" + intX2);
//      System.out.println("intY2=" + intY2);

// 在边界内循环取象素
        int    i, j;

String strChar = "";

for (i = intY1; i <= intY2; i++) {

for (j = intX1; j <= intX2; j++) {

System.out.print(getBit(j, i));

strChar = strChar + getBit(j, i);

}

System.out.println();

}

System.out.println();

return strChar;

}

public int getNum(int intNo) {

// 取得位字符串
        String strChar = getCharString(intNo);

// System.out.println(intNo+"=="+strChar);

// 取得串高位串和低位串
);

String strCharLow  );

// 计算高位和低位值
);

System.out.println(lCharHigh);

);

System.out.println(lCharLow);

// 在数字中循环比较
        int intNum = '*';

; i++) {

])) {

intNum = i;

break;

} else {

)) {

intNum ;

}    // 834533329 242870177

else {

intNum ;

}    // 默认为1   低位为    937393609  937393601
            }

}

return intNum;

}

public String getValidatecode(int length) {

String strNum = "";

; i <= length; i++) {

synchronized (this) {

strNum += String.valueOf(getNum(i));

}

}

return strNum;

}

public void saveJPEG(BufferedImage iag, String savePath) throws FileNotFoundException, IOException {

OutputStream     jos     = new FileOutputStream(savePath);

JPEGImageEncoder encoder = JPEGCodec.createJPEGEncoder(jos);

JPEGEncodeParam  jpegEP  = JPEGCodec.getDefaultJPEGEncodeParam(iag);

jpegEP.setQuality((, true);

encoder.encode(iag, jpegEP);

jos.flush();

jos.close();

}

}

恩这样数字是可以识别出来了,可以我要怎么完成提交那块的工作呢?好在Apache已经为我做完了。我用了
HttpClient这样一个模拟Http协议的小工具包。我只要往那个 Add_MSG.asp里面提交就完了。

package com.util;

//~--- non-JDK imports --------------------------------------------------------

import org.apache.commons.httpclient.*;
import org.apache.commons.httpclient.methods.GetMethod;
import org.apache.commons.httpclient.methods.PostMethod;
import org.apache.commons.httpclient.params.HttpClientParams;
import org.apache.commons.httpclient.params.HttpMethodParams;

//~--- JDK imports ------------------------------------------------------------

import java.awt.image.BufferedImage;

import java.io.InputStream;

import javax.imageio.ImageIO;

public class MyHttpClient {

public synchronized void doSomeThing(String title, String name, String Content, String proIP, int port,

boolean usePro) {

// 构造HttpClient的实例
        HttpClient       httpClient   = new HttpClient();

HttpClientParams clientParams = new HttpClientParams();

// 隐藏自己请求相关的信息
        clientParams.setParameter("http.useragent", "Mozilla/4.0 (compatible; FIREFOX 9.0; IBM AIX 5)");

// httpClient.getHttpConnectionManager().getParams().setSoTimeout(30 * 1000);
        clientParams.setHttpElementCharset("GBK");

HttpState httpState = new HttpState();

httpClient.setParams(clientParams);

httpClient.getParams().setParameter(HttpClientParams.HTTP_CONTENT_CHARSET, "GBK");

httpClient.setState(httpState);

clientParams.setVersion(HttpVersion.HTTP_1_1);

// httpClient.getHostConfiguration().setProxy("148.233.159.58", 3128);

if (usePro)    // 使用代理

{

httpClient.getHostConfiguration().setProxy(proIP, port);

}

// 创建GET方法的实例
        GetMethod getMethod = new GetMethod("http://www.XXXcom/Guestbook/imgchk/validatecode.asp");

// 使用系统提供的默认的恢复策略
        getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER, new DefaultHttpMethodRetryHandler());

try {

// 执行getMethod
            int statusCode = httpClient.executeMethod(getMethod);

// System.out.println(statusCode);

if (statusCode != HttpStatus.SC_OK) {

System.err.println("Method failed: " + getMethod.getStatusLine());

}    // 读取内容

InputStream inStream = getMethod.getResponseBodyAsStream();

// 处理内容

// System.out.println(new String(responseBody));
            BufferedImage iag      = ImageIO.read(inStream);

ImgIdent      imgIdent = new ImgIdent(iag);

// imgIdent.saveJPEG(iag, "C:/ddd.jpg");
);

System.out.println(validate);

PostMethod method  = new PostMethod("http://www.XXX.com/Guestbook/add_msg.asp");

String     connect = Content;

String     Title   = title;

method.setParameter("subject", Title);

method.setParameter("g_name", name);

method.setParameter("companyname", "");

method.setParameter("mail", "");

method.setParameter("homepageurl", "http://");

method.setParameter("pic", "p5.gif");

method.setParameter("validatecode", validate);

method.setParameter("content", connect);

//          if (todo) {
            int code = httpClient.executeMethod(method);

// String Stringresponse = new String(method.getResponseBodyAsString().getBytes("8859_1"));

// 打印返回的信息

// System.out.println(Stringresponse);
//          }

method.releaseConnection();

//          System.out.println(iag.getHeight());
//          System.out.println(iag.getWidth());
//          //背景 颜色
//          intBgColor = iag.getRGB(38, 0);
//          System.out.println("intBgColor=" + intBgColor);
//
//
//          intBgColor = iag.getRGB(0, 0);
//          System.out.println("intBgColor=" + intBgColor);

} catch (Exception e) {

// 发生网络异常
            e.printStackTrace();

} finally {}

// 释放连接   getMethod.releaseConnection();  }
        getMethod.releaseConnection();

}

}

恩 就这样了,最后结合SAF整成这样了。什么?为什么不用SWT?想过了SWING才是王道o(∩_∩)o...

[Java] 识别图片验证码的更多相关文章

  1. 【java+selenium3】Tesseract-OCR识别图片验证码 (十六)

    [java+selenium+Tesseract-OCR(图片识别)+AutoIt(windows窗口识别)]完成自动化图片验证码识别! 一.AutoIt(windows窗口识别)参考:https:/ ...

  2. python 识别图片验证码报IOError

    说一下困扰了我一周的问题:识别图片验证码 本来我按照安装步骤(http://www.cnblogs.com/yeayee/p/4955506.html?utm_source=tuicool&u ...

  3. 用Java实现图片验证码功能

    一.什么是图片验证码? 可以参考下面这张图: 我们在一些网站注册的时候,经常需要填写以上图片的信息. 1.图片生成实体类: package com.hexianwei.graphic; import ...

  4. python爬虫20 | 小帅b教你如何使用python识别图片验证码

    当你在爬取某些网站的时候 对于你的一些频繁请求 对方会阻碍你 常见的方式就是使用验证码 验证码的主要功能 就是区分你是人还是鬼(机器人) 人 想法设法的搞一些手段来对付技术 而 技术又能对付人们的想法 ...

  5. java实现图片验证码

    一.验证码生成类 package hbi.tech.utils; import javax.imageio.ImageIO; import java.awt.*; import java.awt.im ...

  6. 使用burp插件captcha-killer识别图片验证码

    0x01 开发背景 说起对存在验证码的登录表单进行爆破,大部分人都会想到PKav HTTP Fuzzer,这款工具在前些年确实给我们带来了不少便利.反观burp一直没有一个高度自定义通杀大部分图片验证 ...

  7. Java 生产图片验证码

    import java.awt.Color;import java.awt.Font;import java.awt.Graphics;import java.awt.Graphics2D;impor ...

  8. 识别图片验证码的三种方式(scrapy模拟登陆豆瓣网)

    1.通过肉眼识别,然后输入到input里面 from PIL import image Image request.urlretrieve(url,'image')  #下载验证码图片 image = ...

  9. 【转】Python OCR识别图片验证码

    转载自:博客 对于某些网站登录的时候,往往需要输入验证码才能实现登录.如果要爬虫这类网站,往往总会比这个验证码导致无法爬取数据.以下介绍一种比较折中的方法,也是比较可行的方法: 实现思想: 1.通过截 ...

随机推荐

  1. bzoj1193

    #include<cstdio> #include<cstdlib> #include<algorithm> #include<queue> using ...

  2. Inverse是hibernate双向关系中的基本概念。inverse的真正作用就是指定由哪一方来维护之间的关联关系。当一方中指定了“inverse=false”(默认),那么那一方就有责任负责之间的关联关系,说白了就是hibernate如何生成Sql来维护关联的记录

    <set name ='students' table="students_table" inverse='false'(默认不用写) > <key column ...

  3. debian7下部署nginx服务器

    笔者是在vmware中的Debian7下部署nginx服务器,采用离线部署方式.过程如下: 1.准备好需要的离线安装包 nginx-1.6.2.tar.gz,pcre-8.34.tar.gz,open ...

  4. ubuntu 错误 & 解决

    1.ssh时出现“段错误(核心已转储)” 原因:说明与ssh有关的内核代码被修改过并且部分代码访问内存过界 解决:1.将内核代码被修改过的部分修改回来        2.sudo apt-get re ...

  5. home-brew 安装&下载

    安装: ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)&qu ...

  6. openstack 基本配置

  7. 在linnux下,配置自动备份oacle

    以oracle身份登录到linux,在oracle home目录下创建目录 shell $ mkdir shell 创建自动备份脚本 $ cd shell $ touch expdp.sh $ chm ...

  8. CISCO3560 VLAN配置实例

    1.注意事项 1.1.交换机启动需要大约4-5分钟: 1.2.网线插入交换机接口从黄变为绿需要大约1-2分钟,即进入正常工作模式: 1.3.建议使用XP系统进行操作,2003默认没有安装超级终端,需要 ...

  9. CodeForces 709B Checkpoints (数学,最短路)

    题意:给定你的坐标,和 n 个点,问你去访问至少n-1个点的最短路是多少. 析:也是一个很简单的题,肯定是访问n-1个啊,那么就考虑从你的位置出发,向左访问和向右访问总共是n-1个,也就是说你必须从1 ...

  10. C#图解教程读书笔记(第1章 C#和.net框架)

    C#中的主要需要记住的基础概念 CLR公共语言运行库 CIL中间语言,所有的代码都会编译成中间语言. CLI公共语言基础结构 C#的优点 C#有自动垃圾回收机制