Java OCR tesseract 图像智能字符识别技术 Java实现

Java OCR tesseract 图像智能字符识别技术 Java代码实现

接着上一篇OCR所说的，上一篇给大家介绍了tesseract 在命令行的简单用法，当然了要继承到我们的程序中，还是需要代码实现的，下面给大家分享下java实现的例子。

拿代码扫描上面的图片，然后输出结果。主要思想就是利用Java调用系统任务。

下面是核心代码：

/**

 *

 */

package cn.jorcen.dropins.tesseract;

import java.io.BufferedReader;

import java.io.File;

import java.io.FileInputStream;

import java.io.FileNotFoundException;

import java.io.IOException;

import java.io.InputStream;

import java.io.InputStreamReader;

import java.io.UnsupportedEncodingException;

import java.util.LinkedList;

import java.util.List;

import org.apache.commons.io.IOUtils;

import org.apache.log4j.Logger;

/**

 *

 *

 * @author mjorcen

 * @email mjorcen@gmail.com

 * @dateTime Jun 19, 2014 3:42:16 PM

 * @version 1

 */

public class TesseractOCRUtil {

    static Logger logger = Logger.getLogger(TesseractOCRUtil.class);

    static String path = "E:/data/Users/Administrator/Desktop/ocr/spelling";

    public static void main(String[] args) throws Exception {

        File file = new File(path);

        String[] strs = file.list();

        for (String string : strs) {

            File iFile = new File(path, string);

            if (iFile.isFile()) {

                parseImage(new File(file.getAbsolutePath(), string), new File(

                        path + "/tmp", iFile.getName()));

            }

        }

        System.exit();

    }

    public static String parseImage(File file, File targetFile)

            throws Exception {

        ClearImageUtil.cleanImage(file, targetFile);

        return parseImageOnNoClear(targetFile);

    }

    public static String parseImageOnNoClear(File file) throws Exception {

        try {

            logger.debug("image is " + file.getAbsolutePath());

            // ClearImageHelper.cleanImage(file, filename);

            // 构造命令

            // List<String> cmd = new LinkedList<String>();

            // cmd.add("tesseract");

            // cmd.add(file.getAbsolutePath());

            // cmd.add(file.getAbsolutePath());

            // cmd.add(" ");

            // cmd.add("-l");

            // cmd.add(" ");

            // cmd.add("normal");

            // logger.debug(cmd);

            // System.out.println(cmd);

            // ProcessBuilder pb = new ProcessBuilder(cmd);

            // pb.redirectErrorStream(true);

            // pb.directory(new File(path));

            // Process p = pb.start();

            Runtime run = Runtime.getRuntime();

            Process p = run.exec("cmd.exe /c tesseract "

                    + file.getAbsolutePath() + " " + file.getAbsolutePath()

                    + " -l normal");

            getConsole(p);

            String sb = getResult(new File(file.getAbsolutePath() + ".txt"));

            return sb.toString();

        } catch (Exception e) {

            logger.error(e);

            return null;

        } finally {

        }

    }

    private static String getResult(File file) throws FileNotFoundException,

            UnsupportedEncodingException, IOException {

        StringBuilder sb = new StringBuilder();

        // 取得结果的输出流

        InputStream resultIs = new FileInputStream(file);

        // 用一个读输出流类去读

        InputStreamReader resultIsr = new InputStreamReader(resultIs, "utf-8");

        // 用缓冲器读行

        BufferedReader resultBr = new BufferedReader(resultIsr);

        String line;

        // 直到读完为止

        while ((line = resultBr.readLine()) != null) {

            logger.debug(line);

            sb.append(line);

        }

        return sb.toString();

    }

    private static void getConsole(Process p)

            throws UnsupportedEncodingException, IOException {

        // 取得命令结果的输出流

        InputStream fis = p.getInputStream();

        // 用一个读输出流类去读

        InputStreamReader isr = new InputStreamReader(fis, "utf-8");

        // 用缓冲器读行

        BufferedReader br = new BufferedReader(isr);

        String line = null;

        // 直到读完为止

        while ((line = br.readLine()) != null) {

            // System.out.println(line);

        }

    }

    public static void test() {

        try {

            List<String> cmd = new LinkedList<String>();

            cmd.add("javac");

            cmd.add("PB.java");

            ProcessBuilder pb = new ProcessBuilder(cmd);

            pb.redirectErrorStream(true);

            pb.directory(new File("E:/test"));

            Process p = pb.start();

            // 取得命令结果的输出流

            InputStream fis = p.getInputStream();

            // 用一个读输出流类去读

            InputStreamReader isr = new InputStreamReader(fis, "utf-8");

            // 用缓冲器读行

            BufferedReader br = new BufferedReader(isr);

            String line = null;

            // 直到读完为止

            while ((line = br.readLine()) != null) {

                logger.debug(line);

            }

        } catch (Exception e) {

            logger.error(e);

        }

    }

}

结果如下:

uHx7,IXQO,\1ZYP,ZVBO,3237,5SYQ~,,87YF,\8KDN,CGPC,\c\IG\N,F\Z TA,J 9pc,Lpza,NBGC,N QW8,onwz,ox XJ,\P9FM,P PR鈥楿,QRG\I\,,RAZ v\,504i,VGPH,VPCI,\\I\M I,鈥楳J1,Y6H9\,Y OGP,

对比第一张图片，不是很完美~哈哈，当然了如果你只需要实现验证码的读写，那么上面就足够了。下面继续普及图像处理的知识。

-------------------------------------------------------------------我的分割线--------------------------------------------------------------------

当然了，有时候图片被扭曲或者模糊的很厉害，很不容易识别，所以下面我给大家介绍一个去噪的辅助类，能稍做优化，先看下效果图。

package cn.c.test3;

import java.awt.Color;

import java.awt.image.BufferedImage;

import java.io.File;

import java.io.IOException;

import javax.imageio.ImageIO;

public class ClearImageHelper {

    public static void main(String[] args) throws IOException {

        File testDataDir = new File("E:\\test\\code");

        final String destDir = testDataDir.getAbsolutePath() + "/tmp";

        for (File file : testDataDir.listFiles()) {

            cleanImage(file, destDir);

        }

    }

    /**

     *

     * @param sfile

     *            需要去噪的图像

     * @param destDir

     *            去噪后的图像保存地址

     * @throws IOException

     */

    public static void cleanImage(File sfile, String destDir)

            throws IOException {

        File destF = new File(destDir);

        if (!destF.exists()) {

            destF.mkdirs();

        }

        BufferedImage bufferedImage = ImageIO.read(sfile);

        int h = bufferedImage.getHeight();

        int w = bufferedImage.getWidth();

        // 灰度化

        int[][] gray = new int[w][h];

        for (int x = 0; x < w; x++) {

            for (int y = 0; y < h; y++) {

                int argb = bufferedImage.getRGB(x, y);

                // 图像加亮（调整亮度识别率非常高）

                int r = (int) (((argb >> 16) & 0xFF) * 1.1 + 30);

                int g = (int) (((argb >> 8) & 0xFF) * 1.1 + 30);

                int b = (int) (((argb >> 0) & 0xFF) * 1.1 + 30);

                if (r >= 255) {

                    r = 255;

                }

                if (g >= 255) {

                    g = 255;

                }

                if (b >= 255) {

                    b = 255;

                }

                gray[x][y] = (int) Math

                        .pow((Math.pow(r, 2.2) * 0.2973 + Math.pow(g, 2.2)

                                * 0.6274 + Math.pow(b, 2.2) * 0.0753), 1 / 2.2);

            }

        }

        // 二值化

        int threshold = ostu(gray, w, h);

        BufferedImage binaryBufferedImage = new BufferedImage(w, h,

                BufferedImage.TYPE_BYTE_BINARY);

        for (int x = 0; x < w; x++) {

            for (int y = 0; y < h; y++) {

                if (gray[x][y] > threshold) {

                    gray[x][y] |= 0x00FFFF;

                } else {

                    gray[x][y] &= 0xFF0000;

                }

                binaryBufferedImage.setRGB(x, y, gray[x][y]);

            }

        }

        // 矩阵打印

        for (int y = 0; y < h; y++) {

            for (int x = 0; x < w; x++) {

                if (isBlack(binaryBufferedImage.getRGB(x, y))) {

                    System.out.print("*");

                } else {

                    System.out.print(" ");

                }

            }

            System.out.println();

        }

        ImageIO.write(binaryBufferedImage, "jpg",

                new File(destDir, sfile.getName()));

    }

    public static boolean isBlack(int colorInt) {

        Color color = new Color(colorInt);

        if (color.getRed() + color.getGreen() + color.getBlue() <= 300) {

            return true;

        }

        return false;

    }

    public static boolean isWhite(int colorInt) {

        Color color = new Color(colorInt);

        if (color.getRed() + color.getGreen() + color.getBlue() > 300) {

            return true;

        }

        return false;

    }

    public static int isBlackOrWhite(int colorInt) {

        if (getColorBright(colorInt) < 30 || getColorBright(colorInt) > 730) {

            return 1;

        }

        return 0;

    }

    public static int getColorBright(int colorInt) {

        Color color = new Color(colorInt);

        return color.getRed() + color.getGreen() + color.getBlue();

    }

    public static int ostu(int[][] gray, int w, int h) {

        int[] histData = new int[w * h];

        // Calculate histogram

        for (int x = 0; x < w; x++) {

            for (int y = 0; y < h; y++) {

                int red = 0xFF & gray[x][y];

                histData[red]++;

            }

        }

        // Total number of pixels

        int total = w * h;

        float sum = 0;

        for (int t = 0; t < 256; t++)

            sum += t * histData[t];

        float sumB = 0;

        int wB = 0;

        int wF = 0;

        float varMax = 0;

        int threshold = 0;

        for (int t = 0; t < 256; t++) {

            wB += histData[t]; // Weight Background

            if (wB == 0)

                continue;

            wF = total - wB; // Weight Foreground

            if (wF == 0)

                break;

            sumB += (float) (t * histData[t]);

            float mB = sumB / wB; // Mean Background

            float mF = (sum - sumB) / wF; // Mean Foreground

            // Calculate Between Class Variance

            float varBetween = (float) wB * (float) wF * (mB - mF) * (mB - mF);

            // Check if new maximum found

            if (varBetween > varMax) {

                varMax = varBetween;

                threshold = t;

            }

        }

        return threshold;

    }

}

Java OCR tesseract 图像智能字符识别技术 Java实现的更多相关文章

Java OCR tesseract 图像智能字符识别技术 Java代码实现
接着上一篇OCR所说的,上一篇给大家介绍了tesseract 在命令行的简单用法,当然了要继承到我们的程序中,还是需要代码实现的,下面给大家分享下java实现的例子. 拿代码扫描上面的图片,然后输出结 ...
Java OCR tesseract 图像智能字符识别技术
公司有需求啊,所以就得研究哈,最近公司需要读验证码,于是就研究起了图像识别,应该就是传说中的(OCR:光学字符识别OCR),下面把今天的收获整理一个给大家做个分享. 本人程序用的tesseract,官 ...
java整理软件--- Java OCR 图像智能字符识别技术，可识别中文,但是验证码不可以识别...已测识别中文效果很好
国内最专业的OCR软件只有2家,清华TH-OCR和汉王OCR,看了很多的OCR技术发现好多对英文与数字的支持都很好,可惜很多都不支持中文字符.Asprise-OCR,Tesseract 3.0以前的 ...
Java OCR 图像智能字符识别技术，可识别中文
http://www.open-open.com/lib/view/open1363156299203.html
【OCR系列之一】字符识别技术总览
最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解.所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解. 什么是OCR? OC ...
【OCR技术系列之一】字符识别技术总览
最近入坑研究OCR,看了比较多关于OCR的资料,对OCR的前世今生也有了一个比较清晰的了解.所以想写一篇关于OCR技术的综述,对OCR相关的知识点都好好总结一遍,以加深个人理解. 什么是OCR? OC ...
JAVA OCR图片识别
今天闲来无聊,尝试了一下OCR识别,尝试了以下三种方案: 1.直接使用业界使用最广泛的Tesseract-OCR. Tesseract项目最初由惠普实验室支持,1996年被移植到Windows上,19 ...
【OCR技术系列一】光学字符识别技术介绍
注:此篇内容主要是综合整理了光学字符识别和OCR技术系列之一]字符识别技术总览,详情见文末参考文献什么是 OCR? OCR(Optical Character Recognition,光学字符识别 ...
Java中导入导出Excel -- POI技术
一.介绍: 当前B/S模式已成为应用开发的主流,而在企业办公系统中,常常有客户这样子要求:你要把我们的报表直接用Excel打开(电信系统.银行系统).或者是:我们已经习惯用Excel打印.这样在我们实 ...

随机推荐

[转载]GDB十分钟教程
转自:http://blog.csdn.net/liigo/article/details/582231/ GDB十分钟教程作者: liigo原文链接: http://blog.csdn.net/l ...
Java双向链表实现
public class DoublyLinkList { private class Data{ private Object obj; private Data left = null; priv ...
Redis主备复制
Redis 支持 Master-Slave(主从)模式,Redis Server 可以设置为另一个 Redis Server 的主机(从机),从机定期从主机拿数据.特殊的,一个从机同样可以设置为一个 ...
[记录]java.math.biginteger cannot be cast to java.lang.long
可以直接使用BigInteger类型进行接收, BigInteger id = (BigInteger)QueryRunner(conn,"SELECT LAST_INSERT_ID&quo ...
【转】为 XmlNode.SelectNodes 加上排序功能
测试资料: <Config> <Item a='/> <Item a='/> <Item a='/> <Item a='/> <Ite ...
一点关于this的理解
关于this,是很多前端面试必考的题目,有时候在网上看到这些题目,自己试了一下,额,还真的错了!在实际开发中,也会遇到 this 的问题(虽然一些类库会帮我们处理),例如在使用一些框架的时候,例如:k ...
Spring分布式事务实现（适用于spring-tx 2.5）
http://log-cd.iteye.com/blog/807607 分布式事务是指操作多个数据库之间的事务,spring的org.springframework.transaction.jta.J ...
Web应用程序安全必须重视八大问题
摘自:http://netsecurity.51cto.com/art/201402/428709.htm 对于任何一个项目,开始阶段对于交付安全的应用来说非常关键.适当的安全要求会导致正确的安全设计 ...
启用Win8(中文版/核心版)中被阉割的远程桌面服务端
Windows 8/8.1 标准版(中文版/核心版)中取消了远程桌面服务端,想通过远程连接到自己的电脑就很麻烦了,第三方远程桌面速度又不理想(如TeamViewer).通过以下方法可让系统恢复远程桌面 ...
第二十六篇、因为自定item(nav)而使系统右滑返回手势失效的解决方法
@interface ViewController () <uigesturerecognizerdelegate> @end@implementation ViewController ...

Java OCR tesseract 图像智能字符识别技术 Java实现

Java OCR tesseract 图像智能字符识别技术 Java实现的更多相关文章

随机推荐

热门专题