OCR 识别文字项目

该项目可以进行两种方式进行身份证识别

1. 使用百度接口

1.1 application-dev.yml配置

ocr:

  # 使用baiduOcr 需要有Ocr服务器 使用百度需要相应的百度账号即可

  useOcrType: baiduOcr

  # 需要OCR 的文件夹

  ocrFolderPath: E:\ocr-wait-image\16210910333-8e2fa7f52db04a538ed584c919ce33b1

  # 需要OCR 的文件

  ocrFile: H:\Desktop\test\14.jpg

  # 百度OCR 配置  https://cloud.baidu.com/doc/OCR/s/Nkibizxlf

  baiduOcr:

    # 使用token 形式

    useToken: false

    # 使用卡证识别接口 卡证识别一天500次免费（识别率高推荐） 通用识别50000次免费（识别率较低）

    useIdCard: true

    # 使用token 形式调用接口 token 通过接口获取（推荐使用sdk模式）

    token: XXXXXXXX

    idCardUrl: https://aip.baidubce.com/rest/2.0/ocr/v1/idcard

    idCardPrefix: id_card_side=front&image=

    generalBasicUrl: https://aip.baidubce.com/rest/2.0/ocr/v1/general_basic

    generalBasicPrefix: image=

    # 不使用token sak形式调用接口（通过百度账号创建应用获取）

    appId: XXXXXXXXXX

    apiKey: XXXXXXXXXX

    secretKey: XXXXXXXXXX

1.2 创建百度应用

填入必填项即可

再次出来即有一个创建的应用

以上配置的appId,apiKey,secretKey 三项在这里获取

1.3 结果显示

获得结果会保存在这个文件夹

1.3 使用百度免费OCR 项目配置结束

1.4 主要代码展示

package com.ocr.baidu;

import com.baidu.aip.ocr.AipOcr;

import com.framework.config.OcrConfig;

import com.utils.Base64Util;

import com.utils.FileUtil;

import com.utils.HttpUtil;

import lombok.extern.slf4j.Slf4j;

import org.json.JSONObject;

import java.net.URLEncoder;

import java.nio.charset.StandardCharsets;

import java.util.HashMap;

@Slf4j

public class BaiduOCRUtils {

    /**

     * 卡证识别

     */

    public static String idCardByToken(OcrConfig.BaiduOcr baiduOcr,String filePath) {

        String idCardPrefix = baiduOcr.getIdCardPrefix();

        String idCardUrl = baiduOcr.getIdCardUrl();

        String token = baiduOcr.getToken();

        // 请求url

        try {

            // 本地文件路径

            byte[] imgData = FileUtil.readFileByBytes(filePath);

            String imgStr = Base64Util.encode(imgData);

            String imgParam = URLEncoder.encode(imgStr, StandardCharsets.UTF_8.name());

            String param = idCardPrefix + imgParam;

            // 注意这里仅为了简化编码每一次请求都去获取access_token，线上环境access_token有过期时间， 客户端可自行缓存，过期后重新获取。

            return  HttpUtil.post(idCardUrl, token, param);

        } catch (Exception e) {

            log.error(e.getMessage());

            e.printStackTrace();

        }

        return null;

    }

    /**

     * 通用文字识别

     */

    public static String generalBasicByToken(OcrConfig.BaiduOcr baiduOcr,String filePath) {

        String generalBasicPrefix = baiduOcr.getGeneralBasicPrefix();

        String generalBasicUrl = baiduOcr.getGeneralBasicUrl();

        String token = baiduOcr.getToken();

        // 请求url

        try {

            // 本地文件路径

            byte[] imgData = FileUtil.readFileByBytes(filePath);

            String imgStr = Base64Util.encode(imgData);

            String imgParam = URLEncoder.encode(imgStr, StandardCharsets.UTF_8.name());

            String param = generalBasicPrefix + imgParam;

            // 注意这里仅为了简化编码每一次请求都去获取access_token，线上环境access_token有过期时间， 客户端可自行缓存，过期后重新获取。

            return HttpUtil.post(generalBasicUrl, token, param);

        } catch (Exception e) {

            log.error(e.getMessage());

            e.printStackTrace();

        }

        return null;

    }

    /**

     * 通用文字识别 sdk

     */

    public static JSONObject generalBasicBySdk(OcrConfig.BaiduOcr baiduOcr,String filePath) {

        String appId = baiduOcr.getAppId();

        String apiKey = baiduOcr.getApiKey();

        String secredKey = baiduOcr.getSecretKey();

        AipOcr client = new AipOcr(appId, apiKey, secredKey);

        // 可选：设置网络连接参数

        client.setConnectionTimeoutInMillis(2000);

        client.setSocketTimeoutInMillis(60000);

        return client.basicGeneral(filePath, new HashMap<>());

    }

    /**

     * 身份证文字识别 sdk

     */

    public static JSONObject idCardBySdk(OcrConfig.BaiduOcr baiduOcr,String filePath) {

        String appId = baiduOcr.getAppId();

        String apiKey = baiduOcr.getApiKey();

        String secredKey = baiduOcr.getSecretKey();

        AipOcr client = new AipOcr(appId, apiKey, secredKey);

        // 可选：设置网络连接参数

        client.setConnectionTimeoutInMillis(2000);

        client.setSocketTimeoutInMillis(60000);

        return client.idcard(filePath,"front", new HashMap<>());

    }

}

2. 使用百度开源项目PaddleHub

PS: 识别通过paddle（python 运行），JAVA 进行结果处理

2.1 按照教程安装PaddleHub

2.2 application-dev.yml配置

ocr:

  paddleOcr:

    # 使用本地

    url: 192.168.0.106

    port: 8866

    moduleMap:

      # 文字识别OCR 安装 https://www.paddlepaddle.org.cn/hubdetail?name=chinese_ocr_db_crnn_mobile&en_category=TextRecognition

      chinese_ocr_db_crnn_mobile: 1.1.1

      # 人脸识别OCR（识别身份证正面或手持身份证） 安装  https://www.paddlepaddle.org.cn/hubdetail?name=pyramidbox_lite_server&en_category=FaceDetection

      pyramidbox_lite_server: 1.2.0

    # 是否分析

    analysis: false

2.3 结果显示

获得结果会保存在这个文件夹

2.4 主要代码展示

package com.ocr.paddle;

import com.alibaba.fastjson.JSONArray;

import com.alibaba.fastjson.JSONObject;

import com.google.common.collect.Lists;

import com.ocr.paddle.domain.LocalHubOcrResultDTO;

import com.ocr.paddle.domain.OCRHubResultDTO;

import com.utils.Base64Util;

import com.utils.FileUtil;

import com.utils.HttpClientUtils;

import lombok.extern.slf4j.Slf4j;

import org.apache.commons.lang3.StringUtils;

import java.io.File;

import java.io.IOException;

import java.util.List;

import java.util.Map;

import java.util.stream.Collectors;

@Slf4j

public class LocalHubOcrUtils {

    public static List<LocalHubOcrResultDTO> localAllOcr(String textUrl, String faceUrl, List<File> allFiles) {

        long l = System.currentTimeMillis();

        List<LocalHubOcrResultDTO> localOcrResultDTOList = Lists.newArrayList();

        int urlCount = 0;

        boolean useTextUrl = false;

        boolean useFaceUrl = false;

        if (StringUtils.isEmpty(textUrl)) {

            log.info("不进行文字识别");

        } else {

            urlCount++;

            useTextUrl = true;

            log.info("需要进行文字识别");

        }

        if (StringUtils.isEmpty(faceUrl)) {

            log.info("不进行人脸识别");

        } else {

            urlCount++;

            useFaceUrl = true;

            log.info("需要进行人脸识别");

        }

        int ocrCount = allFiles.size() * urlCount;

        log.info("预估进行OCR" + ocrCount + "次");

        if (ocrCount == 0) {

            return localOcrResultDTOList;

        }

        int textIndex = 0;

        int faceIndex = 0;

        // 本地文件路径

        Map<String, String> partentFile = allFiles.stream().collect(Collectors.toMap(File::getName, File::getParent, (e1, e2) -> e1));

        for (File imageFile : allFiles) {

            List<OCRHubResultDTO> ocrHubResultDTOS = Lists.newArrayList();

            byte[] imgData = new byte[0];

            try {

                imgData = FileUtil.readFileByBytes(imageFile);

            } catch (IOException e) {

                log.error("图片读取错误");

                continue;

            }

            String imgStr = Base64Util.encode(imgData);

            JSONObject jsonObject = new JSONObject();

            List<String> imageParams = Lists.newArrayList();

            imageParams.add(imgStr);

            jsonObject.put("images", imageParams);

            String textResult = "";

            if (useTextUrl) {

                textResult = HttpClientUtils.sendJsonStr(textUrl, jsonObject.toJSONString());

                textIndex++;

                log.info("已进行文字OCR" + textIndex + "次");

                if (StringUtils.isEmpty(textResult)) {

                    log.error("获取文字接口失败");

                    log.info("还需进行" + (ocrCount - faceIndex - textIndex) + "次");

                    continue;

                }

                JSONObject resultTest = (JSONObject) JSONObject.parse(textResult);

                JSONArray textResultsArray = resultTest.getJSONArray("results");

                if (textResultsArray == null){

                    log.error("返回值错误，错误信息为：" + textResult);

                }

                for (Object o : textResultsArray) {

                    JSONObject j = (JSONObject) o;

                    JSONArray data = j.getJSONArray("data");

                    for (Object datum : data) {

                        JSONObject jo = (JSONObject) datum;

                        jo.remove("text_box_position");

                        OCRHubResultDTO ocrHubResultDTO = jo.toJavaObject(OCRHubResultDTO.class);

                        ocrHubResultDTOS.add(ocrHubResultDTO);

                    }

                }

            }

            int faceCount = 0;

            String faceResult = "";

            if (useFaceUrl) {

                faceResult = HttpClientUtils.sendJsonStr(faceUrl, jsonObject.toJSONString());

                faceIndex++;

                log.info("已进行人脸OCR" + faceIndex + "次");

                if (StringUtils.isEmpty(faceResult)) {

                    log.error("获取人脸识别接口失败");

                    log.info("还需进行" + (ocrCount - faceIndex - textIndex) + "次");

                    continue;

                }

                JSONObject resultFace = (JSONObject) JSONObject.parse(faceResult);

                JSONArray faceResultsArray = resultFace.getJSONArray("results");

                for (Object o : faceResultsArray) {

                    JSONObject j = (JSONObject) o;

                    JSONArray data = j.getJSONArray("data");

                    faceCount = data.size();

                }

            }

            log.info("还需进行" + (ocrCount - faceIndex - textIndex) + "次");

            localOcrResultDTOList.add(new LocalHubOcrResultDTO(imageFile.getAbsolutePath(), imageFile.getParent(), ocrHubResultDTOS, faceCount));

        }

        log.info("OCR 总耗时" + (System.currentTimeMillis() - l) / 1000 + "S");

        log.info("OCR 次数" + ocrCount + "次");

        log.info("OCR 平均耗时" + (System.currentTimeMillis() - l) / 1000 / ocrCount + "s");

        return localOcrResultDTOList;

    }

    private static void func(File file, List<File> fileList) {

        File[] fs = file.listFiles();

        for (File f : fs) {

            if (f.isDirectory()) {

                //若是目录，则递归打印该目录下的文件

                func(f, fileList);

            }

            if (f.isFile()) {

                String imageName = f.getName();

                boolean isJpg = imageName.endsWith(".jpg");

                boolean isJPG = imageName.endsWith(".JPG");

                boolean isPng = imageName.endsWith(".png");

                if (isJPG || isPng || isJpg) {

                    //若是图片加入列表

                    fileList.add(f);

                }

            }

        }

    }

}

sJpg = imageName.endsWith(".jpg");
boolean isJPG = imageName.endsWith(".JPG");
boolean isPng = imageName.endsWith(".png");
if (isJPG || isPng || isJpg) {
//若是图片加入列表
fileList.add(f);
}
}
}
}
}

原文章：https://blog.csdn.net/AirOrange_qi/article/details/112102739

JAVA 进行图片中文字识别（准确度高）！！！的更多相关文章

JAVA的图片文字识别技术
从2013年的记录看,JAVA中图片文字识别技术大部分采用ORC的tesseract的软件功能,后来渐渐开放了java-api调用接口. 图片文字识别技术,还是采用训练的方法.并未从根本上解决图片与文 ...
java实现图片文字识别的两种方法
一.使用tesseract-ocr 1. https://github.com/tesseract-ocr/tesseract/wiki上下载安装包安装和简体中文训练文件 window64位安装 ...
识别率很高的java文字识别技术
java文字识别程序的关键是寻找一个可以调用的OCR引擎.tesseract-ocr就是一个这样的OCR引擎,在1985年到1995年由HP实验室开发,现在在Google.tesseract-ocr ...
【图片识别】java 图片文字识别 ocr （转）
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
java 图片文字识别 ocr
最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为java使用的demo 在此之前,使用这个工具需要在本地安装OCR工具: 下面一个是一定要安装的 ...
Java文字识别软件-调用百度ocr实现文字识别
java_baidu_ocr Java调用百度OCR文字识别API实现图片文字识别软件这是一款小巧方便,强大的文字识别软件,由Java编写,配上了窗口界面调用了百度ocr文字识别API 识别精度高 ...
识别图片中文字（百度AI）
这个是百度官方的文档 https://ai.baidu.com/docs#/OCR-API/top 通用的文字识别,如果是其他的含生僻字/含位置信息的版本,请参考官方的文档,只 ...
Android OCR文字识别实时扫描手机号（极速扫描单行文本方案）
身份证识别:https://github.com/wenchaosong/OCR_identify 遇到一个需求,要用手机扫描纸质面单,获取面单上的手机号,最后决定用tesseract这个开源OCR库 ...
借@阿里巴巴耍了个帅——HTML5 JavaScript实现图片文字识别与提取
写在前面 8月底的时候,@阿里巴巴推出了一款名为“拯救斯诺克”的闯关游戏,作为前端校园招聘的热身,做的相当不错,让我非常喜欢.后来又传出了一条消息,阿里推出了A-star(阿里星)计划,入职阿里的技 ...

随机推荐

TCP的三次握手和四次挥手和UDP协议
目录 TCP 三次握手四次挥手为什么建立连接是三次而断开连接是四次呢? TCP和UDP的区别 TCP数据包的封装 UDP数据包封装 SCTP SYN Flood泛洪攻击 TCP TCP(Trans ...
JWT(Json Web Token)认证
目录 JWT(Json Web Token) JWT的数据结构 JWT的用法 JWT验证流程
Intel汇编程序设计-高级过程（上）
第八章高级过程 8.1 简介本章主要讲: 堆栈框架变量作用域和生存期对战参数的类型通过传递值或者传递引用来传递参数在堆栈上创建和初始化局部变量递归编写多模块程序内存模型和语言关键字 ...
本地计算机上的Apple Mobile Device服务启动后停止。某些服务在未由其他服务或程序使用时将自动停止
解决办法:1.开始--运行--regedit.exe,打开注册表编辑器,删除以下两个键: HKEY_LOCAL_MACHINE\System\CurrentControlSet\Services\Wi ...
Arduino+DS18b20+OLED Display
DS18b20获取到温度数值保存到变量中,然后和天气图标还有滚动字幕一起发送到OLED 屏幕上显示需要用到的库均可在Arduino库管理器下载. 电路图: 图中屏幕接线已在代码中写出,温度传感器da ...
jquery常用操作整理
1.数据中添加或者删除指定元素 var arr=['red','yello','blue']; arr.push('green'); //添加元素 arr = $.grep(arr,functio ...
电脑进入bios和u盘启动快捷键
参考:http://www.jb51.net/os/78638.html 一:联想系列 1:联想笔记本电脑 Thinkpad idea 520 :关机状态下,在左下角用回形针捅小孔,知道出现bios ...
.NET之API版本控制
1. 优点有助于保护原有系统,不受影响,并及时修改问题可以实现用户的私人定制(比如是付费接口) 快速迭代 2. API版本控制在URL中追加版本或者作为查询字符串参数通过自动以标头和通过接受标 ...
【BUAA软工】Beta阶段设计与计划
一.需求再分析根据用户反馈,是否发现之前的需求分析有偏差?为什么会出现这种偏差?beta阶段你们是否能真的分析清楚用户需求?如何做到? 根据alpha阶段同学们以及课程组老师和助教的使用反馈,总结起 ...
[MySQL数据库之Navicat.pymysql模块、视图、触发器、存储过程、函数、流程控制]
[MySQL数据库之Navicat.pymysql模块.视图.触发器.存储过程.函数.流程控制] Navicat Navicat是一套快速.可靠并价格相当便宜的数据库管理工具,专为简化数据库的管理及降 ...

JAVA 进行图片中文字识别（准确度高）！！！