简述

最近开发一个项目需要用到Ocr文字识别技术来识别手写文字,在评估过程中体验了百度的文字识别和腾讯的文字识别。查找官方开发文档,发现它们都有印刷体和手写体两种符合项目需求的识别模式,但是腾讯的手写体模式并没找到sdk,只能直接根据文档手动post请求并返回结果,但网上却找不到具体的例子,导致进行过程中出现了一些小困难。这篇文章主要记录一下在Android Studio中百度Ocr的用法(主要参考官方文档)。下篇文章记录腾讯Ocr的用法。

通用识别模式(高精度版)

1.首先需要下载百度文字识别的sdk。SDK下载页面

2.解压缩下载的包,然后进入libs目录,找到ocr-sdk.jar,复制到工程的libs目录下,然后点击Android Studio的Build->Edit Libralies and Dependencies...,点击+号,再点击jar dependency,找到ocr-sdk.jar并添加即可。

3.查看下载的包的libs目录下,发现有armeabi,arm64-v8a,armeabi-v7a,x86这几个文件夹,选择自己设备对应的文件夹,复制到android studio工程src/main/jniLibs目录中,如果不知道设备的arm架构,可以用Android Studio连接设备,然后在Android Studio的控制台中输入:

adb shell getprop ro.product.cpu.abi

即可查看当前设备的arm架构。

4.添加必要的权限:

<uses-permission android:name="android.permission.INTERNET" />
<uses-permission android:name="android.permission.READ_EXTERNAL_STORAGE"/>
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>

注意:android6.0以上需要申请动态权限。

5.如果在自己的工程中集成SDK,为了防止release发布时打包报错,需要在Proguard配置文件中增加:

-keep class com.baidu.ocr.sdk.**{*;}
-dontwarn com.baidu.ocr.**

6.在代码中初始化sdk:

    /**
* 用明文ak,sk初始化
*/
private void initAccessTokenWithAkSk() {
OCR.getInstance(mContext).initAccessTokenWithAkSk(new OnResultListener<AccessToken>() {
@Override
public void onResult(AccessToken result) {
String token = result.getAccessToken();
hasGotToken = true; //用来判断是否成功获取授权
ocrNormal(); //开始文字识别(为了简单起见,直接在这里进行文字识别,实际上使用看项目需要进行判断token)
} @Override
public void onError(OCRError error) {
error.printStackTrace();
}
}, mContext.getApplicationContext(), "替换成你的Api Key", "替换成你的Secret Key");
}

Api Key和Secret Key需要去百度开放平台注册获取(百度ai开放平台)。还有一种安全模式授权这里不详说了。

7.开始文字识别:

   private void ocrNormal() {
// 通用文字识别参数设置
GeneralBasicParams param = new GeneralBasicParams();
param.setDetectDirection(true);
//这里调用的是本地文件,使用时替换成你的本地文件
File file=getBitmapFile(mBitmap);
param.setImageFile(file);
// 调用通用文字识别服务
OCR.getInstance(mContext).recognizeAccurateBasic(param, new OnResultListener<GeneralResult>() {
@Override
public void onResult(GeneralResult result) {
StringBuilder sb = new StringBuilder();
// 调用成功,返回GeneralResult对象
for (WordSimple wordSimple : result.getWordList()) {
// wordSimple不包含位置信息
WordSimple word = wordSimple;
sb.append(word.getWords());
//sb.append("\n");
}
//file.delete();
//String返回
ocrResult = sb.toString();
// json格式返回字符串result.getJsonRes())
} @Override
public void onError(OCRError error) {
// 调用失败,返回OCRError对象
}
});
}

手写体文字识别

手写体文字识别只需要把上述调用的方法ocrNormal()修改为ocrHandwrite(),然后第7步修改为以下即可:

 private void orcHandwrite() {
// 通用文字识别参数设置
OcrRequestParams param = new OcrRequestParams();
File file=getBitmapFile(mBitmap);
param.setImageFile(file);
// 调用通用文字识别服务
OCR.getInstance(mContext).recognizeHandwriting(param, new OnResultListener<OcrResponseResult>() {
@Override
public void onResult(OcrResponseResult ocrResponseResult) {
//file.delete();
// json格式返回字符串
ocrResult = ocrResponseResult.getJsonRes();
}
@Override
public void onError(OCRError ocrError) { }
});
}

其中ocrResult返回的是json格式的字符串,需要自己去转换成jsonObject然后读取需要的数据。

两种模式比较

为了比较他们的准确度,我测试了印刷体和手写体两种文字的多个样例,发现一般情况下,都是高精度的普通印刷体模式识别准确率比较高,但是在比较潦草的情况下,手写体识别率比较高(这只是相对而言,实际上潦草字在很多情况下两种模式都未识别成功),所以得出结论,大部分情况下用高精度印刷体文字识别模式即可。

百度Ocr文字识别的更多相关文章

  1. 百度OCR 文字识别 Android安全校验

    百度OCR接口使用总结: 之前总结一下关于百度OCR文字识别接口的使用步骤(Android版本 不带包名配置 安全性弱).这边博客主要介绍,百度OCR文字识别接口,官方推荐使用方式,授权文件(安全模式 ...

  2. 百度OCR文字识别-Android安全校验

    本文转载自好基友upuptop:https://blog.csdn.net/pyfysf/article/details/86438769 效果图: 如下为文章正文: 百度OCR接口使用总结:之前总结 ...

  3. 百度OCR文字识别-身份证识别

    简介 一.介绍 身份证识别 API 接口文档地址:http://ai.baidu.com/docs#/OCR-API/top 接口描述 用户向服务请求识别身份证,身份证识别包括正面和背面. 请求说明 ...

  4. 百度OCR文字识别API使用心得===com.baidu.ocr.sdk.exception.SDKError[283604]

    异常com.baidu.ocr.sdk.exception.SDKError[283604]App identifier unmatch.错误的packname或bundleId.logId::303 ...

  5. PHP:基于百度大脑api实现OCR文字识别

    有个项目要用到文字识别,网上找了很多资料,效果不是很好,偶然的机会,接触到百度大脑.百度大脑提供了很多解决方案,其中一个就是文字识别,百度提供了三种文字识别,分别是银行卡识别.身份证识别和通用文字识别 ...

  6. 小白学Python——用 百度AI 实现 OCR 文字识别

    百度AI功能还是很强大的,百度AI开放平台真的是测试接口的天堂,免费接口很多,当然有量的限制,但个人使用是完全够用的,什么人脸识别.MQTT服务器.语音识别等等,应有尽有. 看看OCR识别免费的量 快 ...

  7. Android OCR文字识别 实时扫描手机号(极速扫描单行文本方案)

    身份证识别:https://github.com/wenchaosong/OCR_identify 遇到一个需求,要用手机扫描纸质面单,获取面单上的手机号,最后决定用tesseract这个开源OCR库 ...

  8. OCR文字识别笔记总结

    OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本 ...

  9. 怎么给OCR文字识别软件重编文档页面号码

    ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,在FineReader文档中,页面的加载顺序即是页面的导入顺序,完成导入之后,文档的所有页面均会被编号,各编号会 ...

随机推荐

  1. (转)9 db2trc案例2(1,2)

    原文:http://book.51cto.com/art/200906/130068.htm 9.3.3  db2trc案例2(1) 在AIX操作系统上,系统原先运行良好,而后用户从DB2 V8 FP ...

  2. 广度优先遍历-BFS、深度优先遍历-DFS

    广度优先遍历-BFS 广度优先遍历类似与二叉树的层序遍历算法,它的基本思想是:首先访问起始顶点v,接着由v出发,依次访问v的各个未访问的顶点w1 w2 w3....wn,然后再依次访问w1 w2 w3 ...

  3. npm 安装 cannot find module

    window7安装module出现 Connot find module 'xxx' 解决办法: 添加环境变量命名为:NODE_PATH 设置值为:%AppData%\npm\node_modules ...

  4. android app性能优化大汇总(google官方Android性能优化典范 - 第3季)

    (1)Fun with ArrayMaps 程序内存的管理是否合理高效对应用的性能有着很大的影响,有的时候对容器的使用不当也会导致内存管理效率低下.Android为移动操作系统特意编写了一些更加高效的 ...

  5. JavaScrip t对象和 JSON 数据格式转换

    <script> //定义一个js对象 var person = { firstName: "John", lastName: "Doe", age ...

  6. Git 撤销与修改

    增补提交 git commit –C HEAD –a --amend -C表示复用指定提交的提交留言,这个例子中是HEAD,实际上可以指定其他有效的提交名称. 如果参数是小写的-c,就会打开预先设置好 ...

  7. Golang 反射reflection

    反射reflection 反射可大大提高程序的灵活性,使得interface{}有更大的发挥余地 反射使用TypeOf和ValueOf函数从接口中获取目标对象信息 反射会将匿名字段作为独立字段(匿名字 ...

  8. js闭包应用

    先来看一个例子: function foo() { var a = 10; function bar() { a *= 2; return a; } return bar; } var baz = f ...

  9. windows开机提示文件损坏

    今早按部就班的开机,然后准备吃热干面,很多时候事情都是同步进行的... 然后眼前出现这样一个界面 心情果断灰暗下来,按照提示一步步操作,点enter进入高级选项,试过了安全模式启动.最后一次正确配置启 ...

  10. 从零开始学JAVA(09)-使用SpringMVC4 + Mybatis + MySql 例子(注解方式开发)

    项目需要,继续学习springmvc,这里加入Mybatis对数据库的访问,并写下一个简单的例子便于以后学习,希望对看的人有帮助.上一篇被移出博客主页,这一篇努力排版整齐,更原创,希望不要再被移出主页 ...