C#使用OneNote的图片文字识别功能（OCR）

http://www.cnblogs.com/Charltsing/p/OneNoteOCR.html

有需要技术咨询的，联系QQ564955427

前段时间有人问我能不能通过OneNote扫描图片，并返回文本。经过几天的测试，以及对网上若干个代码的测试，写了一个OneNote 2013下的OCR导入导出工具。

在测试的时候，发现OneNote 2013 提供的API还是有一些问题的，总结如下：

1、OneNote 2013务必升级到最新版，否则调用API的时候，可能会发生异常。本人目前的版本是15.0.4787.1000简体中文版。

2、扫描的语言支持中文和英文，简体版当然默认使用中文识别，但貌似没有办法修改默认语言。也许只能通过修改控制面板中的语言及地区才可以。

3、通过OneNote API做扫描步骤也不复杂，一般都是三~四步，

onenoteApp.CreateNewPage 建立新page

onenoteApp.UpdatePageContent 加入图片的base64数据

onenoteApp.GetPageContent 从返回的XML里面提取OCR Data文本

onenoteApp.DeleteHierarchy 删除新建的page

4、有一些需要注意的问题：

OneNote扫描图片功能如果没有禁用的话，是自动进行的，而且不能获知什么时候识别完毕。只能通过延时语句来估计时间。

onenoteApp.DeleteHierarchy 不太可靠，有的时候没有删除新建的page。建议增加Dispose删除多出来的page（通过title识别即可）

OneNote的DLL不支持嵌入资源，所以不同版本的OneNote需要引用不同的DLL，这可能会给程序的发布带来一些问题。

下图是OneNote2010的识别结果

OneNote2013识别情况要略好些。

***************************************************************************************

最后我把这个OCR封装到了XLL里面，给Excel vba调用，方便批量识别图片文本，并存入Excel。VBA调用代码如下：

C#使用OneNote的图片文字识别功能（OCR）的更多相关文章

小试Office OneNote 2010的图片文字识别功能（OCR）
原文:小试Office OneNote 2010的图片文字识别功能(OCR) 自Office 2003以来,OneNote就成为了我电脑中必不可少的软件,它集各种创新功能于一身,可方便的记录下各种类型 ...
Python图像处理之图片文字识别（OCR）
OCR与Tesseract介绍将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同 ...
python3 图片文字识别
最近用到了图片文字识别这个功能,从网上搜查了一下,决定利用百度的文字识别接口.通过测试发现文字识别率还可以.下面就测试过程简要说明一下 1.注册用户链接:https://login.bce.baid ...
JAVA的图片文字识别技术
从2013年的记录看,JAVA中图片文字识别技术大部分采用ORC的tesseract的软件功能,后来渐渐开放了java-api调用接口. 图片文字识别技术,还是采用训练的方法.并未从根本上解决图片与文 ...
一篇文章搞定百度OCR图片文字识别API
一篇文章搞定百度OCR图片文字识别API https://www.jianshu.com/p/7905d3b12104
刚破了潘金莲的身份信息（图片文字识别），win7、win10实测可用(免费下载)
刚破了潘金莲的身份信息(图片文字识别),win7.win10实测可用效果如下: 证照,车牌.身份证.名片.营业执照等图片文字均可识别电脑版本人出品大小1.3MB 下载地址:https://p ...
Python人工智能之图片识别，Python3一行代码实现图片文字识别
1.Python人工智能之图片识别,Python3一行代码实现图片文字识别 2.tesseract-ocr安装包和中文语言包注意:
【图片识别】java 图片文字识别 ocr （转）
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
【原】Coursera—Andrew Ng机器学习—课程笔记 Lecture 18—Photo OCR 应用实例:图片文字识别
Lecture 18—Photo OCR 应用实例:图片文字识别 18.1 问题描述和流程图 Problem Description and Pipeline 图像文字识别需要如下步骤: 1.文字侦测 ...

随机推荐

fedora 28/29 配置 C++ 环境
最近使用C++ 开发更换机器的时候,还要重新配置一下 gnu 工具链.于是简单进行了安装了一下: yum install gcc yum install gcc-c++ yum install g ...
windows平台下实现高可用性和可扩展性-ARR和HLB
本文档提供了关于如何将应用程序请求路由(ARR)与硬件负载均衡器一起使用以实现高可用性和可伸缩性的说明性指导.本文采用F5大IP负载均衡器来说明ARR与硬件负载平衡器之间的工作关系. IIS7.0及以 ...
Shell脚本中的测试开关和特殊参数
1. 测试开关 Shell中自带的一些测试指令, 下表列出这些测试指令的含义以及是否可用于 test命令, bash, ksh. 开关 test bash ksh 定义 -a FILE 支持支持 ...
怎样用命令行开启或关闭Windows服务
怎样用命令行开启或关闭Windows服务本篇博客主要包含一个内容: 怎样用命令行开启或关闭Windows服务闲话少叙,直奔主题. 1.在桌面右击新建一个文本文档,然后打开. 2.找到需要开启或关闭 ...
Maven将中央仓库修改为阿里云的仓库地址
<mirror> <id>nexus-aliyun</id> <mirrorOf>*</mirrorOf> <name>Nexu ...
[找工作] 2019秋招｜从春招到秋招，Java岗经验总结（收获AT）
转自(有更多) https://blog.csdn.net/zj15527620802/article/month/2018/10 前言找工作是一件辛酸而又难忘的历程.经历过焦虑.等待.希望,我们最 ...
转://Oracle Golden Gate 概念和原理
引言:Oracle Golden Gate是Oracle旗下一款支持异构平台之间高级复制技术,是Oracle力推一种HA高可用产品,简称“OGG”,可以实现Active-Active 双业务中心架构 ...
C. Nice Garland
题意: 就是有一串灯分别颜色是R,G,B.要求将每种颜色的灯相隔2个不同的灯.比如,RGR变成RGB才叫好看. 分析: RGB有6种排列,分别是:"RGB", "RBG& ...
ganache与metamask
1.其实ganache其实就相当于一个私有链ganache安装,这个是图形化界面的: 2.(testRpc跟他其实是一个用处,有一个即可,只不过testRpc是非图形化界面.要注意两者都仅运行在內存中 ...
WPF Binding学习(四) 绑定各种数据源
转自:http://blog.csdn.net/lisenyang/article/details/18312199 1.集合作为数据源首先我们先创建一个模型类 public class Stude ...

C#使用OneNote的图片文字识别功能（OCR）

C#使用OneNote的图片文字识别功能（OCR）的更多相关文章

随机推荐

热门专题