ABBYY FineReader 15(Windows系统)拥有强大的OCR识别功能,能对扫描仪或者数码相机等光学工具获取的图像进行识别,解析其中的文本、图像、表格、条形码等,方便用户进一步获取图像中的信息。

但由于设备或者拍摄时的客观因素影响,获取的图像可能并不是很理想的状态,比如图像可能会倾斜,识别的区域类型错误等,ABBYY FineReader 15 OCR文字识别软件配备了手动校正文档复杂结构的功能,更好地提高OCR的识别质量。接下来,小编以一个实例来演示一下手动校正文档的过程。

首先,要先把图像文件导入到软件的OCR编辑中,更为简便的方式是直接在“新任务窗口”的转换文档处使用“在OCR编辑器中打开”。

图1:打开OCR编辑器

第一步、 对图像进行自动识别

导入图像后,ABBYY FineReader 15 OCR文字识别软件的OCR编辑器会对图像进行预处理的识别。导入了一张包含两个页面的、方向倒置的图书照片,软件会自动将其页面分割,并将页面翻转至正确方向,然后对其中的文本、图像、表格等进行区域分类。

图2:图像识别

图3:图像识别后

第二步、 手动校正

在ABBYY FineReader 15 中,选中其中需要处理的图像,在“图像面板”处,可以看到图像中的右上角区域被定义为“图片”,但其中是包含有文本的,此时,就可以使用手动调整区域的功能。

图4:图片区域

·调整区域的边框,使用鼠标拖动图片区域的边框,将图片的文字部分减去。

图5:减去文本区域

·然后使用“图像面板”顶部工具栏的“新建区域”工具,新建文本区域。选择上一步中减去的文本区域,将其定义为文本,提高OCR识别的质量。

图6:新建的文本区域

·调整页面的属性,右击需要调整的区域,在其右击快捷菜单里选择“属性”,即可在图像面板的底部找到该区域的具体属性。选择其中的页脚文本,在其“功能属性”中,可将其定义为“页眉和页脚”。

图7:调整页面的属性

通过使用ABBYY FineReader 15 OCR文字识别软件的OCR识别功能,能帮助用户尽可能准确地获取到图像文件中的信息。通过预先识别+后期手动调整的方式,可帮助用户更有效地进行图像识别,既能减少不必要的简单重复劳动,也能发挥自我能动性。点击ABBYY FineReader教程即刻获取更多OCR识别技巧。

使用ABBYY FineReader 手动校正文档复杂结构的更多相关文章

  1. 如何使用ABBYY FineReader 手动管理文档区域

    在运用OCR编辑器时,ABBYY FineReader 15(Windows系统)OCR文字识别软件会对扫描仪或数码相机导入的图像进行识别和检测.在识别和检测之前,软件会自动对PDF文档中的文本.图片 ...

  2. ABBYY FineReader 15 PDF文档查看功能

    PDF文档查看功能是ABBYY FineReader 15(Windows系统)OCR文字识别软件中PDF编辑器的一项基础功能,可供用户查看,搜索PDF文档,无需进入编辑模式,也可复制其中的文本,图片 ...

  3. ABBYY FineReader 15 对比文档功能

    想必大家在办公的时候都有着要处理各种各样文档的烦恼,一个文档经过一个人或不同人的多次修订都是常有的事,拥有文档对比功能的软件也就应势而生.ABBYY FineReader 15 有许多能够帮助我们办公 ...

  4. ABBYY FineReader 15 PDF文档编辑功能详解

    ABBYY FineReader 15(Windows系统)OCR文字识别软件作为一款通用 PDF 工具,能轻松有效地对各种 PDF文档和纸质文档,进行数字化.检索.编辑.转换.包含.分享和合作,而其 ...

  5. HTML介绍、文档基本结构、meta标签、HTML标记的语法

    一.HTML的介绍 Hyper Text Mark-up Language 超文本标记语言,是一种描述性标记语言(不是编程语言),主要用于描述网页(可以有图像,文字,声音,等..)但没有交互性 HTM ...

  6. MFC单文档程序结构

    MFC单文档程序结构三方面: Doc MainFrame View

  7. 深入分析MFC文档视图结构(项目实践)

    k_eckel:http://www.mscenter.edu.cn/blog/k_eckel 文档视图结构(Document/View Architecture)是MFC的精髓,也是Observer ...

  8. MFC文档视图结构学习笔记

    文档/视图概述 为了统一和简化数据处理方法,Microsoft公司在MFC中提出了文档/视图结构的概念,其产品Word就是典型的文档/视图结构应用程序 MFC通过其文档类和视图类提供了大量有关数据处理 ...

  9. ABBYY 识别结果的文档怎么导出

    使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,识别结果可以保存至一个文件.复制到剪贴板或通过电子邮件发送.可以执行下列操作:导出整个文档.仅导出所选页面. ...

随机推荐

  1. 标签平滑(Label Smoothing)详解

    什么是label smoothing? 标签平滑(Label smoothing),像L1.L2和dropout一样,是机器学习领域的一种正则化方法,通常用于分类问题,目的是防止模型在训练时过于自信地 ...

  2. sql server DDL语句 建立数据库 定义表 修改字段等

    一.数据库:1.建立数据库 create database 数据库名;use 数据库名; create database exp1;use exp1; mysql同样 2.删除数据库 drop dat ...

  3. Eclipse IDE 使用指南:Git失误提交代码,撤销commit操作

    在Eclipse IDE使用Git Commit提交代码时把不需要的文件失误Commit了,比如.settings..classpath..project等文件. 如果是Commit提交代码到本地仓库 ...

  4. CF618F Double Knapsack

    题意简化 给定两个大小为 n 的集合A,B,要求在每个集合中选出一个子集,使得两个选出来的子集元素和相等 元素范围在 1~n ,n<=1e5 题目连接 题解 考虑前缀和 令A集合的前缀和为SA, ...

  5. vue-打包遇到的问题

    vue-打包 打包后用iframe引入的html文件乱码 原因: 解决:用live server打开就不会乱码 生产环境移除所有的console命令 三种解决方法 发现vue-cli3.0在打包过程中 ...

  6. 【CF1443F】Identify the Operations 题解

    原题链接 题意简介 建议去原题看.这题意我表达不清楚. 大概就是给你一个 n 的排列,现在要求你进行 m 次操作. 每次操作,你会在现有的排列中删去一个数,然后选择其左边或右边的一个与之相邻的数加入 ...

  7. 寻找性能更优秀的动态 Getter 和 Setter 方案

    反射获取 PropertyInfo 可以对对象的属性值进行读取或者写入,但是这样性能不好.所以,我们需要更快的方案. 方案说明 就是用表达式编译一个 Action<TObj,TValue> ...

  8. c#写入文件流

    using (FileStream wir=new FileStream(@"C:\Documents and Settings\Administrator\桌面\1.txt",F ...

  9. File 方法

    File类说明 存储在变量,数组和对象中的数据是暂时的,当程序终止时他们就会丢失.为了能够永 久的保存程序中创建的数据,需要将他们存储到硬盘或光盘的文件中.这些文件可以移动,传送,亦可以被其他程序使用 ...

  10. linux c语言编写一个shell壳

    目的:我们要用c语言编写一个shell可以运行在linux机器上的. 介绍:shell所在的层次 我们要做的是操作系统,用于用户与操作系统进行交互的myhsell 思路:用户输入  一行字符串,我们先 ...