ABBYY 是一家俄罗斯软件公司,在文档识别,数据捕获和语言技术的开发中居世界领先地位。其获奖产品 FineReader OCR 软件可以把静态纸文件和 PDF 文件转换成可管理的电子数据,可以大大节省您的时间和精力。2005年12月22日,ABBYY 美国宣布,ABBYY FineReader 8.0 专业版被美国著名计算机杂志《PC Magazine》授予4星。
识别率和版面
ABBYY FineReader 8.0 提供出色的识别率和版面还原,即使面对读取困难的或低品质的文档也如此。 FineReader 完美的获取并且重建所有的格式化要素(包括
分栏、表格、列表和图象) –你无需重新打字或重新排版。
OCR
可以将数码相机列入到移动文档捕获设备里。您可以使用数码相机获取文件并将其转换为可重用信息。
ABBYY FineReader 可以智能识别被拍摄的文档并且应用 ABBYY 的新的识别技术以保证数码相机图象能得到最佳的OCR[1] 结果。 因为有数码相机OCR, FineReader 提供了广泛的可能性来迅速获取文档并将其转换成可编辑和可搜索的电子文件,即使在您忙个不停的时候。使用数码相机来 OCR,您能不受传统扫描设备的限制。您能从大海报或从厚重、精装的文档,如书中获取文本,而这类文档是很难扫描的。另外,使用数码相机获取文档是非常高效的,比扫描快几倍。
PDF 转换
ABBYY FineReader 8.0 是一个理想的 PDF 转换工具。它在一个应用程序中提供三个不同的PDF转换功能:
1)、PDF编辑
打开 PDF 文件并且转换它成可编辑的格式(例如 Microsoft Word 或 Excel),执行少量正文编辑,然后保存回 PDF。
2)、纸上文档创建可搜索的 PDF 文件。
3)、加密 PDF
ABBYY FineReader 遵照了最新的加密标准。用 FineReader,您能创建加密的 PDF 文件,带有用先进加密标准(AES)创建的最高 128 位加密。FineReader 也遵从访问权限保护: 当打开一个 PDF 文件要转换时,FineReader 会提示用户在执行之前输入密码。
一键 OCR
用新增的自动操作管理器,您可用鼠标的唯一单击执行完全的转换任务。ABBYY FineReader 内置了针对最普通的文档处理流程的计划任务,包括扫描(及 OCR)到 Word,扫描到 PDF,及 PDF 到 Word。
您也可以使用自动化向导来创建您自己的自定义任务。向导会引导您通过创建新任务的步骤。任务可以在ABBYY FineReader 8.0 中使用命令和选项进行自定义和微调,因此您能迅速和容易地自动化甚至于最特别的任务。例如,您可以指定一个任务来扫描文档,载入模板,进行OCR,然后保存结果到 Word 和 PDF,并像原始图象一样,保存在不同的文件夹中。
自动任务可以容易地被导入和导出。一旦您创建了一些有用的自动任务,您可以将其导出为文件并与您的同事和朋友分享。
多语言识别
ABBYY FineReader 支持 179 种语言,包括英语、德语、法语、希腊语、西班牙语、意大利语、葡萄牙语、荷兰语,瑞典语,芬兰语,俄语,
乌克兰语,保加利亚语,捷克语,匈牙利语,波兰语、斯洛伐克语、马来语,
印度尼西亚语和其他。内置拼写检查可以支持其中36种语言。这为与各种各样不同的国家(地区)和文化打交道的人简化了文档转换过程。
注意:已推出简体中文专业版和企业版,完美支持中文。
多保存格式
当您转换文档来编辑时,ABBYY FineReader 8.0 可以直接地向您喜爱的应用导出结果,包括 Microsoft Word、Microsoft Excel、Microsoft PowerPoint、Lotus Word Pro、Corel WordPerfect、Sun StarWriter 和 Adobe Acrobat/Reader。另外,识别的的文本可以被保存为各种各样的文件格式,包括 PDF, HTML, Microsoft Word XML、DOC、RTF、XLS、PPT、DBF、CSV、TXT 和 LIT。
附加程序
为即时 OCR 附加的 ABBYY Screenshot Reader 实用程序
ABBYY Screenshot Reader 是一个易用的工具,可以让您迅速获取屏幕图像并且允许您从屏幕进行“即时” OCR。它对摘取文本、表格或者浏览器页面图像、flash 介绍, Windows Explorer “文件”菜单或者错误消息来说是很理想的。当您想要从 PDF 或图像文件摘取小的节录或文本中的几个句子时, Screenshot Reader 也是一个理想的“快速 OCR”工具。作为对注册用户的奖励,ABBYY Screenshot Reader 与 ABBYY FineReader 8.0 专业版同时发行。
与Word 协同
您可以从 Microsoft Word 内部启动 ABBYY FineReader,扫描纸质文档并将识别结果置入您正在操作的文档中而不用离开 Word。
当导出文件到 Microsoft Word 2003 时, FineReader 自动地打开原文件的一张嵌入视图,允许您同时编辑和查验您的文档,这就不需要在两种应用程序之间切换。
文本编辑
多
分栏所见即所得文本编辑器允许您在编辑期间查看扫描文档的完整版式,因此您可以在导出它之前迅速检查文件。
全文搜索
在 ABBYY FineReader 中创建的任何
批处理文件都可以作为一个带有全文搜索功能的小数据库使用。您可以用所有语法形式搜索单词。此功能支持有词典支持的36种语言。
条型码识别
ABBYY FineReader 也支持条型码识别,包括 PDF-417 2D 条码的识别。这对需要处理并索引很大数量的文档为存档的公司来说是很理想的功能。
图像分割工具
图像分割工具允许您分割图像为几个区域并保存各个区域为单独页面。此模式对识别书籍和 PowerPoint 稿件是非常方便的。
易用性
ABBYY FineReader 8.0 有一个新的直观的,友好的用户界面来指引您通过 OCR 过程。 无论您对 OCR 是陌生的还是一个高级用户,使用 FineReader 8.0 工作都是简单和容易的。
支持的部分语言列表:
带有词典支持的语言:
亚美尼亚语(东部,西部,Grabar) 保加利亚语 巴士克语 加泰罗尼亚语
克罗地亚语捷克语
荷兰语 (荷兰和
比利时) 英语 爱沙尼亚语 芬兰语 法语 希腊语
德语 (新拼法和古拼法) 丹麦语 匈牙利语 意大利语 拉脱维亚语
立陶宛语
挪威语 (尼诺斯克语和博克马尔语) 波兰语 罗马尼亚语 俄语 斯洛伐克语 西班牙语
葡萄牙语 (葡萄牙和巴西) 斯洛文尼亚语 瑞典语
鞑靼语土耳其语
乌克兰语
人工语言:
世界语(Esperanto) 拉丁国际语(Interlingua) 伊多语(Ido) 西方语(Occidental)
格式化语言:
Basic
C/C++
COBOL
Fortran
JAVA
Pascal
简单化学公式(H2O, C2H5OH)
- 如何使用ABBYY FineReader 处理无法识别的字符?
在识别PDF文档时,我们可能会遇到文档中存在多种语言.多种不同类型文字字符的情况.在ABBYY FineReader 15(Windows系统)OCR文字识别软件的默认语言数据下,可能无法识别PDF文 ...
- ABBYY FineReader 15 安装教程
ABBYY FineReader 是一款出名的OCR文字识别工具,它包含文档转换.数据捕获等功能,文字识别率较高.能够带来快速.简单.易用的文字识别体验,从而提高工作效率.下面就为大家讲解ABBYY ...
- ABBYY FineReader文档对比实例讲解
ABBYY FineReader企业版与标准版有一个重大的区别,就是企业版有对比文档的功能,今天通过下面的文档对比实例,来向大家展示一下OCR文字识别工具ABBYY FineReader的使用技巧. ...
- 有什么OCR文字识别软件好用?
OCR文字识别是指:对文本资料进行扫描,然后对图像文件进行分析处理,最后获取文字以及版面信息的过程.对于许多学生党而言,一款好用的文字识别软件,能节省很多抄笔记的时间,而对于许多处理文字内容的白领而言 ...
- 超强OCR文字识别软件首选ABBYY FineReader
提到纸质文档—转换—文本格式—可编辑这些字眼,相信大家的第一反映都是OCR文字识别软件,如何排除错误或利用辅助信息提高识别正确率,是OCR最重要的课题,衡量一个OCR系统性能好坏的主要指标无非是精确度 ...
- 多国语言文档识别 ABBYY FineReader Corporate v12.0.101.388.7z 绿色破解版
ABBYY 是一家俄罗斯软件公司,在文档识别,数据捕获和语言技术的开发中居世界领先地位.其获奖产品 FineReader OCR 软件可以把静态纸文件和 PDF 文件转换成可管理的电子数据,可以大大节 ...
- 如何用ABBYY FineReader识别图片中的文本
ABBYY FineReader 12是一款OCR光学字符识别软件,能够快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本,让电脑处理更具效率,摆脱从前的烦恼,告别耗时费力 ...
- ABBYY FineReader 12 能够识别哪些文档语言
ABBYY FineReader可以识别单语言文本和多语言文本(如使用两种及以上语言).对于多语言文本,需要选择多种识别语言. 要为文本指定一种 OCR 语言,请从主工具栏或任务窗口的文档语言下拉列表 ...
- ABBYY FineReader 12如何识别包含非常规符号的文本
ABBYY FineReader 12 是一款OCR图文识别软件,可快速方便地将扫描纸质文档.PDF文件和数码相机的图像转换成可编辑.可搜索的文本,有时文本中可能会包含一些非常规的符号,此时ABBYY ...
- HDU 6212 Zuma 2017青岛网络赛 区间DP
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=6212 解法:看了眼题就发现这个BZOJ 1032不是一毛一样?但是BZOJ上那是个巨坑,数据有错,原来 ...
- jQuery-对标签元素 文本操作-属性操作-文档的操作
一.对标签元素文本操作 1.1 对标签中内容的操作 // js var div1 = document.getElementById("div1"); div1.innerText ...
- python基础-类的反射
1)反射是通过字符串方式映射内存中的对象. python中的反射功能是由以下四个内置函数提供:hasattr.getattr.setattr.delattr, 改四个函数分别用于对对象内部执行:检查是 ...
- tf.nn.embedding_lookup函数
tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None, validate_indices=True, max_ ...
- nginx php mysql日志配置
1.编辑mysql的配置文件my.cnf,这个文件通常在/etc目录下,但我用rpm装mysql的时候这个配置文件是在/usr目录下,但我测试过,无论是放在/etc目录下,还是放在 /usr目 ...
- maven网址
http://www.yiibai.com/maven/maven_environment_setup.html
- 最简单删除SQL Server中所有数据的方法(不用考虑表之间的约束条件,即主表与子表的关系)
其实删除数据库中数据的方法并不复杂,为什么我还要多此一举呢,一是我这里介绍的是删除数据库的所有数据,因为数据之间可能形成相互约束关系,删除操作可能陷入死循环,二是这里使用了微软未正式公开的sp_MSF ...
- 如何读取Hadoop中压缩的文件
最近在处理离线数据导入HBase的问题,涉及从Hdfs中读取gz压缩文件,把思路记录下来,以作备用.具体代码如下: package org.dba.util; import java.io.Buffe ...
- 关于URL编码(针对URL含有中文的参数)
http://www.ruanyifeng.com/blog/2010/02/url_encoding.html 一.问题的由来 URL就是网址,只要上网,就一定会用到. 一般来说,URL只能使用英文 ...
- 标准C++中的String类的使用
要使用标准C++中的String类,必须包含#include<string>(注意不是<string.h>带.h的是C语言中的头文件) 作者:耑新新,发布于 博客园 转载请注 ...