ABBYY导出结果为PDF注意事项
使用ABBYY FineReader Pro for Mac OCR文字识别软件识别文档时,可以将已识别的文本保存到文件中,还可以通过电子邮件发送已识别的文本,只要输出格式受FineReader支持。那么如果想要将识别结果导出为PDF格式,有哪些信息需要注意的呢?本文具体给大家讲讲PDF导出参数。
ABBYY FineReader识别文档之PDF导出参数:
1、导出模式
•仅文本和图片
此模式可以保存已识别的文本和图片,可对页面进行全文搜索,PDF文件的大小也将变小,生成文档的外观可能与原始文档略有不同。
•页面图像上的文本
该选项可保存原始文档的背景和图片,并将已识别的文本置于其上。通常,该PDF类型比“仅文本和图片”需要更多的磁盘空间。可对生成的PDF文档进行全文搜索。在某些情况下,生成文档的外观可能与原始文档略有不同。
•页面图像下的文本
该选项可以保存整个页面图像,并将已识别的文本置于其下。使用该选项创建可进行全文搜索的文档,且该文档看上去几乎与原始文档相同。
•仅页面图像
该选项可精确保存页面上的图像。用户几乎很难区分这类 PDF 文档和原始文档的差别,但不能对其进行搜索。
注意:PDF导出参数取决于选择的导出模式。因此,在某些模式下部分参数可能无法使用。
2、保留布局
•保留页码、页眉和页脚
选中此选项之后,将可以保存页眉、页脚文本和页码。如果禁用了此选项,则页眉、页脚和页码将不会被保存。
•保留图片
选中此选项之后,将可以保存已识别文本中的图片。图片质量和结果文件的大小取决于在“图像质量”面板中所做的选择。
•使用 MRC 压缩图像
选中此选项之后,将可以在高度压缩的文档中保留文本和图片的显示质量。因此,目标文件将是较小的高质量文本与图片。
3、图像质量
如果已识别文本包含众多图片,或者选择了保存页面图像的模式,那么结果文件可能会非常大。可以调整输出图片的质量,以减小输出文件的大小。
•低
如果希望PDF文档很小,请选中此选项。页面图像和图片的分辨率将减至150 dpi,这会影响它们的质量。
•平衡
如果既希望文件较小,同时又希望页面图像和图片的质量较高,请选中此选项。
•高
选中此选项之后,页面图像和图片将保持原始质量。
4、纸张尺寸
在将结果导出至PDF时,可以设置所用纸张的尺寸。从下拉列表中选择一个系统支持的纸张尺寸,或者选中“自定义尺寸”,然后输入一个自己定义的尺寸。
5、文本设置
保留文本和背景颜色:选择该选项可在以PDF格式保存文档时,保留字体颜色和背景。
6、PDF选项
•制作兼容 PDF/A 的文档
选择该选项创建可进行全文搜索的PDF文档,这些文档看上去与原始文档相同,可用于存档。
•创建轮廓
选中此选项之后,可以创建一个PDF文档章节标题目录。
•启用PDF标记
选中此选项之后,可以将PDF标记添加到输出PDF文档中。
除了文字和图示,PDF文件还可包含有关文档结构的信息,如逻辑部分、照片和表格。这些信息用PDF标记编码。有PDF标记的PDF文档可重新载入以适合各种屏幕尺寸,在手持设备上显示效果也很好。
重要!如果已识别的文档包含希伯来语或意第续语文本,不能创建带标记的PDF文件。
•嵌入字体
选中此选项之后,可以将字体嵌入到PDF文档中。
本文转载于:http://www.abbyychina.com/FRshiyongjiqiao/frmac-pdf-canshu.html
ABBYY导出结果为PDF注意事项的更多相关文章
- 扫描仪扫描文件处理-ABBYY对扫描版PDF文字加黑加粗、去除背景漂白
1. 设置ABBYY自动歪斜矫正: 2. 设置导出PDF参数: 3. PDF文字加黑加粗.去除背景漂白步骤:3.1 ABBYY - 打开扫描版PDF文档3.2 ABBYY - 编辑图像3.3 等级 - ...
- 导出excel和PDF小结 vba
最近接触了一个关于Access工具的项目,所以整理下需要使用的方法. 功能要求简介: 1.将数据表中的数据导出到excel和PDF 2.并根据某个字段名称分sheet输出. 3.无模板方式 方案简介: ...
- 【转】Java通过IText导出word和pdf
原帖地址:http://blog.csdn.net/zwx19921215/article/details/34439851 最近做的项目中需要用到把Highcharts图表导出word和pdf的功能 ...
- BarTender 2016如何导出模板为pdf文件?
最近有小伙伴来问,BarTender 2016能不能导出模板为pdf文件?这个是可以的,之前针对BarTender 10.1就介绍过一种方法了.本文,小编再针对BarTender 2016给大家讲下如 ...
- jquery插件导出excel和pdf(解决中文乱码问题)
参考文件:http://jackyrong.iteye.com/blog/2169683 https://my.oschina.net/aruan/blog/418980 https://segmen ...
- Magicodes.IE已支持导出Word、Pdf和Html
关于Magicodes.IE 导入导出通用库,通过导入导出DTO模型来控制导入和导出,支持Excel.Word.Pdf和Html. GitHub地址:https://github.com/xin-la ...
- C#&.Net干货分享- iTextSharp导出数据源到PDF
namespace Frame.ITextSharp{ /// <summary> /// iTextSharp导出数据源到PDF /// </summary> ...
- FusionCharts V3图表导出图片和PDF属性说明(转)
百闻不如一见,狠狠点击,快快下载:(演示文档有错误,不提供下载了.待新的演示文档出来.) 许多朋友说上面的DEMO用不了.fusioncharts官方的演示非常不错,就是来不及整理,各位大侠们可以研究 ...
- Highcharts 本地导出图片和PDF asp.net mvc版
啰嗦: 现在大家利用Highcharts开发时,有时候会遇到导出的功能问题,但是highcharts默认是链接自己的服务器上进行处理,但是有时候我们会连不上他的服务器,所以我们要让他在我们的服务器上进 ...
随机推荐
- (转)Document对象内容集合
原文:http://webcenter.hit.edu.cn/articles/2009/06-10/06144703.htm document 文挡对象 - JavaScript脚本语言描述 ——— ...
- 模拟http或https请求,实现ssl下的bugzilla登录、新增BUG,保持会话以及处理token
1.增加相应httpclient 需要的jar包到工程,如果是maven工程请在pom.xml增加以下配置即可: <dependency> <groupId>org.apach ...
- BZOJ 3165 Segment
同上题. #include<iostream> #include<cstdio> #include<cstring> #include<algorithm&g ...
- python3爬虫再探之EXCEL
在爬取数据之后,数据的保存就成为一个新的问题,一般不太大的的数据存储到EXCEL就可以了.这里介绍一个python的第三方库——xlsxwriter. 这个库的安装就不介绍了,pip就可以,不用FQ. ...
- python3爬虫初探(二)之requests
关于请求网页,不得不提requests这个库,这是爬虫经常用到的一个第三方库,用pip安装即可. requests用法很多,这里只写一些基础的,其他高级功能可参考官方文档. import reques ...
- Team Foundation API - 编程访问 WorkItem
Team Foundation Server (TFS)工具的亮点之一是管理日常工作项, 工作项如Bug, Task,Task Case等. 使用TFS API编程访问TFS服务器中的工作项, 步骤如 ...
- MySQL数据库备份和还原的常用命令小结
备份MySQL数据库的命令 mysqldump -hhostname -uusername -ppassword databasename > backupfile.sql 备份MySQL数据库 ...
- 通知(Notification) 、 应用间通信(一)
1 使用通知中心发送消息 1.1 问题 当一个对象需要向多个接受者发送消息的,或者不用知道消息的接收者是谁,就可以使用IOS提供的NSNotificationCenter通知中心,本案例使NSNoti ...
- 使用Maven搭建Struts2+Spring3+Hibernate4的整合开发环境
做了三年多的JavaEE开发了,在平时的JavaEE开发中,为了能够用最快的速度开发项目,一般都会选择使用Struts2,SpringMVC,Spring,Hibernate,MyBatis这些开源框 ...
- hdu 2337 Escape from Enemy Territory
题目大意 给你一张nn*mm矩形地图.上面有些点上有敌营.给你起点和终点, 你找出一条最优路径.满足最优路径上的点离敌营的最近最短距离是所有路径最短的.若有多条找路径最短的一条. 分析 通过二分来确定 ...