PDF文件结构】的更多相关文章

PDF文件结构(一)  ————物理结构 PDF(Portable   Document   Format,便携式文档结构)是一种很有用的文件格式,其最大的特点是平台无关而且功能强大(支持文字/图象/表单/链接/音乐/视频等).做PDF的解析,首先要熟悉PDF文件的物理结构和逻辑结构.PDF文件物理结构可分为以下几块:   1.文件头       文件头是PDF文件的第一行,格式如下: %PDF-1.4 这是个固定格式,表示这个PDF文件遵循的PDF规范版本,目前PDF的生成工具,除了官方的ac…
概述PDF是一种不依赖应用程序软件.硬件和操作系统的文件格式.PDF页包含文本.图形和图像.页面外观由内容流(content stream)描述,内容流包含一些列图形对象(graphics objects).PDF支持不同注释,有文本注释.超链接.标签.文件附件.声音及影视.PDF包含高级信息,这些信息可用来与其他应用程序进行内容交互. PDF的核心是它描述复杂图形和排版的能力.该能力是通过Adobe imaging model实现的.PDF可作为一种页面描述语言,该语言是通过图像模型来描述页面…
一.PDF概述 PDF(Portable Document Format)是一种结构化的文档格式.它由美国著名排版与图像处理软件Adobe公司于1993年首次发布(1.0版),并于同年推出了其相应的支持软件产品系列AdobeAcrobat1.0版:随后Adobe公司又对它进行修订和升级,于1994年发布了1.1版,并推出了支持软件产品系列Adobe Acrobat2.0及2.1版.随后的PDF1.2版又于1996年11月27日发布,相应的支持软件产品系列Adobe Acrobat也升级到3.0版…
比较原始图像数据和PDF中的图像数据,结果见表1.1.表1.1中各种“解码器”的解释见本文后续的“PDF支持的图像格式”部分,“PDF中的图像数据”各栏中的数据来自开源的PdfView.如果您有兴趣查看PDF文件内部细节,建议用UltraEdit-32,仅看PDF文件结构 用PdfView足矣.表1.1 从ACDSEE打印图像到Acrobat PDF虚拟打印的结果 原始图像 PDF中的图像数据 序号 说明 宽×长(象素) 图像解码器 文件长度(字节) PDF解码器 BitsPerComponen…
该文由小居工作室(QQ:2482052910)    翻译并提供解答支持,原文地址:Pdf File Writer 中文应用(PDF文件编写器C#类库):http://www.cnblogs.com/wjs5943283/p/6528853.html 首先 Pdf File Writer  是一个很好用的PDF文件生成工具,由于作者对中文编码不熟悉,涉及到中文字体的输出会发生异常,经过本人多次测试,仿宋.黑体字体的中文还比较好,不容易发生异常.宋体测试很多次都没有成功,包括咨询了作者本人也没有得…
这个iTextSharp确实是个好东西,可以创建.读取PDF格式的文档,虽然我的需求比较简单,但我首先还是基本上.完整地看完了它的相关文档,不喜欢英文的同志,可以搜索一篇<用C#制作PDF文件全攻略>(苟安廷),这篇文章是苟先生在使用iTextSharp时的一些心得,里面虽然重点是说明如何创建PDF文件,对读取.修改PDF文件的方法略过不提,因此,对于我的任务来说,并没有太大的作用,但在这里,仍然感谢苟先生的无私奉献. 具体使用iTextSharp的方法,我这里就不细说了,因为非常简单,仔细看…
作者:马健邮箱:stronghorse_mj@hotmail.com发布:2009.09.22更新:2012.06.11针对PdfToy的新进展,更新了相关内容. 1 引言2 理论3 实现    3.1 MRC模型的转换        3.1.1 单层DjVu        3.1.2 3层DjVu        3.1.3 2层DjVu(彩色文本)    3.2 图像的转换        3.2.1 JB2转JBig2        3.2.2 IW44转JPEG 2000         3…
依据本人将PDF转换为EPUB电子书的经验,总结整理了这篇文章.因本人水平有限,难免有错误和不足之处,望大家及时批评指正.   写这篇文章时,假定读者已经会使用文中所列出软件的基本操作,比方如何用Notepad++打开HTML文件,如何使用PDF Password Remover(这个软件非常easy,稍有电脑操作基础的人打开后就知道怎么做).另外读者须要对ePubBuilder的操作比較了解.   本文主要讨论图文并茂.非扫描版的PDF文档.对于扫描版PDF文件,假设是漫画一类的,能够直接用A…
前言 pdf是最流行的版式格式文件标准,已成为国际标准.pdf相关的开源软件非常多,也基本能满足日常需要了.相关商业软件更是林林总总,几乎应有尽有!似乎没必要自己再独立自主开发!但,本人基于以下考虑,决定自主研发一款pdf阅读器. 1)通过编写pdf阅读器,可以迅速的熟悉pdf文件的处理.pdf格式包含的内容非常多,仅仅通过查资料,很难掌握其内容. 2)任何技术,只有自主可控,才能到达气定神闲!使用开源软件是简单,万一遇到问题,就是个坑! 3)解决pdf与ofd互转问题.ofd是国家标准,相关的…
一.合并和拆分PDF文件的方式 PDF文件使用了工业标准的压缩算法,易于传输与储存.它还是页独立的,一个PDF文件包含一个或多个"页",可以单独处理各页,特别适合多处理器系统的工作.PDF文件结构主要可以分为四个部分:首部.文件体.交叉引用表.尾部.PDF操作类非常多,如下图所示,常用的操作PDF文件的类库有:Spire.Pdf.iTextSharp. 二.使用 Spire.Pdf 合并和拆分PDF文件 使用 Nuget 添加Spire.Pdf 类库,然后添加如下代码: 1 /// &…