Atitit.复合文档的格式 标准化格式

1. Docfile1

2. Iso   Cdf  cd file1

3. Zip1

4. Ooxml1

5. Odf  :OpenDocument Format2

5.1.1. 本质2

6. 参考3

1. Docfile

paip.docfile二进制复合文档

前言Docfile

Docfile是二进制复合文档,打开文件可看到文件头签名..类似于文件夹存储的方式来存储文档…如以前的DOC文件夹,OLE文档等..

2. Iso   Cdf  cd file

3. Zip

作者:: 绰号:老哇的爪子 ( 全名::Attilax Akbar Al Rapanui 阿提拉克斯 阿克巴 阿尔 拉帕努伊 ) 汉字名:艾龙,  EMAIL:1466519819@qq.com

转载请注明来源: http://www.cnblogs.com/attilax/

4. Ooxml

OOXML是由微软公司为Office 2007产品开发的技术规范,现已成为国际文档格式标准,兼容前国际标准开放文档格式和中国文档标准“标文通”(外语简称:UOF)。于2006年12月成为ECMA标准。

·

互操作性。Office Open XML格式是以工业标准的XML为核心的,Microsoft Office应用程序与企业业务系统之间的数据交换得到了简化。无需访问Office应用程序,解决方案就可以更改Office文档当中的信息,或者使用标准的处理XML的工具和技术来创建文档。新的格式允许您构建文档的存档,而无需使用Office的代码。

·

·

健壮性。Office Open XML格式被设计为比二进制格式更加健壮,而且因此可以帮助降低由于文件损坏所带来的信息丢失的风险。即使在Office外面对于文档的修改和创建也不会对文档造成过多的损坏,因此使用新的文件格式,Office应用程序被设计为使用增强的可靠性来恢复文档。随着越来越多的文档穿梭与电子邮件的附加或可移动的存储设备之间,网络或存储设备的损坏增加了文档损坏的可能性。

·

新的文件格式通过将文档在文件包中进行分段单独的存储,增强了数据恢复的能力。这将大大的节省企业用于恢复数据丢失所花费的大量资金和时间。当一个文件组件损坏时,文件中的剩余部分还可以在应用程序中打开。例如,如果一幅图表被损坏了,这也并不能阻止客户打开文档中的其它部分,当然不包括图表。另外,Office应用程序可以检测这些问题,并且在打开文档的时候尝试修复它,恢复文档正确的数据结构。

·

高效性。Office Open XML格式使用ZIP和压缩技术来存储文档。这种新格式的一个巨大的优势就在于它的文件大小非常小 - 最大的压缩比可以达到原来二进制文件的百分之75。这是使用XML和ZIP技术结合进行文件存储的一大优势。因为XML是一个基于文本的格式,所以压缩的比率非常的好,而且ZIP容器支持内容的压缩,所以用户可以大大的减小文件的尺寸。文件压缩的类型提供了潜在的成本节约,因为它减少了存储文件所需的磁盘容量,并且减少了通过电子邮件、网络和Web进行文件传输所需的带宽。

·

5. Odf  :OpenDocument Format

开放文档格式(外文名:OpenDocument Format,外语简称:ODF)是一种规范,基于XML标准通用标记语言的子集)的文件格式,因应试算表、图表、演示稿和文字处理文件等电子文件而设置。它的规格原本由太阳微系统开发,标准则由结构化信息标准促进组织OASIS所开发。存在一个自由兼开放的OASIS标准,以ISO/IEC国际标准发布──ISO/IEC 26300:2006 Open Document Format for Office Applications(OpenDocument)v1.0。

开放文档格式提供一个取代私有专利文件格式的一个方案,使得组织或个人不会因为文件格式而被厂商套牢(外文名:Vendor lock-in)。

5.1.1. 本质

odf文档是基于xml语言的纯文本文档。odf格式的文本文档的扩展名常见为*.odt。一个odt文档实质上是一个打包的文件,并且通常都经过了zip格式的压缩。我们完全可以用现有的任意一款压缩软件将odt文件解压,查看其里面的内容就会发现其本质。一个odt文件解压后会得到一个与原文件名相同的文件夹,该文件夹里面一般会含有以下子文件夹与文件:

6. 参考

atitit.压缩算法 ZLib ,gzip ,zip 最佳实践 java .net php - attilax的专栏 - 博客频道 - CSDN.NET.htm

Atitit. 解压缩zip文件 的实现最佳实践 java c# .net php - attilax的专栏 - 博客频道 - CSDN.NET.htm

ooxml_百度百科.htm

Atitit.复合文档的格式 标准化格式的更多相关文章

  1. Atitit usrQBK1600 技术文档的规范标准化解决方案

    Atitit usrQBK1600 技术文档的规范标准化解决方案 1.1. Keyword关键词..展关键词,横向拓展比较,纵向抽象细化拓展知识点1 1.2. 标题必须有高大上词汇,参考文章排行榜,1 ...

  2. java 导出数据为word文档(保持模板格式)

    导出数据到具体的word文档里面,word有一定的格式,需要保持不变 这里使用freemarker来实现: ①:设计好word文档格式,需要用数据填充的地方用便于识别的长字符串替换  如  aaaaa ...

  3. JAVA:借用OpenOffice将上传的Word文档转换成Html格式

    为什么会想起来将上传的word文档转换成html格式呢?设想,如果一个系统需要发布在页面的文章都是来自word文档,一般会执行下面的流程:使用word打开文档,Ctrl+A,进入发布文章页面,Ctrl ...

  4. CEBX格式的文档如何转换为PDF格式文档、DOCX文档?

    方正阿帕比CEBX格式的文档如何转换为PDF格式文档.DOCX文档? 简介: PDF.Doc.Docx格式的文档使用的非常普遍,金山WPS可以直接打开PDF和Doc.Docx文档,使用也很方便. CE ...

  5. java将XML文档转换成json格式数据

    功能 将xml文档转换成json格式数据 说明 依赖包:1. jdom-2.0.2.jar : xml解析工具包;2. fastjson-1.1.36.jar : 阿里巴巴研发的高性能json工具包 ...

  6. OpenOffice Word文档转换成Html格式

    为什么会想起来将上传的word文档转换成html格式呢?设想,如果一个系统需要发布在页面的文章都是来自word文档,一般会执行下面的流程:使用word打开文档,Ctrl+A,进入发布文章页面,Ctrl ...

  7. 将html版API文档转换成chm格式的API文档

    文章完全转载自: https://blog.csdn.net/u012557538/article/details/42089277 将html版API文档转换成chm格式的API文档并不是一件难事, ...

  8. 复合文档的二进制存储格式研究[ole存储结构](word,xls,ppt...)[转]

    复合文档文件格式研究   前 言 复合文档(Compound Document) 是一种不仅包含文本而且包括图形.电子表格数据.声音.视频图象以及其它信息的文档.可以把复合文档想象成一个所有者,它装着 ...

  9. Atitit 项目文档规范化与必备文档与推荐文档列表

    Atitit 项目文档规范化与必备文档与推荐文档列表 ===========比较重要的必备文档========== 项目组名单通讯录( 包括项目组,客户沟通人等 需求文档 原型ui文档 开发计划表 项 ...

随机推荐

  1. 再次用CodeIgniter实现简易blog

    天变冷了,人也变得懒了不少,由于工作的需要,最近一直在学习CodeIgniter(CI)框架的使用,没有系统的从PHP基本语法学起,在网上靠百度谷歌,东拼西凑的实现了一些简单的功能.所以,老PHPer ...

  2. hadoop中MapReduce多种join实现实例分析

    转载自:http://zengzhaozheng.blog.51cto.com/8219051/1392961 1.在Reudce端进行连接. 在Reudce端进行连接是MapReduce框架进行表之 ...

  3. c# 多线程系列二 自定义线程执行器

    看了第一篇文章,多线程系列,看到了在线程执行任务队列有了一定的了解~! 那么今天我来讲讲,怎么样构建通用的自定义线程概念! 线程执行任务,肯定要有目标,但是如果写死了,那么一个线程处理执行职能按照思路 ...

  4. HT for Web整合OpenLayers实现GIS地图应用

    HT for Web作为逻辑拓扑图形组件自身没有GIS功能,但可以与各种GIS引擎即其客户端组件进行融合,各取所长实现逻辑拓扑和物理拓扑的无缝融合,本章将具体介绍HT for Web与开发免费的Ope ...

  5. DedeCMS学习

    也许有些读者并不了解dedecms,这里简单介绍一下:DedeCMS是一个自由和开放源码的内容管理系统,它是一个可以独立使用的内容发布系统(CMS).织梦内容管理系统(DedeCms) 以简单.实用. ...

  6. 解决在IE中获取数据的缓存问题,运行环境为node.js

    IE下默认会开启缓存策略,不管是页面还是通过ajax请求的数据都会议一个url,url是uri(统一资源定位符)的实例,url就是资源的标识符. 写一个demo进行验证,测试环境:IE8,node.j ...

  7. foreach DataTable或Table时要略过第一行。

    昨天有续写一个练习<输入数字动态创建行(二)>http://www.cnblogs.com/insus/p/4916260.html ,最终是需要把数据存入数据库中. 在循环ASP:Tab ...

  8. css3代码让页面倾斜

    教大家一个方法使用CSS把整个网页倾斜,代码只有在支持CSS3.0的浏览器上有效果.目前只有IE9以上版本及firefox高版本支持,其它浏览器没有测试.代码如下 body{ -webkit-tran ...

  9. iOS阶段学习第13天笔记(多态)

    iOS学习(OC语言)知识点整理 一.关于多态的介绍 1)多态的通俗理解,即一种事物多种形态. 2)多态的赋值兼容:即父类的引用可以指向子类的对象. 3)在多态中调用方法时看对象,不看指针,即我们要看 ...

  10. httpclient 调用WebAPI

    1.创建webapi项目,提供接口方法如下: /// <summary> /// 获取租户.位置下的所有传感器 /// </summary> /// <returns&g ...