C#仪器数据文件解析-RTF文件】的更多相关文章

RTF格式文件大家并不陌生,但RTF文件的编码.解码却很难,因为RTF文件是富文本格式的,即文件中除了包含文本内容,还包含文本的格式信息,而这些信息并没有像后来的docx等采用XML来隔离格式和内容,因此解码很难. 一些仪器的数据报告以RTF格式输出,因为RTF可以使用写字板进行编辑,写字板程序在Windows系统中默认安装,因此输出的RTF格式文件易读写. 解析RTF文件,难以从解码入手,但可以依赖Windows的基础功能实现RTF文本内容的获取,具体而言就是依靠WinForm类库来读取RTF…
不少仪器工作站可以将数据导出为Excel文件,包括97-2003版本的xls文件和2007+的xlsx文件. 采集Excel文件相比采集pdf文件更容易.程序更健壮,毕竟Excel中数据有明确的行.列的定义,利于数据解析. Excel早期的xls文件和后来的xlsx文件的格式不一样,xls是二进制特定格式文件,xlsx是zip压缩包,其中数据使用xml定义.虽然两种文件格式定义不同,但解析文件数据可以通过中间件,因此只要理解了Excel文件的工作簿.sheet页.行.列.单元格等概念即可,无需了…
不少仪器数据报告输出为Word格式文件,同Excel文件,Word文件doc和docx的存储格式是不同的,相应的解析Word文件的方式也类似,主要有以下方式: 1.通过MS Word应用程序的DCOM接口: 2.WPS Word应用程序的DCOM接口,其他Office应用程序,例如Open Office等: 3.NPOI库: 4.MS Open XML: 5.Spire.Doc库: 实际操作中,MS与Open Office等不同厂家对Word(或泛指Office中的字处理软件文档)的格式定义标准…
不少仪器工作站输出的数据报告文件为PDF格式,PDF格式用于排版打印,但不易于数据解析,因此解析PDF数据需要首先读取到PDF文件中的文本内容,然后根据内容规则解析有意义的数据信息. C#解析PDF文件常用的库有PDFBox和iTextSharp,PDFBox为Java库,通过IKVM使用,因此调用方法.属性等比较变扭. PDFBox解析PDF文本示例: PDDocument doc = PDDocument.load(input); str = new PDFTextStripper().ge…
XPS为微软推出的类似于Adobe PDF的一种文件格式,个人认为XPS很好,但毕竟PDF已经被大家所熟知,因此XPS的使用很少,也少有仪器数据输出为该格式. XPS百度百科:https://baike.baidu.com/item/XPS%E6%A0%BC%E5%BC%8F%E6%96%87%E4%BB%B6 以下代码为XPS文档内容的解析示例: StringBuilder sb = new StringBuilder(); //读取文档 XpsDocument xpsDocument = n…
https://www.cnblogs.com/gaodu2003/archive/2008/12/17/1356861.html 举例说明如下: 每一节的标题在RTF文件中一般以特有的脚注($)指定,该项为非必选项,可省略.对每一节还须指定其跳转名(#),跳转名不能是汉字,以便标识.对每一节还可指定其搜索关键字(K),该项为非必选项,关键字可以是一个或多个,汉字和英文均可,各关键字之间用半角逗号(即;)进行分隔.对每一节还可设定顺序号(+),该项为非必选项. 具体操作步骤为: 一.进入Micr…
一.概述 使用pdfbox可生成Pdf文件,同样可以解析PDF文本内容. pdfbox链接:https://pdfbox.apache.org/ 二.PDF文本内容解析 File file = new File(filePath); PDDocument doc = PDDocument.load(file); PDFTextStripper stripper = new PDFTextStripper(); String fileContent = stripper.getText(doc);…
0x01 Office RTF 文件介绍 RTF 文件也称富文本格式(Rich Text Format, 一般简称为 RTF),意为多文本格式是由微软公司开发的跨平台文档格式.大多数的文字处理软件都能读取和保存 RTF 文档.RTF 是一种非常流行的文件结构,很多文字编辑器都支持它,vb 等开发工具甚至还提供了 richtxtbox 的控件. RTF 和 DOC 文件一样,都属于 Microsoft Office 的范畴,和 DOC 文件类似,RTF 文件也可以进行文字编辑操作,甚至是插入 OL…
一.XML简介 XML(EXtensible Markup Language),可扩展标记语言 特点:XML与操作系统.编程语言的开发平台无关 实现不同系统之间的数据交换 作用:数据交互 配置应用程序和网站 Ajax基石 二.XML标签 XML文档内容由一系列标签元素组成 语法: (1)属性值用双引号包裹 (2)一个元素可以有多个属性 (3)属性值中不能直接包含<.".&(不建议:'.>) 三.XML编写注意事项 标签编写注意事项 (1)所有XML元素都必须有结束标签 (2)…
XML文件??? xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. 里面的标签都是可以随心所欲的按照他的命名规则来定义的,文件名为roi.xml <?xml version="1.0" encoding="UTF-8"?> <readingSession> <roi> <xCoord id="1">312</xCoord> <…