XML转换成TXT行数据的Java程序
ZKe
-------------------
XML数据的一个块内的所有属性,转换成TXT文件的一行。众所周知XML文件是通过类似HTML的标签进行数据的定义如图所示
属性由id, article, discuss, insertTime, oigin, person_id, time, transmit,整个数据由RECORD标签括住。
这是一个典型的括号匹配问题,可以定义一个信号量标记数据的开始与结束,另外可以声明一个String类型的变量作为数据缓冲区,遇到</RECORD>标签就将改变量的值写入新文件,遇到<RECORD>便清空改变量。遇到任一属性字段的标签,便写入缓冲变量。
处理方法:
private String oneLine = null;
private boolean canPrint = false; private void process(String line){ if(line.startsWith("<RECORD>")){
oneLine = "";
canPrint = false;
return;
}else if(line.startsWith("<RECORDS>")){
return;
}else if(line.startsWith("</RECORD>")){
canPrint = true;
return;
}else if(line.startsWith("</RECORDS>")){
return;
}
line = line.trim();
if(line.trim().startsWith("<id>")){
oneLine += line.substring(4, line.length()-5);
oneLine += " | ";
}
else if(line.trim().startsWith("<article>")){
if(line.indexOf("</article>")==-1){
oneLine+= line.substring(9);
return;
}
oneLine += line.substring(9, line.length()-10);
oneLine += " | ";
}else if(line.trim().startsWith("<discuss>")){
oneLine += line.substring(9, line.length()-10);
oneLine += " | ";
}else if(line.trim().startsWith("<insertTime>")){
oneLine += line.substring(12, line.length()-13);
oneLine += " | ";
}else if(line.trim().startsWith("<origin>")){
oneLine += line.substring(8, line.length()-9);
oneLine += " | ";
}else if(line.trim().startsWith("<person_id>")){
oneLine += line.substring(11, line.length()-12);
oneLine += " | ";
}else if(line.trim().startsWith("<time>")){
oneLine += line.substring(6, line.length()-7);
oneLine += " | ";
}else if(line.trim().startsWith("<transmit>")){
oneLine += line.substring(10, line.length()-11);
}else if(line.indexOf("</article>")!=-1){
oneLine += line.substring(0, line.length()-10);
}
}
XML数据的读取使用BufferedReader,写入TXT使用BufferedWriter,注意其中信号量的控制
public void printToTXTFile(){
File file =new File(this.path);
File targetFile = new File("/root/myCodes/finalClassDesign/stardardAllData.txt");
try {
FileReader fr = new FileReader(file);
BufferedReader br = new BufferedReader(fr); FileWriter fw = new FileWriter(targetFile);
BufferedWriter bw = new BufferedWriter(fw); String line = "";
while((line = br.readLine())!= null){ process(line);
if(canPrint){
bw.write(oneLine);
bw.newLine();
// System.out.println(oneLine);
}
} bw.flush();
bw.close();
fw.close();
br.close();
fr.close();
} catch (FileNotFoundException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
其他部分就是类里面的其他属性了,比如源文件路径,目标文件路径,函数调用了,省略自己补充
转换后的TXT文件内容如下,效果挺好,我是用"|"作为分割,其实有弊端,因为"|"在正则表达式里面被视作通配符,大家改成逗号","或者分号";"甚至斜杠"|"什么的即可
XML转换成TXT行数据的Java程序的更多相关文章
- java将XML文档转换成json格式数据
功能 将xml文档转换成json格式数据 说明 依赖包:1. jdom-2.0.2.jar : xml解析工具包;2. fastjson-1.1.36.jar : 阿里巴巴研发的高性能json工具包 ...
- Dom4j把xml转换成Map(非固定格式)
将xml转换成Map,能够应对不用结构的xml,而不是只针对固定格式的xml.转换规则:1.主要是Map与List的互相嵌套2.同名称的节点会被装进List 示例: import java.util. ...
- 如何在ASP.NET中用C#将XML转换成JSON
本文旨在介绍如果通过C#将获取到的XML文档转换成对应的JSON格式字符串,然后将其输出到页面前端,以供JavaScript代码解析使用.或许你可以直接利用JavaScript代码通过Ajax的方式来 ...
- 如何在ASP.NET中用C#将XML转换成JSON 【转】
本文旨在介绍如果通过C#将获取到的XML文档转换成对应的JSON格式字符串,然后将其输出到页面前端,以供JavaScript代码解析使用.或许你可以直接利用JavaScript代码通过Ajax的方 ...
- C#将XML转换成JSON转换XML
原文:C#将XML转换成JSON转换XML using System; using System.Collections.Generic; using System.Linq; using Syste ...
- xml转换成map
import java.io.IOException;import java.io.StringReader;import java.util.ArrayList;import java.util.H ...
- jQuery、JS读取xml文件里的内容(JS先通过document.implementation.createDocument方法将xml转换成document对象,jQuery将读取到的xml转成table)
xml文件:test.xml <?xml version="1.0"?> <note> <to>George</to> <fr ...
- Dom4j把xml转换成Map(固定格式)
/** * 可解析list * * @param fileName * @return * @throws Exception */ @SuppressWarnings("unchecked ...
- Python 将pdf转换成txt(不处理图片)
上一篇文章中已经介绍了简单的python爬网页下载文档,但下载后的文档多为doc或pdf,对于数据处理仍然有很多限制,所以将doc/pdf转换成txt显得尤为重要.查找了很多资料,在linux下要将d ...
随机推荐
- 利用babel工具将es6语法转换成es5,Object.assign方法报错
一.新建工程初始化项目 1.新建工程文件夹这里起名叫做es6,然后在里面创建两个文件夹分别为src .dist如下图:(src为待转换es6 js存放目录,dist为编译完成后的es5 js存放目录) ...
- IIdea使用CXF开发WebService
写这篇文章主要是用于增强记忆,而我参考的是这位朋友的随笔,链接如下 http://www.xiaomager.com/415.html 服务端开发过程 1.首先创建一个maven项目,如下图 2.添加 ...
- 【树形DP】BZOJ 3829 Farmcraft
题目内容 mhy住在一棵有n个点的树的1号结点上,每个结点上都有一个妹子i. mhy从自己家出发,去给每一个妹子都送一台电脑,每个妹子拿到电脑后就会开始安装zhx牌杀毒软件,第i个妹子安装时间为Ci. ...
- PS文字
点文本 直接单击鼠标可输点文字 输完后在离文字较远的地方出现白色箭头单击可结束输入,也可选择其他图层结束输入 再次修改文字可双击文字缩览图 出现黑色小箭头可以在输入到的情况下拖动文字,文字工具下按Ct ...
- shell脚本在后台运行以及日志重定向输出
后台运行命令 在命令行后加上 &,表示进程到后台中执行,如:cmd & 日志输出重定向 如:cmd > out.log & Linux默认定义两个变量:1和2: 1 表示 ...
- buuctf-misc-snake 详解
打开压缩包,里面一张蛇的图片,看的我是真恶心,看了看详细信息,没什么,然后我用formstlrb分离,然后有一个压缩包 以为还像往常一样,有伪加密或者简单加密,但是居然啥也没有,里面有两个文件,key ...
- linux硬盘分区及挂载
今天买的一台服务器发现其硬盘容量与购买界面的描述不符,于是我去问了客服才知道有一块硬盘需要自己挂载,所以记录自己硬盘分区以及挂载操作得此文. 测试环境 由于时间限制,本人仅在centos 8下测试 ...
- C++实现求离散数学命题公式的真值表
一.实验内容 (1)求任意一个命题公式的真值表. (2)利用真值表求任意一个命题公式的主范式. (3)利用真值表进行逻辑推理. 注:(2)和(3)可在(1)的基础上完成. 二.实验目的 真值表是命题逻 ...
- Ⅱ Finite Markov Decision Processes
Dictum: Is the true wisdom fortitude ambition. -- Napoleon 马尔可夫决策过程(Markov Decision Processes, MDPs ...
- ssm整合之web.xml文件
<!DOCTYPE web-app PUBLIC "-//Sun Microsystems, Inc.//DTD Web Application 2.3//EN" " ...