XML为一种可扩展的标记语言,是一种简单的数据存储语言,使用一系列简单的标记来描述。

一、SAX解析

  即Simple API for XML,以事件的形式通知程序,对Xml进行解析。

  1、首先在Web项目中发布一个XML文档,名字为persons.xml,具体内容为: 

<?xml version="1.0" encoding="UTF-8"?>
<persons>
<person id="">
<name>周杰伦</name>
<age></age>
</person>
<person id="">
<name>小明</name>
<age></age>
</person> </persons>

  2、SAX解析的流程主要如下:

  

  通过创建SAXParserFactory对象获得一个实例,然后再通过工厂获得一个SaxParser,依靠SaxParser的parse方法,完成解析,其中parse方法的参数为一个InputStream类和一个DefaultHandler类,defaultHandler需         要重写

    SAXParserFactory spf = SAXParserFactory.newInstance();
SAXParser parse = spf.newSAXParser();
Myhandler handler = new Myhandler("person");
parse.parse(is, handler);
list = handler.getList();

  

  3、重写处理类DefaultHandler。

  

  

import java.util.ArrayList;
import java.util.HashMap;
import java.util.List; import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler; public class Myhandler extends DefaultHandler { List<HashMap<String, String>> list = null;// 存储所有的解析对象
String currentTag = null; // 正在解析的标签
String currentValue = null; // 正在解析元素的值
String nodename = null; // 正在解析节点名称
HashMap<String, String> map = null;// 存储单个解析的完整对象 public Myhandler(String nodename) {
this.nodename = nodename;
} public List<HashMap<String, String>> getList() {
return list;
} @Override
// 读到第一个开始标签的时候触发
public void startDocument() throws SAXException { list = new ArrayList<HashMap<String, String>>();
} @Override
// 当遇到所要解析的节点名称时触发
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException { if (qName.equals(nodename)) {
map = new HashMap<String, String>(); } if (attributes != null && map != null) {
for (int i = 0; i < attributes.getLength(); i++) {
map.put(attributes.getQName(i), attributes.getValue(i));
}
} currentTag = qName; } @Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
if (qName.equals(nodename)) {
list.add(map);
map = null;
}
super.endElement(uri, localName, qName);
} @Override
// 处理xml文件读取到的内容
public void characters(char[] ch, int start, int length)
throws SAXException { if (currentTag != null && map != null) {
currentValue = new String(ch, start, length);
if (currentValue != null && !currentValue.trim().equals("")
&& !currentValue.trim().equals("\n")) {
map.put(currentTag, currentValue);
} } currentTag = null;
currentValue = null;
} }

  

  

  

  4、通过自定义的HttpUtils类,从服务器获取数据,以流的形式返回,也就是XML文档的输入流,这里不再给出,关于获得服务器数据的三种方式下次会下次更新。

  5、最后通过返回的List<Map<String,String>> 获得了XML文档的所需要的内容,需要提到的是,我在这里是需要解析person节点,于是只有qName等于person时候才会开始解析。

二、PULL解析

  类似于SAX方式,程序以“拉取”的方式对Xml进行解析。

  1、与SAX解析类似,但比SAX解析容易,需要JAR包,下载地址:

  2、首先通过XMLPullFactory创建一个工厂,然后再由工厂创建一个XMLPullParser对象,由对象进行相关处理。

  3、通过对eventType进行XML文件的节点解析,获得数据,并存放在List中进行返回。

import java.io.InputStream;
import java.util.ArrayList;
import java.util.List; import org.xmlpull.v1.XmlPullParser;
import org.xmlpull.v1.XmlPullParserException;
import org.xmlpull.v1.XmlPullParserFactory; public class PullXmlHandler { public static List<Person> parseXml(InputStream is, String encode)
throws Exception {
List<Person> list = null;
Person p = null;
try {
XmlPullParserFactory xmlPullF = XmlPullParserFactory.newInstance();
XmlPullParser parser = xmlPullF.newPullParser();
parser.setInput(is, encode);
int eventType = parser.getEventType();
  
        //如果还没到文档结束节点就一直循环
while (eventType != XmlPullParser.END_DOCUMENT) {
switch (eventType) {
case XmlPullParser.START_DOCUMENT:
list = new ArrayList<Person>();
break; case XmlPullParser.START_TAG:
if (parser.getName().equals("person")) {
p = new Person();
if (parser.getAttributeCount() != 0) {
p.setId(parser.getAttributeValue(0));
}
} else if (parser.getName().equals("name")) {
p.setName(parser.nextText());
} else if (parser.getName().equals("age")) {
p.setAge(parser.nextText());
}
break;
case XmlPullParser.END_TAG:
if (parser.getName().equals("person")) {
list.add(p);
p = null;
}
break;
default:
break;
}
        //进行下次循环
  eventType = parser.next(); }
} catch (XmlPullParserException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
return list;
} } 

三、DOM解析

  “文档对象模型”方式,解析完的Xml将生成一个树状结构的对象。

  1、DOM解析相对前两种比较麻烦,代码如下:

  

import java.io.InputStream;
import java.util.ArrayList;
import java.util.List; import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList; import com.xml.httputils.http_post; public class DomService { public DomService() {
} public static List<Person> parseXML(InputStream is) throws Exception {
List<Person> list = new ArrayList<Person>();
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document document = builder.parse(is);
// 获得节点
Element element = document.getDocumentElement();
NodeList nodeList = element.getElementsByTagName("person");
for (int i = ; i < nodeList.getLength(); i++) {
Element personElement = (Element) nodeList.item(i);
Person p = new Person();
p.setId(personElement.getAttribute("id"));
NodeList personList = personElement.getChildNodes();
for (int j = ; j < personList.getLength(); j++) {
if (personList.item(j).getNodeType() == Node.ELEMENT_NODE) {
if ("name".equals(personList.item(j).getNodeName())) {
p.setName(personList.item(j).getFirstChild()
.getNodeValue());
} else if ("age".equals(personList.item(j).getNodeName())) {
p.setAge(personList.item(j).getFirstChild()
.getNodeValue());
}
}
}
list.add(p);
}
return list; } public static void main(String[] args) throws Exception {
DomService dom = new DomService();
List<Person> ps = dom.parseXML(http_post.getXMLStream());
for (Person p : ps) {
System.out.println(p);
}
}
}

总结:

  对于小内存的设备,尤其是Android设备,使用PULL解析或者SAX解析远优于DOM解析。

【Android学习】XML文本的三种解析方式(通过搭建本地的Web项目提供XML文件)的更多相关文章

  1. Android平台中实现对XML的三种解析方式

    本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...

  2. JSON的三种解析方式

    一.什么是JSON? JSON是一种取代XML的数据结构,和xml相比,它更小巧但描述能力却不差,由于它的小巧所以网络传输数据将减少更多流量从而加快速度. JSON就是一串字符串 只不过元素会使用特定 ...

  3. Spring学习日记01_IOC_xml的三种注入方式

    什么是IOC 控制反转,把对象创建和对象之间的调用过程,交给Spring进行管理 使用IOC目的:为了耦合度降低 做入门案例就是IOC实现 IOC底层原理 xml解析 工厂模式 反射 原始方式 cla ...

  4. Javaweb学习笔记——(六)——————xml中jaxp两种解析方式和dom4j运用

    1.xml的scheam约束 dtd的语法:<!ElEMENT 元素名称 约束> **schema符合xml的语法,xml语句 **一个xml中可以有多个schema,多个schema使用 ...

  5. python爬虫之数据的三种解析方式

    一.正则解析 单字符: . : 除换行以外所有字符 [] :[aoe] [a-w] 匹配集合中任意一个字符 \d :数字 [0-9] \D : 非数字 \w :数字.字母.下划线.中文 \W : 非\ ...

  6. Android 沉浸式状态栏的三种实现方式

    沉浸式状态栏 Google从android kitkat(Android 4.4)開始,给我们开发人员提供了一套能透明的系统ui样式给状态栏和导航栏,这种话就不用向曾经那样每天面对着黑乎乎的上下两条黑 ...

  7. 爬虫的三种解析方式(正则解析, xpath解析, bs4解析)

    一 : 正则解析 : 常用正则回顾: 单字符: . : 除换行符以外的所有字符 [] : [aoe] [a-w] 匹配集合中任意一个字符 \d : 数字 [0-9] \D : 非数字 \w : 非数字 ...

  8. Android开发——View滑动的三种实现方式

    0. 前言   Android开发中,我们常常需要View滑动实现一些绚丽的效果来优化用户体验.一般View的滑动可以用三种方式实现. 转载请注明出处:http://blog.csdn.net/seu ...

  9. Java开发学习(四)----bean的三种实例化方式

    一.环境准备 准备开发环境 创建一个Maven项目 pom.xml添加依赖 resources下添加spring的配置文件applicationContext.xml 最终项目的结构如下:    二. ...

随机推荐

  1. 易出错的C语言题目之一:宏定义与预处理

    1.写出下列代码的运行结果: #include<stdio.h> #include<string.h> #define STRCPY(a,b) strcpy(a##_p,#b) ...

  2. hadoop面试时的一些问题解答

    一.         linux部分 请阐述swap分区作用,您认为hadoop集群中的linux是否必须有swap分区? 答:在Linux中,如果一个进程的内存空间不足,那么,它会将内存中的部分数据 ...

  3. 在Html中使用Requirejs进行模块化开发

    在前端模块化的时候,不仅仅是js需要进行模块化管理,html有时候也需要模块化管理.这里就介绍下如何通过requirejs,实现html代码的模块化开发. 如何使用requirejs加载html Re ...

  4. linux学习笔记1

    2016年09月25日 unix与linux发展史 unix是linux之父,学习linux后能容易上手unix. linux是源码开放的unix,由一位芬兰大学生李纳斯在网络上发起,和后来众多爱好者 ...

  5. BOM (Browser Object Model) 浏览器对象模型

    l对象的角色,因此所有在全局作用域中声明的变量/函数都会变成window对象的属性和方法; // PS:尝试访问未声明的变量会抛出错误,但是通过查询window对象,可以知道某个可能未声明的对象是否存 ...

  6. Atitit..文件上传组件选型and最佳实践总结(2)----断点续传

    Atitit..文件上传组件选型and最佳实践总结(2)----断点续传 1. 断点续传的原理 1 2. 如何判断一个插件/控件是否支持断点续传?? 1 3. 常用的组件选型结果::马 1 4. 自定 ...

  7. 生成读取相关连接的物理地址的lib(动态导入库)和dll(动态链接库)

    一.导出相关dll库 将原先的CmdInfoToPipe.h class后加入关键字 __declspec(dllexport) #ifndef NETINFO_CMDINFOTOPIPE_H_ #d ...

  8. 【BootStrap】初步教程

    <span style="font-family: Arial, Helvetica, sans-serif;">最近刚刚接触到BootStrap,在这里总结一下Boo ...

  9. Codeforces Round #379 (Div. 2) B. Anton and Digits 水题

    B. Anton and Digits 题目连接: http://codeforces.com/contest/734/problem/B Description Recently Anton fou ...

  10. web开发必备-网络基础知识---记录一下

    1.osi 7层网络模型 2.socket 套接字编程 PS:一个从事web开发的人来说,我们是使用http协议来和服务器来进行交互.后面会详细的分析这个过程.