C# XML解析

摘自：http://www.cnblogs.com/RiseSoft/archive/2012/03/17/2404007.html

之前在项目中处理的都是一些小数据量的XML文件，都是直接用.Net Framework中System.XML命名空间下的基本的XmlDocument、XmlElement、XmlNode等基本类，读取了节点之后，获取属性及其内部文本内容，但是这种方法在处理小文本量XML数据时，尚可使用，一旦处理较大数据量的XML数据，就显得那么笨拙，效率也低下。

用XPath语言可以方便高效的筛选、获取我们想要的节点、属性等，正如博友所说“XPath语言相对于XML就如同SQL语言相对于DataBase”，这里也给大家分享下：

1.这里我参照MSDN给出一个XML源文件，为了显示不同的效果，XML结构在逻辑上并不合理

 1 <?xml version="1.0" encoding="utf-8" ?>
 2 <bookstore>
 3   <book>
 4     <title>C语言</title>
 5     <author name ="XIAO">
 6       <age>25</age>
 7     </author>
 8     <price>50</price>
 9   </book>
10   <book>
11     <title>数据库</title>
12     <price>100</price >
13   </book >
14   <book>
15     <title>数据结构</title>
16     <age>100</age>
17     <author name ="Wang">
18       <age>25</age>
19       <sex>female</sex>
20     </author>
21     <price>66.5</price >
22   </book >
23 </bookstore>

2.简单示例

 1         private void button1_Click(object sender, EventArgs e)
 2         {
 3             XmlDocument doc = new XmlDocument();
 4             doc.Load(@"..\..\CD.xml");
 5 
 6             XmlElement root = null;
 7             root = doc.DocumentElement;
 8 
 9             XmlNodeList listNodes = null;
10             listNodes = root.SelectNodes("/bookstore/book/price");
11             foreach (XmlNode node in listNodes )
12             {
13                 richTextBox1.Text += node.InnerText + "\n";
14             }
15         }

这里 listNodes=root.SelectNodes("/bookstore/book/price");意思是选取所有符合bookstore——>book——>price层级关系的price节点

效果如下图：

3.XPath详解

1)"/bookstore/book/price"

XPath的开头是一个斜线（/）代表这是绝对路径，这可以选出所有路径符合这个模式的元素。这代表选出所有bookstore根节点下的book元素下的price元素。

2)"//title"

开头是两个斜线（//）表示文件中所有符合模式的元素都会被选出来，即使是处于树中不同的层级也会被选出来。这代表选出所有title元素。

3)"/bookstore/book/author/*"

使用星号（*）可以选择未知的元素。这代表选出bookstore根节点下的book节点下的anthor节点下的所有可能的节点。

得到的结果：25 25 female

4)"/bookstore/book/*/age"

上面的语法会选出所有bookstore根节点下的book节点的隔一个层次的age节点。

得到的结果为：25 25

5)"/*/*/age"

选取有两个层级的age元素，得到的结果为：100

要注意的是，想要存取不分层级的元素，XPath语法必须以两个斜线开头(//)，想要存取未知元素才用星号(*)，星号只能代表未知名称的元素，不能代表未知层级的元素。

6)"bookstore/book[1]/title"

使用中括号可以选择分支。这代表选择bookstore根节点下第一个book节点的title节点。

得到的结果为：C语言

7)"bookstore/book[last()]/title"

同样，这里表示选择最后一个节点，得到的结果是：数据结构

8)"bookstore/book/author[sex]"

这里表示选取所有带有sex元素并满足一定层次结构的author节点，得到的结果是：25female

9)"/bookstore/book[price=66.5]/title"

选取price元素值是66.5的book节点的title子节点，得到的结果是：数据结构

10)"/bookstore/book/title | /bookstore/book/price"

使用Or操作数(|)就可以选择一个以上的路径。这里表示选取符合一定层次结构的title元素与price元素

其结果是：C语言 50 数据库 100 数据结构 66.5

11)"//@name"

在XPath中，除了选择元素以外，也可以选择属性，属性都是以@开头。这里表示选取所有的name属性。

其结果是：XIAO Wang

12)"//author[@name]/age"

这里表示选取所有具有name属性的author节点的age节点。其结果是：25 25

13)"//*[@*]"

选取所有有属性的节点。其结果是：25 25female

14)"//author[@name='Wang']/sex"

选取所有属性name值为Wang的author节点的sex子节点。其结果是：female

4.带有命名空间(NameSpace)的XML文本解析

XML文本：

 1 <?xml version="1.0" encoding="utf-8" ?>
 2 <bookstore xmlns="http://www.lucernepublishing.com"
 3            xml:base="http://www.semanticweb.org/ontologies/2012/2/OntologyMinePower.owl">
 4   <book>
 5     <title>C语言</title>
 6     <author name ="XIAO">
 7       <age>25</age>
 8     </author>
 9     <price>50</price>
10   </book>
11   <book>
12     <title>数据库</title>
13     <price>100</price >
14   </book >
15   <book>
16     <title>数据结构</title>
17     <age>100</age>
18     <author name ="Wang">
19       <age>25</age>
20       <sex>female</sex>
21     </author>
22     <price>66.5</price >
23   </book >
24 </bookstore>

解析：

 1         private void button1_Click(object sender, EventArgs e)
 2         {
 3             XmlDocument doc = new XmlDocument();
 4             doc.Load(@"..\..\CD.xml");
 5 
 6             XmlElement root = null;
 7             root = doc.DocumentElement;
 8 
 9             XmlNamespaceManager nsmgr = new XmlNamespaceManager(doc.NameTable);
10             nsmgr.AddNamespace("ab", "http://www.lucernepublishing.com");
11            
12             XmlNodeList listNodes = null;
13             listNodes = doc.SelectNodes("/ab:bookstore/ab:book[ab:author[ab:sex]]/ab:price", nsmgr);
14             foreach (XmlNode node in listNodes )
15             {
16                 richTextBox1.Text += node.InnerText + "\n";
17             }
18         }

该XPath语言的意思是查询bookstore下的所有带有author节点，并且author节点带有sex节点的book节点的price子节点。其结果是66.5

对于有命名空间的XML文本的解析，只需调用XmlNode.SelectNodes的不同的重载函数，赋予XmlNamespaceManager参数，并相应调整XPath语句即可。

文章参考:

MSDN中XmlNode.SelectNodes 方法;

W3CSchool在线帮助XPath;

http://www.cnblogs.com/hya1109/archive/2007/12/16/996535.html

C# XML解析的更多相关文章

xml解析技术
本文总结Dom,sax解析, 使用Java作为工具解析xml文档. 1 Dom 综述:Dom解析xml通常也称为xmlDom (和htmlDom技术差不多),将xml文档封装成树,好处就是xml中的 ...
Duilib源码分析(三)XML解析器—CMarkup
上一节介绍了控件构造器CDialogBuilder,接下来将分析其XML解析器CMarkup: CMarkup:xml解析器,目前内置支持三种编码格式:UTF8.UNICODE.ASNI,默认为UTF ...
JSON解析和XML解析对比
JSON解析和XML解析是较为普遍的两种解析方式,其中JSON解析的市场分额更大.本文系统的分析两种解析方式的区别,为更好地处理数据作准备.由于目前阶段主要是做移动开发,所以本文所描述的JSON解析和 ...
【Android】实现XML解析的几种技术
本文介绍在Android平台中实现对XML的三种解析方式. XML在各种开发中都广泛应用,Android也不例外.作为承载数据的一个重要角色,如何读写XML成为Android开发中一项重要的技能. 在 ...
定位和xml解析和gson解析加上拉加载，下拉刷新
这里的上拉加载,下拉刷新用到是依赖包 Mainactivity,xml解析和定位 package com.exmple.autolayout; import java.util.List; impor ...
tinyxml一个优秀的C++ XML解析器
读取和设置xml配置文件是最常用的操作,试用了几个C++的XML解析器,个人感觉TinyXML是使用起来最舒服的,因为它的API接口和Java的十分类似,面向对象性很好. TinyXML是一个开源的解 ...
PERL/LEX/YACC技术实现文本解析--XML解析
继周六的p_enum.pl后,再来一篇说说我用perl做的lex,yacc工具.之前说了,我学习lex和yacc的最初动机是为了做个C语言解释器的SHELL:但后来工作中的实际需要也是制作perl版l ...
基本XML解析---编写
#import "ViewController.h" #import "DDXML.h" @interface ViewController () @end @ ...
iOS-数据解析XML解析的多种平台介绍
在iPhone开发中,XML的解析有很多选择,iOS SDK提供了NSXMLParser和libxml2两个类库,另外还有很多第三方类库可选,例如TBXML.TouchXML.KissXML.Tiny ...
XML解析之DOM详解及与SAX解析方法的比较
XML解析(DOM) XML文件解析方法介绍我们所用到的NSXMLParser是采用SAX方法解析 SAX(Simple API for XML) 只能读,不能修改,只能顺序访问,适合解析大型XML ...

随机推荐

Git进阶之路：配置git同时推送github和gitee仓库
1. 进入工程根目录打开.git文件夹(需要显示隐藏文件夹) 2. 打开.git文件夹下的config文件进行编辑添加github和gitee仓库地址 3. 推送验证 github提交记录 gitee ...
linux定时重启服务器
需求说明系统配置低了,且应用程序内一直在执行定时任务,在程序运行一段时间后,发现接口请求会变得很慢,需要每天定时凌晨重启服务器脚本实现 1. linux 终端输入crontab -e,添加定时任务 ...
C#开发PACS医学影像处理系统(十七)：2D处理之影像旋转和翻转
1.任意角度旋转在XAML设计器中,设置RotateTransform属性 <InkCanvas x:Name="ToolInkCanvas" UseCustomCurso ...
elasticsearch 索引清理脚本及常用命令
elastic索引日志清理不及时,很容易产生磁盘紧张,官网给出curl -k -XDELETE可以清理不需要的索引日志. 清理脚本 #!/bin/bash #Author: 648403020@qq. ...
Unity3D 一、游戏
3D游戏编程第一次作业作业要求阅读 Tracy Fullerton, *GAME DESIGN WORKSHOP* 第2-4章(游戏结构.基本元素.戏剧元素).选择一款你喜欢的中等规模游戏如&qu ...
zabbix_server.conf配置文件参数
NodeID: 在amster-child 的分布式架构中,这个ID是唯一标识zabbix node的号码 ListenPort:Trapper 类型Item监听的端口, SourceIP: 在连接其 ...
正则表达式（代码java版）
目录元字符检测工具普通字符字符类预定义字符类数量词默认数量词自定义量词预定义量词边界标识符正则组简单应用复杂组序捕获组看了好些天的正则表达式,终于有时间来写一篇关于它的博 ...
智慧组织（SO）如何敏捷构建？
人类社会正处于千年未有之变局的关键时刻--互联网.大数据.AI和实体经济深度融合,数据正在重新定义世界并重构财富体系."新旧交织.破立并存",数字经济方兴未艾,传统势力逐步淡出.各 ...
对Elasticsearch生命周期的思考
什么是es索引的生命周期?有啥用?可以怎么用?用了有什么好处呢? 在现实的生产环境中有没有觉得自己刚开始设计的索引的分片数刚刚好,但是随着时间的增长,数据量增大,增长速度增大的情况下,你的es索引的设 ...
动态生成简约MVC请求接口|抛弃一切注解减少重复劳动吧
背景目前创建一个后端请求接口给别人提供服务,无论是使用SpringMVC方式注解,还是使用SpringCloud的Feign注解,都是需要填写好@RequestMap.@Controller.@Pa ...

C# XML解析

C# XML解析的更多相关文章

随机推荐

热门专题