C++读取XML,tinyXml的使用
前言:
最近在开发的过程中,有个需求是对xml进行格式转化,从一种格式转化到另外一种格式.因此,就需要读取xml进行处理.原本打算写成工具在linux下运行,不过后来考虑到和系统结合,最后也就使用了前台js转了.反正都是读取xml,什么技术转不都是一样的么?
不过刚开始还是对要使用的技术做了一定的探究.c++要读取xml有很多种方式.比较又名的有:
rapidXML(这个是网上介绍的,没用过)
Xerces-C++ XML Parser: 通常来说,读取XML的方法都是将整个文本进行读取,然后构建成DOM Tree,之后进行遍历等操作.这个Parser除了支持构建DOM Tree的方式之外,还支持类似于回调函数的方式进行处理(SAX,SAX2).在读到相应的节点然后调用函数进行处理.DOM Tree的方式好处是简单,操作很方便,但是劣势也是很明显:需要把整个XML读进之后才能做处理.如果XML很大,那内存就支撑不住 了.SAX,SAX2的作用就在此.其可以支持很大的XML,因为其是相当于事件式的处理方式,不需要构建DOM Tree.不过就是比较麻烦.
TinyXML: 这个就是接下来要介绍的库了.取名Tiny,意在编写一个轻量级的处理基本XML的工具.因此,其支持的特性有限.下面列出了其不支持的功能:
TinyXML doesn't parse or use DTDs (Document Type Definitions) or XSLs (eXtensible Stylesheet Language.)
-------------------官方说明文档
其给出的理由也很明确:
1. 支持这两个特性使得库更为庞大
2. 使用更为复杂
3. 学习曲线更曲折
需要使用这些特性的可以考虑上面的xerces-C++ XML Parser.很强大.当然也复杂得多
TinyXml使用:
前言说的已经够多了,咱们就不废话了,直接讲解tinyXml的使用方法.
安装:
TinyXml的安装方法并不复杂,或者说没有安装这个步骤.
1. 下载tinyXml ,下载tinyxml_2_6_2.zip
2. 解压unzip tinyxml_2_6_2.zip.(windows就直接解压就可以了)
对于有vs的朋友来说,直接打开tinyxml.sln就可以了.对于linux用户来说,则需要拷贝上面全出来的6个文件.
PS.顺带的,我觉得可以把它的Makefile也拷出来.写得非常不错.可以参考参考.
使用:
tinyxml的使用方法很简单,只需要把拷出来的文件放在自己编写的目录下面,引用tinyxml.h,tinystr.h即可.
简单示例代码:

1 #include "tinyxml.h"
2 #include "tinystr.h"
3 #include <iostream>
4
5 using namespace std;
6 int main(int argc, char *argv[])
7 {
8 if(argc != 2)
9 {
10 cout << "usage: "<<argv[0] << " xmlfile" << endl;
11 return 1;
12 }
13 TiXmlDocument doc(argv[1]);
14 bool loadOk = doc.LoadFile();
15 if (!loadOk)
16 {
17 cout << "could load:" << doc.ErrorDesc() << endl;
18 }
19 TiXmlPrinter printer;//提供的工具类,目的是将xml的数据按格式输出
20 doc.Accept(&printer);
21 cout << printer.CStr() << endl;//输出
22
23 TiXmlElement*node = doc.FirstChildElement();//获取第一个element节点
24 cout << node->Value() << endl;//输出节点的值
25 string t;
26 node->QueryValueAttribute("type", &t);//获取节点属性
27 cout << t << endl;
28
29 doc.FirstChild()->NextSibling()->ToElement()->QueryStringAttribute("type", &t);//获取第二个子节点的数据
30 cout << "2:" << t << endl;
31
32 //使用遍历的方式进行处理
33 TiXmlNode* child = NULL;
34 TiXmlElement* element = NULL;
35 TiXmlAttribute *attr = NULL;
36 int ct;
37 while(child = doc.FirstChild()->IterateChildren(child))
38 {
39 cout << child->ValueStr() << "\t";
40 ct = child->Type();
41 cout << ct << "\t";
42 //根据不同的节点类型做相应处理
43 switch(ct)
44 {
45 case TiXmlNode::TINYXML_TEXT:
46 break;
47 case TiXmlNode::TINYXML_ELEMENT:
48 element = child->ToElement();
49 attr = element->FirstAttribute();
50 while(attr)
51 {
52 cout << attr->NameTStr() << "=" << attr->ValueStr() << '\t';
53 attr = attr->Next();
54 }
55 break;
56 }
57 }
58
59 return 0;
60 }

编译命令:
g++ -c tinyxmlparser.cpp -DTIXML_USE_STL
g++ -c tinyxmlerror.cpp -DTIXML_USE_STL
g++ -c tinystr.cpp -DTIXML_USE_STL
g++ -c tinyxml.cpp -DTIXML_USE_STL
g++ -c xmltest.cpp -DTIXML_USE_STL
g++ -o xmltest xmltest.o tinyxmlparser.o tinyxmlerror.o tinystr.o tinyxml.o
或者大家可以参考那个Makefile改改.
xml文件:
<xml>
<tag1 type='1'/>
<tag2 type='2'/>
</xml>
运行结果:

<xml>
<tag1 type="1" />
<tag2 type="2" />
</xml> xml 1:
tag1 1 type=1 tag2 1 type=2

没打回车显得比较混乱,将就这看看.
详细解释:
这部分仅仅是我的理解,可能有错.有错的话还请告知我下.
tinyxml按照xml的规定,将所有结点做了区分.我们也可以看到类库中有:
TiXmlDocument:文档中的根
TiXmlNode: node为文档中所有结点的父类型.其可以转化为其他的结点类型.
TiXmlElement: element结点.即我们平常所使用的,具有属性,tagName的结点.
TiXmlComment: 注释
TiXmlText: 文字结点.
TiXmlDeclaration: xml的声明(?xml version="1.0" standalone="yes"?>)
TiXmlUnknown: 任何tinyXml不认的结点都将归结为unknown,在重新写回文件时,按照原样输出.
一般我们的操作仅仅在于,取tagName,获取属性,获取文字,迭代.这里就讲下这些操作.
tagName: 对于element来说,可以使用element->Value()或者element->ValueStr();//两者区别仅仅在于返回值不同,后者返回string.
对于Value()函数来说,文档上也解释了,对于不同的结点,返回值不同.
Document: filename of the xml file
Element: name of the element
Comment: the comment text
Unknown: the tag contents
Text: the text string
获取属性:获取属性有多种方式.最简单的是采用const char* Attrubute(const char *),或者采用QueryValueAttribute (const std::string &name, T *outValue) const.还有获取相应类型,如Int,double等的函数.可以自己查看手册.有时候需要遍历属性时,可以这么写

TiXmlAttribute *attr = NULL;
attr = element->FirstAttribute();
while(attr)
{
cout << attr->NameTStr() << "=" << attr->ValueStr();
attr = attr->Next();
}

获取文字:element->GetText();
迭代:
TiXmlNode *child = NULL;
while(child = parent->IterateChildren(child))
{
cout << child->ValueStr() << endl;
}
总结:
对于TinyXml的介绍大致到这.还有很多细节还没叙述,不过可以看看文档,下的源码包里头就有doc,很方便,讲的也很详细.
有什么问题可以随时讨论.欢迎留言哈.
C++读取XML,tinyXml的使用的更多相关文章
- C++ 读取XML文件(tinyXML库的应用)
C++读取xml有很多第三方的xml解析库,最近使用tinyxml库来解析,下面直接上应用例子: Skin.xml文档内容如下: <UI> <Image name="ban ...
- cocos2dx中调用TinyXml读取xml配置文件 || cocos2d-x 中跨平台tinyxml读取xml文件方式
TiXmlDocument *doc = newTiXmlDocument; #if (CC_TARGET_PLATFORM ==CC_PLATFORM_ANDROID) //Android平台tin ...
- Android 开发自己的网络收音机4——读取XML文件的电台数据
国内外的电台数据很多,起码有好几百,所以把这些数据都写到代码里面是不实际的.只能写成一个数据文件,程序启动的时候再去加载.保存这些简单数据,我们肯定会优先使用XML文件,今天讲讲如何读取XML里面的数 ...
- 读取xml数据装配到字典中之应用场景
前段时间看到支付宝设置里面有个多语言这个功能,蛮有意思的,就想双休没事的话做个相关的demo玩玩,可是礼拜六被妹子拽出去玩了一天,来大上海有大半年了,基本没有出去玩过,妹子说我是超级宅男,也不带她出去 ...
- 自己动手之使用反射和泛型,动态读取XML创建类实例并赋值
前言: 最近小匹夫参与的游戏项目到了需要读取数据的阶段了,那么觉得自己业余时间也该实践下数据相关的内容.那么从哪入手呢?因为用的是Unity3d的游戏引擎,思来想去就选择了C#读取XML文件这个小功能 ...
- MFC如何读取XML
<?xml version="1.0" encoding="utf-8"?> <Cases> <case> <No&g ...
- 使用dom4j读取xml连接数据库与之单例模式
使用dom4j读取xml ,加入jar包 dom4j-1.6.1.jar jaxen-1.1-beta-6.jar public class XmlConfigReader { //懒汉式,延迟加载 ...
- java DOM4J 读取XML
最近学习Java,在处理XML文档的时候,查阅相关资料,发现了DOM4J这个jre库,相对C#的XML处理来说,功能还算是跟得上 下面展示一篇我自己写的一个XML读取测试 import java.ut ...
- C#中常用的读取xml的几种方法(转)
本文完全来源于http://blog.csdn.net/tiemufeng1122/article/details/6723764,仅作个人学习之用. XML文件是一种常用的文件格式,例如WinFor ...
随机推荐
- EasyRTMP Android安卓手机直播推流摄像头偏暗的问题解决
在我们测试EasyRTMP Android安卓手机推流的过程中发现有些设备预览时,明显偏暗!在稍微暗点的环境中几乎很难看清东西-额,这是怎么回事呢?又是安卓设备的兼容性问题,头疼! !!!好吧,停止抱 ...
- C#单元测试(转)
C#,单元测试入门(以下内容可能来自网络) 一.什么叫单元测试(unit testing)? 是指对软件中的最小可测试单元进行检查和验证.对于单元测试中单元的含义,一般来说,要根据实际情况去判定其具体 ...
- iOS 流布局 UICollectionView使用(UICollectionVIew的代理方法)
UICollectionViewDataSource协议 这个协议主要用于collectionView相关数据的处理,包含方法如下: 设置分区数(这个是可选实现的) - (NSInteger)numb ...
- 【题解】CF559C C. Gerald and Giant Chess(容斥+格路问题)
[题解]CF559C C. Gerald and Giant Chess(容斥+格路问题) 55336399 Practice: Winlere 559C - 22 GNU C++11 Accepte ...
- ERROR 1217 (23000): Cannot delete or update a parent row: a foreign key constraint fails
mysql 删除表时提示有外键 mysql> drop tables auth_group;ERROR 1217 (23000): Cannot delete or update a paren ...
- Table control 相关
转:晚上回去有时间看看 http://help.sap.com/saphelp_nw04/helpdata/en/9f/dbac1d35c111d1829f0000e829fbfe/frameset. ...
- kinect/xiton 的环境搭建 + rgb图像和深度图的标定
~ 软件下载地址 openni https://structure.io/openni https://github.com/OpenNI/OpenNI2 其他软件建议直接下载或通过某宝购买配套的 ~ ...
- 【shell】awk引用外部变量
在使用awk的过程中,经常会需要引用外部变量,但是awk需要使用单引号将print包起来,导致print后的$引用无效,可以采用下面的方式 例如: #!/bin/bash a="line1 ...
- 【shell】获取第10+个位置参数
转载自:http://www.cnblogs.com/sheldonxu/archive/2012/06/25/2560770.html 在Shell脚本中,可以用$n的方式获取第n个参数,例如,一个 ...
- AFNetworking3.0使用简介
注意到咱们集成的版本为3.0.4. 下面的类已从AFNetworking 3.0中废弃: AFURLConnectionOperation AFHTTPRequestOperation AFHTTPR ...