网络应用中的数据解析,因为最近的应用,无论是Android的和ios平台的,一直用也是建议用的都是Json解析,

xml解析都有点被遗忘了。

然后最近自己在做着玩一个ios的小应用,涉及网络数据的抓取,一些网站可能都提供了自己api平台,这些一般都是支持

我们对于数据协议格式的设定的。但是后来我在找寻到一些Rss资源时,发现返回的数据都是xml格式的,

因此,那就只好用xml解析了。

XML解析其实这个概念出现了算够久了,以前javaweb什么到处都在用。这边我们主要大致介绍下,然后在在ios编程如何使用。

XML解析一般分两种模式SAX和DOM,事件和文档。具体解析google去吧,有详细。不过看了下面的两个例子,一般就了解了。

一:XML解析之SAX解析,以及对NSXMLParser的应用。

sax解析说白了,就是一个事物模型解析,从头开始读取文档然后根据读取到的头标签标签时要怎么处理,读完头标签后,理论上是读取标签值了,

然后读取后遇到结束标签等

简单举个例子

<rss xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0"> 头标签,里面的xmlns,可以看成是属性
<channel>
<title>呵呵呵呵</title>结束标签,中间的“呵呵呵呵”是首尾标签标签值空间

.......

好了,那么在ios开发中如何使用。

SDK本身是提供了NSXMLParser解析器。

  1. -(BOOL)parser:(NSString*)string
  2. {
  3. //系统自带的
  4. NSXMLParser *par = [[[NSXMLParser alloc] initWithData:[string dataUsingEncoding:NSUTF8StringEncoding]]autorelease];
  5. [par setDelegate:self];//设置NSXMLParser对象的解析方法代理
  6. return [par parse];//调用代理解析NSXMLParser对象,看解析是否成功   }
  7. }
  8. #pragma mark xmlparser
  9. //step 1 :准备解析
  10. - (void)parserDidStartDocument:(NSXMLParser *)parser
  11. {
  12. //    NSLog(@"%@",NSStringFromSelector(_cmd) );
  13. }
  14. //step 2:准备解析节点
  15. - (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName attributes:(NSDictionary *)attributeDict
  16. {
  17. //    NSLog(@"%@",NSStringFromSelector(_cmd) );
  18. }
  19. //step 3:获取首尾节点间内容
  20. - (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
  21. {
  22. NSLog(@"%@",NSStringFromSelector(_cmd) );
  23. }
  24. //step 4 :解析完当前节点
  25. - (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
  26. {
  27. NSLog(@"%@",NSStringFromSelector(_cmd) );
  28. }
  29. //step 5;解析结束
  30. - (void)parserDidEndDocument:(NSXMLParser *)parser
  31. {
  32. //    NSLog(@"%@",NSStringFromSelector(_cmd) );
  33. }
  34. //获取cdata块数据
  35. - (void)parser:(NSXMLParser *)parser foundCDATA:(NSData *)CDATABlock
  36. {
  37. //    NSLog(@"%@",NSStringFromSelector(_cmd) );
  38. }

1.初始化解析器,传入你要解析的数据。

2.parse,启动解析,返回一个是否解析成功Bool值。

3.基本你要处理的就在下面实现的1-5个代理方法了。

其实代理方法和详细,就是一个事物进行流程:

step1是准备解析,然后没意外就是执行到了——>

step2读取到第一个头节点了,然后如果内部有属性值,你可以获取出来,读完头节点,我们会进去值域——》

step3对于简单的节点,可能直接就是一个string值了,但是看例子我们会知道,很多情况下,该节点的值域包含的于是一个节点——》

这步其实分两种,如果是值,那么就是执行step4,获取值的字窜,如果是子节点呢,我们一看就知道,它又是进行了step2,

即读取到头标签了,其实你是很人读一片文章流程一样,只不过我们脑中有个印象<xxx>是头标签了,我们要做什么,独到 头标签的最后一个符号">"

下面进去值域,独到了字窜的话就调用了foundCharacters:(NSString *)string,如果又读到<xxx>这样的,那就又是头标签了。——》

step5就是读到开始尾标签符号了。

最后一个方法

foundCDATA:(NSData *)CDATABlock,其实也是一个格式

  1. <content:encoded>
  2. <![CDATA[
  3. <img src="http://img1.douban.com/mpic/s10489201.jpg" style="float:right;margin-left:16px"/><a href="http://www.douban.com/people/maldini/">减卐肥™</a>评论: <a href="http://movie.douban.com/subject/6799191//">搜索</a><br/> <br/>评价: 力荐<br/><br/>
  4. ]]>
  5. </content:encoded>

好了,方法和流程大致了解了,拿一个我最近遇到的例子,好多时候,我们会遇到这样读取一组类似于json中数组形式的数据

  1. <channel>
  2. <title>我是标题</title>
  3. <link>http://write.blog.csdn.net/postedit</link>
  4. <description>...</description>
  5. <language>zh-cn</language>
  6. <pubDate>Fri, 03 Aug 2012 06:20:31 GMT</pubDate>
  7. <item>...</item>
  8. <item>...</item>
  9. <item>...</item>
  10. <item>...</item>
  11. <item>...</item>
  12. <item>...</item>
  13. <item>...</item>
  14. <item>...</item>
  15. <item>...</item>
  16. <item>...</item>
  17. <item>...</item>
  18. <item>...</item>
  19. <item>...</item>
  20. <item>...</item>
  21. <item>...</item>
  22. <item>...</item>
  23. <item>...</item>
  24. <item>...</item>
  25. <item>...</item>
  26. <item>...</item>
  27. </channel>

一般来说,我们要的数据其实都是这20个item,对吧,每个item下都是相同的3个标签,title,author,time。形式上

其实一种数组形式
那么要怎么解析呢
1,首先我们可能先申明一个array数组容器用来存放这个20个对象,然后每个item对象中又有3个元素,那么我们可以
考虑用一个字典数据结构来表示每个item。
2.需要至少申请两个空间来作为类似于“哨兵”存储当前执行到的节点名,以及节点的值。
3.然后每次执行到读取到item时,初始化我们上面说道的一个字典数据结构。
4.在foundCharacters:方法中一直保存当前最新的值(当然,这里面其实会有个小瑕疵,下面会说到)。
5.在标签结束的方法,我们把标签名和值已键值对存入上面初始化的字典容器中。
  1. #pragma mark xmlparser
  2. //step 1 :准备解析
  3. - (void)parserDidStartDocument:(NSXMLParser *)parser
  4. {
  5. //    NSLog(@"%@",NSStringFromSelector(_cmd) );
  6. parserObjects = [[NSMutableArray alloc]init];
  7. }
  8. //step 2:准备解析节点
  9. - (void)parser:(NSXMLParser *)parser didStartElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName attributes:(NSDictionary *)attributeDict
  10. {
  11. //    NSLog(@"%@",NSStringFromSelector(_cmd) );
  12. self.currentText = [[NSMutableString alloc]init];
  13. [currentText release];
  14. if ([elementName isEqualToString:@"item"]) {
  15. NSMutableDictionary *newNode = [[ NSMutableDictionary alloc ] initWithCapacity : 0 ];
  16. twitterDic = newNode;
  17. [parserObjects addObject :newNode];
  18. [newNode release];
  19. }
  20. else if(twitterDic) {
  21. NSMutableString *string = [[ NSMutableString alloc ] initWithCapacity : 0 ];
  22. [twitterDic setObject :string forKey :elementName];
  23. [string release ];
  24. currentElementName = elementName;
  25. }
  26. }
  27. //step 3:获取首尾节点间内容
  28. - (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
  29. {
  30. NSLog(@"%@",NSStringFromSelector(_cmd) );
  31. [currentText appendString:string];
  32. }
  33. //step 4 :解析完当前节点
  34. - (void)parser:(NSXMLParser *)parser didEndElement:(NSString *)elementName namespaceURI:(NSString *)namespaceURI qualifiedName:(NSString *)qName
  35. {
  36. if ([elementName isEqualToString:@"item"]) {
  37. twitterDic = nil;
  38. }else
  39. if ([elementName isEqualToString:currentElementName]) {
  40. if ([elementName isEqualToString:@"description"]
  41. ||[elementName isEqualToString:@"content:encoded"]) {
  42. [twitterDic setObject:Cdata forKey:currentElementName];
  43. }else {
  44. [twitterDic setObject:currentText forKey:currentElementName];
  45. }
  46. }
  47. }
  48. //step 5;解析结束
  49. - (void)parserDidEndDocument:(NSXMLParser *)parser
  50. {
  51. }
  52. //获取cdata块数据
  53. - (void)parser:(NSXMLParser *)parser foundCDATA:(NSData *)CDATABlock
  54. {
  55. Cdata =[[NSString alloc] initWithData:CDATABlock encoding:NSUTF8StringEncoding];
  56. }

对于上面代码说几点

1.我次奥,有几处内存泄露~~~
2.在获取值为什么不直接currentString = string
这是实践发现的问题
- (void)parser:(NSXMLParser *)parser foundCharacters:(NSString *)string
 注意这个代理方法的注释
   // This returns the string of the characters encountered thus far. You may not necessarily get the longest character run. The parser reserves the right to hand these to the delegate as potentially many calls in a row to -parser:foundCharacters:
下面是google翻译。
这将返回迄今为止遇到的字符的字符串。你不一定得到的最长字符运行。解析器有权交行解析器可能多次呼吁这些委托:foundCharacters:
这个说明,在获取一个标签首尾间的字符数据时,这个方法可能被调用多次。
举个我碰到的最简单的列子
<copyright>&copy; 2012, douban.com.</copyright>
我在解析这个节点时,上面方法就调用了两次,
第一次只返回&,紧接着第二次返回copy; 2012, douban.com.
因此你如果要获取完整的的,应该用string的append方法来获取完整的一条记录。
3.解析速度的优化,比如我们只需要item中数据,那么在独到非这个域内的标签,我们的哨兵不需要追中的保存key和value值。
因此我做了一处字典的释放和判断,在found中想减少string的赋值,当然你也可以在全局添加个标记位来控制
但是总体来说,这种优化基本微乎其微,而且造成我内存莫名其妙的泄露了~~
4.以上思路可以参考,代码因为写的太冲忙,有写内存上的问题,就不要参考了,呵呵,过几天我子在改改,
可以做一个很好rss解析的模板。
 
 
二:Dom文档解析模型,TBXML第三方包应用。
dom解析模型就像一个树结构,节点,子节点,兄弟节点等等。
这个其实最后被我抛弃了,这个解析器太简化了,太简洁的东西导致控制的入口点太少,就比如一个一键优化的软件的概念是一样的,
一键清楚缓存,优化配置,文件归类等等。人为控制就少了,导致我解析上面那个模型时,只知道遍历存储~。但是这个解析期对部分要求不高的xml解析其实挺好分,真的很简洁。
  1. //- (void)recurrence:(TBXMLElement *)element {
  2. //
  3. //    NSString *eleName = [TBXML elementName:element];
  4. //    NSString *eleText = [TBXML textForElement:element];
  5. //    if ([eleName isEqualToString:@"item"]) {
  6. //        self recurrence:element
  7. //    }
  8. //
  9. //
  10. //
  11. //
  12. //    do {
  13. //
  14. //        NSString *eleName = [TBXML elementName:element];
  15. //        NSString *eleText = [TBXML textForElement:element];
  16. //
  17. //        //递归处理子树
  18. //        if (element->firstChild) {
  19. //            NSLog(@"<%@>:",eleName);// Display the name of the element
  20. //
  21. //            [self recurrence:element->firstChild];
  22. //        }else {
  23. //            NSLog(@"<%@>:%@",eleName,eleText);// Display the name of the element
  24. //
  25. //            TBXMLElement *parent = element->parentElement;
  26. //            if ([[TBXML elementName:parent] isEqualToString:@"item"]) {
  27. //                NLRssInfo *info = [[[NLRssInfo alloc]init] autorelease];
  28. //
  29. //                if ([eleName isEqualToString:@"title"]) {
  30. //                    info.title = eleText;
  31. //                }
  32. //
  33. //
  34. //                [dataArr addObject:info];
  35. //            }
  36. //
  37. //        }
  38. //
  39. //
  40. //        //迭代处理兄弟树
  41. //    } while ((element = element->nextSibling));
  42. //}

递归遍历,常规的树操作,具体内容可以网上搜搜,很多。

并且开源库的好处就是有源代码,也就3个类,6个文件,有兴趣可以研究研究,貌似大部分代码是用C写的。
 

网络数据的XML解析的更多相关文章

  1. IOS-网络(JSON解析数据与XML解析数据)

    一.JSON解析数据 // // VideoModel.h // IOS_0130_网络视频 // // Created by ma c on 16/1/30. // Copyright © 2016 ...

  2. 网络热恋之XML解析

    XML 可扩展标记语言 用于标记电子文件使其具有结构性的标记语言,可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言 易读性高,编码手写难度小,数据量大 NSXMLPars ...

  3. iOS 网络编程:XML解析

    1 XML文档结构 1.1 简介 XML 指可扩展标记语言(eXtensible Markup Language).XML 被设计用来传输和存储数据.其非常像HTML的标记语言,但与之不同的是,XML ...

  4. 分布式缓存系统 Memcached 状态机之网络数据读取与解析

    整个状态机的基本流程如下图所示,后续分析将按该流程来进行. 接上节分解,主线程将接收的连接socket分发给了某工作线程,然后工作线程从任务队列中取出该连接socket的CQ_ITEM,开始处理该连接 ...

  5. XML解析之DOM详解及与SAX解析方法的比较

    XML解析(DOM) XML文件解析方法介绍 我们所用到的NSXMLParser是采用SAX方法解析 SAX(Simple API for XML) 只能读,不能修改,只能顺序访问,适合解析大型XML ...

  6. 2016 - 1- 23 iOS中xml解析 (!!!!!!!有坑要解决!!!!!!)

    一: iOS中xml解析的几种方式简介 1.官方原生 NSXMLParser :SAX方式解析,使用起来比较简单 2.第三方框架 libxml2 :纯C 同时支持DOM与SAX GDataXML: D ...

  7. JavaEE:XML解析

    XML解析技术概述1.XML 技术主要企业应用1)存储和传输数据 2)作为框架的配置文件2.使用xml 存储和传输数据涉及到以下两点1)通过程序生成xml2)读取xml 中数据 ---- xml 解析 ...

  8. XML解析【介绍、DOM、SAX详细说明、jaxp、dom4j、XPATH】

    什么是XML解析 前面XML章节已经说了,XML被设计为"什么都不做",XML只用于组织.存储数据,除此之外的数据生成.读取.传送等等的操作都与XML本身无关! XML解析就是读取 ...

  9. Android从网络中获取xml文件并解析数据

    public class XmlwebData { @SuppressLint("UseValueOf") public static List<Person> get ...

随机推荐

  1. Material Design Button 样式

    132down voteaccepted I will add my answer since I don't use any of the other answers provided. With ...

  2. 解决由于一个软件限制策略的阻止,windows无法运行此程序cmd.reg

    解决由于一个软件限制策略的阻止,windows无法运行此程序cmd.reg Windows Registry Editor Version 5.00 [-HKEY_LOCAL_MACHINE\SOFT ...

  3. 【NOIP 2016】斗地主

    题意 NOIP 2016 斗地主 给你一些牌,按照斗地主的出牌方式,问最少多少次出完所有的牌. 分析 这道题的做法是DFS. 为了体现这道题的锻炼效果,我自己写了好多个代码. Ver1 直接暴力搞,加 ...

  4. 能源项目xml文件标签释义--default-lazy-init

    1.spring的default-lazy-init参数 spring在启动的时候,会默认加载会默认加载整个对象实例图,从初始化ACTION配置.到 service配置到dao配置.乃至到数据库连接. ...

  5. struts2文件下载相关信息

    struts.xml文件配置: <span style="font-size:16px;"><?xml version="1.0" encod ...

  6. Roman to Integer [LeetCode]

    Given a roman numeral, convert it to an integer. Input is guaranteed to be within the range from 1 t ...

  7. MVC之视图的布局

      1. RenderBody  布局在Razor引擎中没有了“母版页”,取而代之的是叫做“布局”的页面(_Layout.cshtml)放在了共享视图文件夹中.在这个页面中,会看到标签里有这样一条语句 ...

  8. python中数据的变量和字符串的常用使用方法

    1.查看变量类型: a=2 print(a,type(a)) print的用法:在print后面跟多个输出,可以用逗号分隔. 回收变量名,如把a存储不同的数据,你不需要删除原有变量就可以直接赋值 2. ...

  9. 报错解决:No Hibernate Session bound to thread, and configuration does not allow creation of non-transactional one here

    大概分析一般使用了注解才会报这方面的错 1.没有在spring的ApplicationContext.xml中开启注解事务 <!-- 开启注解事务 --> <tx:annotatio ...

  10. c#和数据库技术基础之程序设计集散地-数据库

    数据库,不明觉厉,今天我们就来数据库的神秘面纱 1.使用数据库的必要性 随着互联网技术的高速发展,截止到2013年我国网民的数量已接近6亿,网民数量的增长同事带动网上购物,微博,网络视频等新产业的发展 ...