元素节点、元素树

>>> from xml.etree.ElementTree import parse
>>> help(parse)
Help on function parse in module xml.etree.ElementTree: parse(source, parser=None)

help(parse)

>>> f  = open(r'C:\视频\python高效实践技巧笔记\6数据编码与处理相关话题\linker_log.xml')
>>>
>>> et = parse(f) #et ElementTree的对象
>>> help(et.getroot)
Help on method getroot in module xml.etree.ElementTree: getroot(self) method of xml.etree.ElementTree.ElementTree instance

help(et.getroot)

>>> root = et.getroot() #获取根节点 是一个元素对象

>>> root
<Element 'DOCUMENT' at 0x2e87f90>

#此节点的属性

>>> root.tag               #查看标签
'DOCUMENT' >>> root.attrib #查看属性,是一个字典,本例中有值,无值时为空
{'gen_time': 'Fri Dec 01 16:04:26 2017 '} >>> root.text #查看节点文本,是一个回车无自符串
'\n'
>>> root.text.strip() #将节点文本对 空白字符串过滤
''

>>> root.text.strip()

 ''

#root自身是一个可迭代对象,直接进行迭代遍历子元素

>>> for child in root:
print(child.get('id')) #child表示子元素 get()方法是获取某一属性。

输出结果

01ABBC90

01BF8610

01BF8AF0

01BFC5F0

01BFE3E8

01BFE850

01BFEAC8

01BFF128

01BFF2B0

01BFF4B8

01BFF730

01BFF960

01BFFB68

#通过find()、findall()、iterfind()只能找当前元素的直接子元素如本例中”root”只能找”MSG”而不能找”TEXT”

>>> root.find('MSG')       #find()找到第一个碰到的元素
<Element 'MSG' at 0x2e87fd0>
>>> root.find('MSG')
<Element 'MSG' at 0x2e87fd0>
>>> root.findall('MSG') #find()找到所有的元素
[<Element 'MSG' at 0x2e87fd0>, <Element 'MSG' at 0x2e9f0d0>, <Element 'MSG' at 0x2e9f170>, <Element 'MSG' at 0x2e9f210>, <Element 'MSG' at 0x2e9f2b0>, <Element 'MSG' at 0x2e9f350>, <Element 'MSG' at 0x2e9f3f0>, <Element 'MSG' at 0x2e9f490>, <Element 'MSG' at 0x2e9f530>, <Element 'MSG' at 0x2e9f5d0>, >>> root.find('TEXT') #“TEXT”是”MSG”的子元素,所以root直接find()找不到
>>>
>>> msg = root.find('MSG')
>>> msg.find('TEXT')
<Element 'TEXT' at 0x2e9f090> #iterfind() 生成可迭代对表
>>> iterMsg = root.iterfind('MSG')
>>> for i in xrange(5):
x = iterMsg.next()
print x.get('id')

输出

01BF8610

01BF8AF0

01BFC5F0

01BFE3E8

01BFE850

>>> iterMsg = root.iterfind('MSG')
>>> i = 0
>>> for x in iterMsg:
print(x.get('id'))
i+=1
if(i ==5):
break

输出结果:

01ABBC90

01BF8610

01BF8AF0

01BFC5F0

01BFE3E8

#iter()可以迭代出所有元素的节点

>>> root.iter()
<generator object iter at 0x02ED3CD8>

#递归查找某一元素

>>> list(root.iter('TEXT'))

三、查找高级用法

1、“*”查找所有的节点

>>> root.findall('MSG/*')   #查找MSG下的所有子节点,注意只能找其子节点而不能找其孙子节点

2、“.//”无论哪个层次下都能找到节点

>>> root.find('.//TEXT')        #能找到
<Element 'TEXT' at 0x2e9f090>
>>> root.find('TEXT') #不能找到
>>>

3、“..”找到父层次的节点

>>> root.find('.//TEXT/..')
<Element 'MSG' at 0x2e87fd0>

4、“@”包含某一属性

>>> root.find('MSG[@name]')          #没有包含name属性的
>>> root.find('MSG[@Type]') #没有包含Type属性的
>>> root.find('MSG[@type]') #存在包含type属性的,并返回
<Element 'MSG' at 0x2e87fd0>

5、属性等于特定值

>>> root.find('MSG[@id="01BFE3E8"]')   #注意参数里的=号后面的字符串需要带引号
<Element 'MSG' at 0x2e9f2b0>

6、指定序号

>>> root.find("MSG[2]")      #找第二个
<Element 'MSG' at 0x2e9f0d0> >>> root.find("MSG[last()]") #找最后一个
<Element 'MSG' at 0x2ecdef0> >>> root.find("MSG[last()-1]") #找倒数第二个
<Element 'MSG' at 0x2ecde30>

6-3 如何解析简单的XML文档的更多相关文章

  1. SAX解析和生成XML文档

    原创作品,允许转载,转载时请务必以超链接形式标明文章 原始出处 .作者信息和本人声明.否则将追究法律责任. 作者: 永恒の_☆ 地址: http://blog.csdn.net/chenghui031 ...

  2. 使用dom解析器对xml文档内容进行增删查改

    直接添代码: XML文档名称(one.xml) <?xml version="1.0" encoding="UTF-8" standalone=" ...

  3. 用python批量生成简单的xml文档

    最近生成训练数据时,给一批无效的背景图片生成对应的xml文档,我用python写了一个简单的批量生成xml文档的demo,遇见了意外的小问题,记录一下. 报错问题为:ImportError: No m ...

  4. Dom4j解析语音数据XML文档(注意ArrayList多次添加对象,会导致覆盖之前的对象)

    今天做的一个用dom4j解析声音文本的xml文档时,我用ArrayList来存储每一个Item的信息,要注意ArrayList多次添加对象,会导致覆盖之前的对象:解决方案是在最后将对象添加入Array ...

  5. WSDL 文档-一个简单的 XML 文档

    WSDL 文档是利用这些主要的元素来描述某个 web service 的: <portType>-web service 执行的操作 <message>-web service ...

  6. MVC模式简单的Xml文档解析加Vue渲染

    前端代码: <script src="~/Js/jquery-3.3.1.min.js"></script> <script src="~/ ...

  7. Java DOM解析器 - 修改XML文档

    这是我们需要修改的输入XML文件: 1 2 3 4 5 6 7 8 9 10 11 12 <?xml version="1.0" encoding="UTF-8&q ...

  8. Java DOM解析器 - 查询XML文档

    这是需要我们查询的输入XML文件: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 <?xml version="1.0"?> ...

  9. iOS网络编程笔记——XML文档解析

    今天利用多余时间研究了一下XML文档解析,虽然现在移动端使用的数据格式基本为JSON格式,但是XML格式毕竟多年来一直在各种计算机语言之间使用,是一种老牌的经典的灵活的数据交换格式.所以我认为还是很有 ...

随机推荐

  1. C#内存占用释放

    序言 系统启动起来以后,内存占用越来越大,使用析构函数.GC.Collect什么的也不见效果,后来查了好久,找到了个办法,就是使用 SetProcessWorkingSetSize函数.这个函数是Wi ...

  2. Python常用的库简单介绍一下

    Python常用的库简单介绍一下fuzzywuzzy ,字符串模糊匹配. esmre ,正则表达式的加速器. colorama 主要用来给文本添加各种颜色,并且非常简单易用. Prettytable ...

  3. Springboot入门:

    Springboot入门: 1.springboot是基于spring的全新框架,设计目的:简化spring应用配置和开发过程. 该框架遵循“约定大于配置”原则,采用特定的方式进行配置,从而事开发者无 ...

  4. java8 for循环了改为 流

    刚开始用java8的时候,很多都是替代for循环,因为java8推出了强大的流stream,关于流的用法很多,百度一下就可以搜到语法之类,所以这里我只想举一些简单替代for的例子,含义那些就自己去查吧 ...

  5. FP AUTO节点ZPP002M执行卡住解决

    正常情况下,不到一分钟即可执行完ZPP002M节点 异常情况下,超过十分钟都没有响应 再等待只会影响FP的执行时间,影响后续的节点,解决办法是将正在执行的JOB STOP掉 再到服务器上将该节点重新执 ...

  6. 【ELK学习】初识ElasticSearch

    ES(elasticsearch) 是一个高可扩展的.开源的全文检索和分析引擎,它允许你存储.检索.分析海量数据,以一种快到近乎实时的速度. ES用例场景: 使用ES存储商品目录.清单,提供检索.输入 ...

  7. 域名、主机名与URL

    什么是域名? google.com.baidu.com.163.com等. 域名.主机名与URL例子 例子1: http://mail.163.com/index.html 1)http://:这个是 ...

  8. md5值校验

    使用哈希的md5给文件加指纹,如果文件被更改,指纹信息就会不匹配,从而确定文件的原值是否被改动. [root@b test]# md5sum a.txt > zhiwen.txt[root@b ...

  9. c# SQLite 判断表、字段是否存在的方法,新增、删除、重命名列

    SQLiteHelper class: using System; using System.Collections.Generic; using System.Text; using System. ...

  10. 异步编程:IAsyncResult异步编程模型 (APM)

    http://www.cnblogs.com/heyuquan/archive/2013/03/22/2976420.html