【XML基本概念介绍】

XML 指可扩展标记语言(eXtensible Markup Language)。
XML 被设计用来传输和存储数据。
概念一:

<foo>      # foo元素的起始标签
</foo> # foo元素的结束标签
# note: 每一个起始标签必须有对应的结束标签来闭合, 也可以写成<foo/>

概念二:

<foo>           # 元素可以嵌套到任意参次
<bar></bar> # bar元素为foo元素的子元素
</foo> # 父元素foo的结束标签

概念三:

<foo lang='EN'>#foo元素有个lang的属性,该属性值为:EN 对应Python字典Name-Value对
<bar id='001' lang="CH"></bar> # bar元素有个lang的属性,该属性值为:CH;还有个id属性,值为:001,放置在''或“”中;
</foo> # bar元素中的lang属性不会和foo元素中相冲突,每个元素都有独立的属性集;

概念四:

<title>Learning Python</title> # 元素可以有文本内容
# Note:如果一个元素即没有文本内容,也没有子元素,则为空元素。

概念五:

<info>   # info元素为根节点
<list id='001'> A </list> # list元素为子节点
<list id='002'> B </list>
<list id='003'> C </list>
</info>

概念六:

<feed xmlns='http://www.w3.org/2005/Atom'>#可以通过声明xmlns来定义默认名字空间,feed元素处于http://www.w3.org/2005/Atom命名空间中
<title>dive into mark</title>#title元素也是。名字空间声明不仅会作用于当前声明它的元素,还会影响到该元素的所有子元素
</feed>#也可以通过xmlns:prefix声明来定义一个名字空间并取其名为prefix。然后该名字空间中的每个元素都必须显式地使用这个前缀(prefix)来声明。
<atom:feed xmlns:atom='http://www.w3.org/2005/Atom'> # feed属于命名空间atom
<atom:title>dive into mark</atom:title>#title元素同样属于该命名空间
</atom:feed> # xmlns(XML Name Space)

【ElementTree解析】

两种实现

ElementTree生来就是为了处理XML ,它在Python标准库中有两种实现。
一种是纯Python实现,例如: xml.etree.ElementTree
另外一种是速度快一点的:   xml.etree.cElementTree
尽量使用C语言实现的那种,因为它速度更快,而且消耗的内存更少! 在程序中可以这样写:

try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.ElementTree as ET

常用方法

# 当要获取属性值时,用attrib方法。
# 当要获取节点值时,用text方法。
# 当要获取节点名时,用tag方法。

示例XML

<?xml version="1.0" encoding="utf-8"?>
<info>
<intro>Book message</intro>
<list id='001'>
<head>bookone</head>
<name>python check</name>
<number>001</number>
<page>200</page>
</list>
<list id='002'>
<head>booktwo</head>
<name>python learn</name>
<number>002</number>
<page>300</page>
</list>
</info>

加载XML

root = ET.parse(‘book.xml’)

加载字符串

root = ET.fromstring(xmltext)

获得指定节点:

方法一:获得指定节点->getiterator()方法

book_node = root.getiterator('list')

方法二:获得指定节点->findall()方法

book_node = root.findall('list') 

方法三:获得指定节点->find()方法

book_node = root.find('list') 

方法四:获得儿子节点->getchildren()

for node in book_node: 
    book_node_child = node.getchildren()[0] 
    print book_node_child.tag, '=> ', book_node_child.text

示例:

try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.cElementTree as ET root = ET.parse(r'I:\PythonTest\book.xml') #加载文件
books = root.findall('./list')
for book_list in books:
print('='*30)
for book in book_list:
if id in book.attrib :
print('id:',book.attrib['id'])
print(book.tag + '==>' + book.text)
print('='*30)

输出结果:

==============================
head==>bookone
name==>python check
number==>001
page==>200
==============================
head==>booktwo
name==>python learn
number==>002
page==>300
==============================

转自:http://www.jb51.net/article/67120.htm

Python-elementTree方法解析xml文件-01的更多相关文章

  1. 对DOM,SAX,JDOM,DOM4J四种方法解析XML文件的分析

    1.DOM 与平台无关的官方解析方式 DOM是一次性把xml文件加载到内存中,形成一个节点树 对内存有要求 2.SAX java提供的基于事件驱动的解析方式 每次遇到一个标签,会触发相应的事件方法 3 ...

  2. python解析xml文件时使用ElementTree和cElementTree的不同点;iter

    在python中,解析xml文件时,会选用ElementTree或者cElementTree,那么两者有什么不同呢? 1.cElementTree速度上要比ElementTree快,比较cElemen ...

  3. JAVA中使用DOM解析XML文件

    XML是一种方便快捷高效的数据保存传输的格式,在JSON广泛使用之前,XML是服务器和客户端之间数据传输的主要方式.因此,需要使用各种方式,解析服务器传送过来的信息,以供使用者查看. JAVA作为一种 ...

  4. 【JAVA使用XPath、DOM4J解析XML文件,实现对XML文件的CRUD操作】

    一.简介 1.使用XPath可以快速精确定位指定的节点,以实现对XML文件的CRUD操作. 2.去网上下载一个“XPath帮助文档”,以便于查看语法等详细信息,最好是那种有很多实例的那种. 3.学习X ...

  5. iOS 详解NSXMLParser方法解析XML数据方法

    前一篇文章已经介绍了如何通过URL从网络上获取xml数据.下面介绍如何将获取到的数据进行解析. 下面先看看xml的数据格式吧! <?xml version="1.0" enc ...

  6. Java是如何解析xml文件的(DOM)

    Java解析xml文件 在Java程序中读取xml文件的过程也称为"解析xml文件": 解析的目的: 获取 节点名和节点值 获取 属性名.属性值. 四中解析方式: DOM SAX ...

  7. 安卓开发之利用XmlPullParser解析XML文件

    package com.lidaochen.phonecall; import android.support.v7.app.AppCompatActivity; import android.os. ...

  8. 遍历文件 创建XML对象 方法 python解析XML文件 提取坐标计存入文件

    XML文件??? xml即可扩展标记语言,它可以用来标记数据.定义数据类型,是一种允许用户对自己的标记语言进行定义的源语言. 里面的标签都是可以随心所欲的按照他的命名规则来定义的,文件名为roi.xm ...

  9. python XML文件解析:用xml.dom.minidom来解析xml文件

    python解析XML常见的有三种方法: 一是xml.dom.*模块,是W3C DOM API的实现,若需要处理DOM API则该模块很合适, 二是xml.sax.*模块,它是SAX API的实现,这 ...

随机推荐

  1. java分布式开发,什么是分布式开发

    就是同一个服务,把数据库的不同部分分开建立到不同的服务器上.以缓解数据库大量数据访问的压力.很多大公司的业务量比较大,每天的访问量都达到几百万上千万,甚至上亿的访问量,在访问量不是很大的情况下,是可以 ...

  2. mac更新之前,好容易把网络设置好

    1.[虚拟机]虚拟网络编辑器--恢复默认设置 [主机网络]自动ip [VM8] 当时忘记将mac里面的网络设置截图...导致更新后网络出问题后却显示网络设置失败

  3. mysql 数据库字符串替换

    UPDATE `table_name` SET `field_name` = replace (`field_name`,'from_str','to_str') WHERE `field_name` ...

  4. Intellij idea 12和设置快捷键修改(加快项目的开发速度与养成良好习惯)

    1.为了养成良好的代码习惯idead中的javascript jSLint能显示不良的代码设置如下    2.Intellij idea 12每一次修改,保存生成都要按ctrl+shift+F9非常影 ...

  5. Oracle数据库之PL/SQL程序设计基础

    PL/SQL程序设计基础 一.PL/SQL块结构 前边我们已经介绍了PL/SQL块的结构,再来回顾一下: DECLARE /* * 声明部分——定义常量.变量.复杂数据类型.游标.用户自定义异常 */ ...

  6. curl 转载

    CURLOPT_RETURNTRANSFER 选项: curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); 如果成功只将结果返回,不自动输出任何内容. 如果失败返回F ...

  7. 基于PHP和mysql的自动生成表单

    开发背景:公司要求管理系统能够由管理员在前台页面管理系统表单,能够对表单进行增删改查基本操作,表单的各个字段都可以被修改.删除,可以添加新的字段,并且不影响系统正常运行,前台表单展示要由系统自动处理, ...

  8. 1106关于解决erp单个商品同步的问题

    1.断点测试: 不断的利用echo "<pre>"; print_r();die;来测试问题出在哪? 先找问题出错点,再找出具体的细节. --------------- ...

  9. JS判断字符串是否为空、过滤空格、查找字符串位置等函数集

    这是一个由网上收集的JS代码段,用于判断指定字符串是否为空,过滤字符串中某字符两边的空格.查找指定字符串开始的位置.使用IsFloat函数判断一 个字符串是否由数字(int or long or fl ...

  10. Install FFmpeg, Mplayer, Mencoder, MP4Box, Flvtool2

    You can use the following tutorial to install ffmpeg and other video modules in your centos server.F ...