【Python实例一】使用minidom读取xml文件
最近刚在廖雪峰老师的网站里学习了Python的基础内容,想着循序渐进地找点实例练练手,网上看到有很多相关资料,决定针对感兴趣的内容实际编码实践一下,昨天刚好看到有关使用Python来读取XML文件的资料,看起来还算简单,所以打算就从这里开始着手我的Python实践~
下面的内容结构如下:
--------------------------------------------------------------------------------------------------------------------------
- XML指可扩展标记语言;
- 它的设计宗旨是传输数据,而不是显示数据;(ps:不要指望 XML 文件会直接显示为 HTML 页面,XML 文档不会携带有关如何显示数据的信息)
- 标签没有被预定义,需要自行定义标签
- 对它最好的描述是:独立于软件和硬件的信息传输工具
二、XML(可扩展标记语言)与HTML(超文本标记语言)的关系
- 可扩展标记语言是一种很像超文本标记语言的标记语言;(但不是超文本标记语言的替代,而是补充)
- 它被用来传输和存储数据,其焦点是数据的内容;而超文本标记语言是用来显示数据的,其焦点是数据的外观。
三、关于Python Minidom
(ps: 网上找到有关Minidom的详解比较少,大多都是实例。但这里贴个Python官方的介绍地址-->https://wiki.python.org/moin/MiniDom )
用Minidom在XML文件中读取到的信息,可以看做是一个主结构,根据XML文件标签的结构层次,构成了树的结构。
树中每一个节点有三种基本属性:
根名.nodeName为节点标签的名字。比如<aa>标签的nodeName为aa
根名.nodeValue是节点的值,只对文本结点有效。
根名.nodeType是节点的类型(W3C有关XML的介绍中有节点类型的具体阐述--> http://www.w3school.com.cn/xmldom/dom_nodetype.asp)
四、开始使用Python读取XML文件
1. 首先,建立一个测试用的XML文件,名为“123.xml”,比较简单,代码如下:
<?xml version="1.0" encoding="UTF-8" ?>
<catalog>
<aa value="first">this is the 1st.</aa>
<aa value="second">this is the 2nd.</aa>
</catalog>
2. 在同一个目录下,建立一个名为“xml_read.py”的文件
首先要导入minidom类库,导入方式有两种,对应的打开XML文件的语句也稍有不同。
第一种:
#导入类库
import xml.dom.minidom
#使用minidom里的parse()函数打开xml文档
dom = xml.dom.minidom.parse('123.xml')
第二种:
#导入类库
from xml.dom import minidom
#使用minidom里的parse()函数打开文件
doc = minidom.parse('123.xml')
导入类库并成功打开XML文件后,要获取根节点,这里的“documentElement”有点像HTML语言里的使用:
root = dom.documentElement
先试试将根节点相关的三种基本属性显示出来,代码如下:
print root.nodeName
print root.nodeValue
print root.nodeType
“xml_read.py”的完整代码 以及 实验效果如下:
#coding=utf-8 #导入类库
import xml.dom.minidom #使用minidom里的parse()函数打开xml文档
dom = xml.dom.minidom.parse('123.xml') root = dom.documentElement
#每一个节点都有它的 nodeName、nodeValue、nodeType属性
print root.nodeName
print root.nodeValue
print root.nodeType
效果如下:
---------------------------------------------------------------------------------------------------------------------
刚刚演示的是对根节点的基本属性显示,下面演示怎么获取子元素的相关信息。
对于知道元素名字的子元素,可以使用getElementsByTagName方法获取,由该方法返回的是一个list,因此需要用循环来读出“123.xml”子标签的内容:
修改后的“xml_read.py”的完整代码如下:
#coding=utf-8 #导入类库
import xml.dom.minidom #使用minidom里的parse()函数打开xml文档
dom = xml.dom.minidom.parse('123.xml') root = dom.documentElement
nodes= root.getElementsByTagName("aa")
for n in nodes:
print n.getAttribute("value") #获取属性值
print n.childNodes[0].data #获取文本值
结果显示如下:
这只是我的第一个实例尝试,也希望自己之后能够坚持练习,多去发现问题解决问题,逐步提高自己~
【Python实例一】使用minidom读取xml文件的更多相关文章
- python读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
- python专题-读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
- 【304】python专题-读取xml文件
参考:XML DOM 参考手册(w3school) 参考:python专题-读取xml文件 参考:请问用python怎么修改xml的节点值? 1. 读取标签内的文本(Python) 如下的 xml 文 ...
- 读取xml文件中的配置参数实例_java - JAVA
文章来源:嗨学网 敏而好学论坛www.piaodoo.com 欢迎大家相互学习 paras.xml文件 <?xml version="1.0" encoding=" ...
- selenium-python读取XML文件
首先这是我们要读取的XML文件 <?xml version="1.0" encoding="utf-8" ?><info> <ba ...
- java 读取XML文件作为配置文件
首先,贴上自己的实例: XML文件:NewFile.xml(该文件与src目录同级) <?xml version="1.0" encoding="UTF-8&quo ...
- php使用domdocument读取xml文件
使用domdocument读取xml文件需要用到以下几个方法和属性: 方法: 1:读取xml文件:load() 2:获取标签的对象数组:getElementByTagName() 3:对象数组的索引: ...
- Android 开发自己的网络收音机4——读取XML文件的电台数据
国内外的电台数据很多,起码有好几百,所以把这些数据都写到代码里面是不实际的.只能写成一个数据文件,程序启动的时候再去加载.保存这些简单数据,我们肯定会优先使用XML文件,今天讲讲如何读取XML里面的数 ...
- 读取xml文件,写入excel
在上一篇 Python写xml文件已经将所有订单写入xml文件,这一篇我们把xml文件中的内容读出来,写入excel文件. 输入xml格式: <?xml version="1.0&qu ...
随机推荐
- FJWC 2019 游记
FJWC 2019 游记 Day 0 春节旅游, 刚从杭州绍兴一带赶回来, 然而并没有直接飞去福州, 去了厦门再去福州, 浪费了好多时间. Day 1 酒店到学校有 \(20\) 分钟的步行路程, 感 ...
- jmeter+ant的使用
1.安装ant 下载ant,解压到某盘 2.配置环境变量: 变量名称 变量值 备注 ANT_HOME F:\apache-ant-1.10.3 Ant的解压路径 Path %ANT_HOME%\bin ...
- window平台下使用python虚拟环境
第一步:安装virtualenv模块 安装virtualenv模块,使用pip install C:\Users\wangjun>pip install virtualenv 第二步:创建虚拟环 ...
- Hibernate 查询,返回结果设置到DTO
1:原生sql的查询,返回结果设置到DTO: Query query = sessionFactoryRtData.getCurrentSession().createSQLQuery(hql.toS ...
- 复合类型的声明——是int *p还是int* p
我们先来看一条基本类型的声明语句:int a, b, ... 即一条声明语句由一个数据类型(int)和紧随其后的一个变量名列表(a, b, ...)组成 更通用的描述是:一个基本数据类型和紧随其后的一 ...
- 点击查看大图Activity
1.使用方式 Intent intent = new Intent(FriendCircleActivity.this, ImageGralleryPagerActivity.class);//0,索 ...
- 最短路径——Dijkstra算法以及二叉堆优化(含证明)
一般最短路径算法习惯性的分为两种:单源最短路径算法和全顶点之间最短路径.前者是计算出从一个点出发,到达所有其余可到达顶点的距离.后者是计算出图中所有点之间的路径距离. 单源最短路径 Dijkstra算 ...
- 弹框中的elment-form在弹框重新打开后,怎么初始化验证信息
如果弹框关闭前有错误提示,弹框重新打开,由于没重新刷新页面,该错误还是存在.... 解决办法:弹框中的内容写成一个组件,prop接收父元素弹框的状态,并监听且reset表格 1. cnpm insta ...
- Access-Control-Allow-Methods: OPTIONS & CORS
Access-Control-Allow-Methods: OPTIONS CORS https://stackoverflow.com/questions/20478312/default-valu ...
- Intellij IDEA 系统路径配置
在使用IDEA启动Tomcat的时候,会读取系统路径,默认路径可能不是我们想要的,可以修改 C:\MyPrograms\IntelliJ IDEA 14.0.1\bin\idea.properties ...