selenium-python读取XML文件
首先这是我们要读取的XML文件
<?xml version="1.0" encoding="utf-8" ?>
<info>
<base>
<platform>windows</platform>
<browser>Chorm</browser>
<url>http://www.baidu.com</url>
<login username="admin" passwd="1234"/>
<login username="guest" passwd="2342"/>
</base>
<test>
<province>北京</province>
<province>上海</province>
<city>西安</city>
<city>成都</city>
</test>
1.获取标签信息
首先要导入xml的mindom模块,用来处理xml文件,parse()用于打开XML文件。documentE;ement用于得到XML文件的唯一根元素
#coding=utf-8
from xml.dom import minidom
#打开xml文件
date = minidom.parse('info.xml')
#得到文档的对象
root = date.documentElement
#打印节点名称
print root.nodeName
#打印节点值
print root.nodeValue
#打印节点类型
print root.nodeType
print root.ELEMENT_NODE
2.获得任意标签名
#coding=utf-8
from xml.dom import minidom
#打开xml文件
date = minidom.parse('info.xml')
#得到文档的对象
root = date.documentElement
#获取标签名为browser的一组标签
tagname = root.getElementsByTagName('browser')
#打印标签名
print tagname[0].tagName
tagname = root.getElementsByTagName('login')
print tagname[1].tagName
tagname = root.getElementsByTagName('province')
print tagname[1].tagName
3.获得标签的属性值
#coding=utf-8
from xml.dom import minidom
#打开xml文件
date = minidom.parse('info.xml')
#得到文档的对象
root = date.documentElement
#获取标签名为login的一组标签
logins = root.getElementsByTagName('login')
#获取login下第一个username属性值
username = logins[0].getAttribute("username")
print username
#获取login下第一个passwd属性值
passwd = logins[0].getAttribute("passwd")
print passwd
#获取login下第二个username属性值
username = logins[1].getAttribute("username")
print username
#获取login下第二个passwd属性值
passwd = logins[1].getAttribute("passwd")
print passwd
4.获取标签对之间的数据
#coding=utf-8
from xml.dom import minidom
#打开xml文件
date = minidom.parse('info.xml')
#得到文档的对象
root = date.documentElement
#获取标签名为province的一组标签
provinces = root.getElementsByTagName('province')
citys = root.getElementsByTagName('city')
#获取第二个province标签对的值,firstChild返回被选节点的第一个子节点,data表示获取该节点的数据
p2 = provinces[1].firstChild.data
print p2
#获取第一个city标签对的值
c1 = citys[0].firstChild.data
print c1
#获取第二个city标签对的值
c2 = citys[1].firstChild.data
print c2
python 读取xml文件内容并完成修改
import os
import xml.etree.ElementTree as ET
def changesku(inputpath):
listdir = os.listdir(inputpath)
for file in listdir:
if file.endswith('xml'):
file = os.path.join(inputpath,file)
tree = ET.parse(file)
root = tree.getroot()
for object1 in root.findall('object'): #我要修改的元素在object里面,所以需要先找到object
for sku in object1.findall('name'): #查找想要修改的所有同种元素
if (sku.text == '005'): #‘005’为原始的text
sku.text = '008' #修改‘name’的标签值
tree.write(file,encoding='utf-8') #写进原始的xml文件,不然修改就无效,‘encoding = “utf - 8”’避免原始xml #中文字符乱码
else:
pass
else:
pass
if __name__ == '__main__':
inputpath = 'D:\\easy\\hebing_xml' #这是xml文件的文件夹的绝对地址
changesku(inputpath)
selenium-python读取XML文件的更多相关文章
- python读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
- python读取xml文件报错ValueError: multi-byte encodings are not supported
1.在使用python对xml文件进行读取时,提示ValueError: multi-byte encodings are not supported 很多贴子上说把xml的编码格式改为,就可以正常执 ...
- python读取xml文件中的坐标点
用labelImg工具制作好xml文件后,需要读取其中img路径和坐标点,生成一个label.txt <annotation> <folder>big</folder&g ...
- python 读取xml文件
首先,获得标签信息abc.xml <?xml version="1.0" encoding="utf-8"?> <catalog> &l ...
- python读取xml文件示例
最近用到了xml格式的文件,对这些没啥印象,顺便学习一下,做个例子,方便后续查阅. xml文档: <annotation> <folder>VOC2012</folder ...
- 【Python实例一】使用minidom读取xml文件
前言:最近刚在廖雪峰老师的网站里学习了Python的基础内容,想着循序渐进地找点实例练练手,网上看到有很多相关资料,决定针对感兴趣的内容实际编码实践一下,昨天刚好看到有关使用Python来读取XML文 ...
- python读写xml文件
python读取xml文件 xml文件是具有树状结构的,如果想要访问某个叶子结点,必须逐层获取其父结点,要读取某个叶子结点内容用text成员 使用前先加载xml工具包 try: import xml. ...
- Python 读写XML文件
Python 生成XML文件 from xml.dom import minidom # 生成XML文件方式 def generateXml(): impl = minidom.getDOMImple ...
- python专题-读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
随机推荐
- 使用 XPath
XPath 简介: (1) 前面我们爬取一个网页,都是使用正则表达式来提取想要的信息,但是这种方式比较复杂,一旦有一个地方写错,就匹配不出来了,因此我们可以使用 XPath 来进行提取(2) XPat ...
- php学习四:数组(一)
1. 直接赋值方式: ① 索引数组:以索引来存储数据,内存不是连续的,但是js中的内存是连续的 代码如下: $array[0] = "11"; $array[1] = &qu ...
- linux 提示符>怎样退出
在linux(Red Hat)字符界面下,不小心输入了上漂号 ’ ,结果命令提示符变成了>,然后在q.exit.ctrl+c.ctrl+z都回不去了,不知道怎么回到#的命令提示符? 表示ct ...
- 网络子系统45_ip协议tos处理
//ip报头tos字段,一个字节 // 二进制位:[0 1 2] [3] [4] [5] [6] [7] // 1.[0 1 2] 表示优先级: // 000 路由 // 001 优先级 // 010 ...
- hadoop 2.2.0集群安装详细步骤(简单配置,无HA)
安装环境操作系统:CentOS 6.5 i586(32位)java环境:JDK 1.7.0.51hadoop版本:社区版本2.2.0,hadoop-2.2.0.tar.gz 安装准备设置集群的host ...
- Swift - 实现tableView单选系统样式
// 实现tableView单选 import UIKit class ViewController: UIViewController { var tableView: UITableView! o ...
- javascript关闭网页的几种方法
js关闭当前页面(窗口)的几种方式总结,需要的朋友可以参考一下: 1. 不带任何提示关闭窗口的js代码 <a href="javascript:window.opener=null;w ...
- 【Python】自动化测试框架-共通方法汇总
1.滚动滚动条(有的时候页面元素element取得对但是并没有回显正确的数据,可能是因为页面第一次加载很慢,所以页面可能做了滚动到哪里就加载到哪里的效果,此刻我们就需要用到滚动条自动滚动这段代码让页面 ...
- Squeeze-and-Excitation Networks
Squeeze-and-Excitation Networks Paper 近些年来,卷积神经网络在很多领域都取得了巨大的突破.而卷积核作为卷积神经网络的核心,通常被看做是在局部感受野上,将空间上(s ...
- 通过html<map>标签给图片加链接
前面我们有谈到了通过图片定位给一张图片添加多个链接,现在用另外一种方法来实现,用html<map>标签给图片加链接 <img src="/images/hlj.jpg&qu ...