[python小记]使用lxml修改xml文件，并遍历目录

　　这次的目的是遍历目录，把目标文件及相应的目录信息更新到xml文件中。在经过痛苦的摸索之后，从python自带的ElementTree投奔向了lxml。而弃用自带的ElementTree的原因就是，namespace。

　　XML命名空间

　　作用是为避免元素命名冲突，当出现命名冲突的时候，可以使用前缀来避免命名冲突，就如：

<h:table>

    <h:tr>

    <h:td>App Store</h:td>

    <h:td>Google Play</h:td>

    </h:tr>

</h:table>

　　使用命名空间(Namespaces):

<f:table xmlns:f="http://www.w3school.com.cn/furniture">

   <f:name>African Coffee Table</f:name>

   <f:width>80</f:width>

   <f:length>120</f:length>

</f:table>

　　添加的xmlns属性，就会前缀赋予了一个与某个命名空间相关联的限定名称

　　lxml安装：

安装pip

安装setuptools: Windows(Powershell3)输入

> (Invoke-WebRequest https://bootstrap.pypa.io/ez_setup.py).Content | python -

下载lxml.whl，根据python版本选择合适的whl下载：地址
安装wheel
```
pip install wheel
```

安装下载好的whl文件

pip install .\lxml-3.5.0-cp34-none-win_amd64.whl

　　lxml使用：

　　lxml的教程网站为：http://lxml.de/index.html

　　使用lxml可以这样import:

from lxml import etree

　　导入并解析xml文件：

tree = etree.parse(fileName)

　　获取xml的命名空间：

root = tree.getroot()

nsmap = root.nsmap

　　如果xml文件使用的默认命名空间：

>>> nsmap

{None: 'http://schemas.microsoft.com/developer/msbuild/2003'}

　　要查找某节点，使用到xpath：

def getNode(tree, node):

    NS_PREFIX = "default"

    root = tree.getroot()

    nsmap = root.nsmap

    nsmap[NS_PREFIX] = nsmap[None]

    nsmap.pop(None)

    return tree.xpath("//{0}:{1}".format(NS_PREFIX, node), namespaces=nsmap)

　　添加子节点：

etree.SubElement(node, tag)

　　最后写入到xml文件中：

fileHandler = open(filePath, "wb")

tree.write(fileHandler, encoding="utf-8", xml_declaration=True, pretty_print=True)

fileHandler.close()

　　xpath基础

　　xpath使用路径表达式来选取xml文档中的节点或节点集。

表达式	描述
nodename	从当前节点的子节点中，选取tag为nodename的所有节点
/	从根节点选取
//	任意位置选取
.	选取当前节点
..	选取父节点
@att	选取带属性att的节点
[]	谓语

　　例子：

 tree.xpath("//Folder[@Include]")

 #选取带Include属性的Folder节点

 tree.xpath("//ItemGroup[./Folder]")
4 tree.xpath("//ItemGroup[Folder]")

 #选取含有Folder子节点的ItemGroup节点

　　遍历目录：

　　遍历目录有两个方法：os.list_dir与os.walk。各自的用例：

 import os

 def list_dir(rootDir):

     for lists in os.listdir(rootDir):

         path = os.path.join(rootDir, lists)

         print(path)

         if os.path.isdir(path):

             list_dir(path)

 def walk(rootDir):

     for root, dirs, files in os.walk(rootDir):

         for d in dirs:

             print(os.path.join(root, d))

         for f in files:

             print(os.path.join(root, f))

[python小记]使用lxml修改xml文件，并遍历目录的更多相关文章

面试官问我：如何在 Python 中解析和修改 XML
摘要:我们经常需要解析用不同语言编写的数据.Python提供了许多库来解析或拆分用其他语言编写的数据.在此 Python XML 解析器教程中,您将学习如何使用 Python 解析 XML. 本文分享 ...
MyEclipse如何修改XML文件默认行宽
1.MyEclipse如何修改XML文件默认行宽 Windows--->Preferences--->搜索xml--->XML--->XML Source--->Form ...
MyEclipse如何修改XML文件默认打开的编辑器
1.MyEclipse如何修改XML文件默认打开的编辑器 Windows--->Preferences--->General--->Editors--->File Associ ...
Java 操纵XML之修改XML文件
Java 操纵XML之修改XML文件一.JAVA DOM PARSER DOM interfaces The DOM defines several Java interfaces. Here ar ...
python中用ElementTree.iterparse()读取xml文件中的多层节点
我在使用Python解析比较大型的xml文件时,为了提高效率,决定使用iterparse()方法,但是发现根据网上的例子:每次if event == 'end':之后elem.clear()或者是每次 ...
Java&Xml教程（七）使用JDOM修改XML文件内容
JDOM提供了非常灵活的方式操作XML文件,使用JDOM非常简单而且代码简洁可读性强.前面我们学习了如何使用JDOM解析XML文件,本节介绍如何使用JDOM修改XML文件内容. 在这个教程中,我们准备 ...
Java&Xml教程（三）使用DOM方式修改XML文件内容
DOM解析方式也可用于修改XML数据,我们可以使用它完成新增元素.删除元素.修改元素值.修改元素属性等操作. 我们的XML文件,内容如下: employee.xml <?xml version= ...
python学习笔记（六）文件夹遍历，异常处理
python学习笔记(六) 文件夹遍历 1.递归遍历 import os allfile = [] def dirList(path): filelist = os.listdir(path) for ...
python实现随机复制若干个文件到新目录
python实现随机复制若干个文件到新目录 1说明 1.1 目的随机选择一个文件下的若干个文件,并将文件复制到新文件夹下 1.2 要求需要将random_select_and_copy_file. ...

随机推荐

easyui-combobox绑定回车事件相关
去掉combobox回车内容不匹配清空输入项问题描述:easyui的combobox插件,输入的内容如果和选项不匹配时,按下回车会导致输入的内容被清空. 解决办法:要解决回车时,combob ...
如何Oracle查出一个用户具有的所有系统权限和对象权限
1. 系统权限 SELECT * FROM DBA_SYS_PRIVS WHERE GRANTEE = 'LCAM_SYS_1216' UNION ALL SELECT * FROM DBA_SYS_ ...
数组类型参数传递问题：$.ajax传递数组的traditional参数传递必须true
数组类型参数传递: 若一个请求中包含多个值,如:(test.action?tid=1&tid=2&tid=3),参数都是同一个,只是指定多个值,这样请求时后台会发生解析错误,应先使用 ...
css border-sizing 用法与理解
浏览器支持 IE Firefox Chrome Safari Opera 支持支持支持支持支持 Internet Explorer.Opera 以及 Chrome 支持 box-si ...
g++动态库静态库混合链接
今天编译一个程序时报错: g++ -static -o echo.fcgi echo_adaptor.o echo.o -L/usr/local/lib/ -lfastcgipp -L/usr/lib ...
不用一个判断，用JS直接输出勾股数
说明: 这里勾股数是符合a2+b2=c2的整数,比如32+42=52,52+122=132,怎么把符合条件的勾股数找出来呢?用代数替代的方法可以极大简化程序,直至一个判断都不用. 可以设a=m2-n2 ...
Node.js aitaotu图片批量下载Node.js爬虫1.00版
即使是https网页,解析的方式也不是一致的,需要多试试. 代码: //====================================================== // aitaot ...
用filter：grayscale将图片过滤成灰色
设置成百分之百直接过滤成灰色: img{filter:gray; filter:grayscale(100%); -0-filter:grayscale(100%); -moz-filter:gray ...
Android 底部TabActivity（1）——FragmentActivity
先看看效果图: 第一篇Tab系列的文章首先实现这样的风格的底部Tab:背景条颜色不变,我们是用了深灰的颜色,图标会发生对应的变化.当选中某个标签后该标签的背板会由正常的颜色变为不正常,哈哈,是变为加深 ...
odoo8.0下selection_add的使用
在odoo中有selection类型的字段,用于限定字段的值在某些范围之内,在view上面显示此字段时,会显示一个下拉的列表. 如果是自己新定义的字段,这个列表的内容可以自己定义,但如果是继承自某个对 ...

[python小记]使用lxml修改xml文件，并遍历目录

XML命名空间

lxml安装：

lxml使用：

xpath基础

遍历目录：

[python小记]使用lxml修改xml文件，并遍历目录的更多相关文章

随机推荐

热门专题

　　XML命名空间

　　lxml安装：

　　lxml使用：

　　xpath基础

　　遍历目录：