【python】lxml中多个xml采用相同节点时出现的问题

今天突然发现了一个lxml的坑。

假设我们有一个节点

<id>123</id>

有两个父节点都要用上述节点，则必须把上面的节点写两遍！用同一个会出错！

出错例子：

#!/usr/bin/env python

#encoding:utf8

from lxml import etree

if __name__ == "__main__":

    root1 = etree.Element("root1")  #根节点1

    root2 = etree.Element("root2")  #根节点2

    ver_node = etree.Element("id")  #子节点

    ver_node.text = ""

    root1.append(ver_node)  #都加入了同一个子节点

    root2.append(ver_node)

    print etree.tostring(root1, pretty_print=True, xml_declaration=True, encoding='UTF-8')

    print etree.tostring(root2, pretty_print=True, xml_declaration=True, encoding='UTF-8')

结果：

<?xml version='1.0' encoding='UTF-8'?>

<root1/>

<?xml version='1.0' encoding='UTF-8'?>

<root2>

  <id>123</id>

</root2>

只有后面一个有子节点，前面一个没有！

正确写法：

#!/usr/bin/env python

#encoding:utf8

from lxml import etreeimport copy

if __name__ == "__main__":

    root1 = etree.Element("root1")

    root2 = etree.Element("root2")

    ver_node1 = etree.Element("id")

    ver_node1.text = ""

    ver_node2 = copy.deepcopy(ver_node1) #深拷贝！

    root1.append(ver_node1)

    root2.append(ver_node2)

    print etree.tostring(root1, pretty_print=True, xml_declaration=True, encoding='UTF-8')

    print etree.tostring(root2, pretty_print=True, xml_declaration=True, encoding='UTF-8')

结果：

<?xml version='1.0' encoding='UTF-8'?>

<root1>

  <id>123</id>

</root1>

<?xml version='1.0' encoding='UTF-8'?>

<root2>

  <id>123</id>

</root2>

【python】lxml中多个xml采用相同节点时出现的问题的更多相关文章

python爬虫中XPath和lxml解析库
什么是XML XML 指可扩展标记语言(EXtensible Markup Language) XML 是一种标记语言,很类似 HTML XML 的设计宗旨是传输数据,而非显示数据 XML 的标签需要 ...
python中用ElementTree.iterparse()读取xml文件中的多层节点
我在使用Python解析比较大型的xml文件时,为了提高效率,决定使用iterparse()方法,但是发现根据网上的例子:每次if event == 'end':之后elem.clear()或者是每次 ...
python lxml库生成xml文件-节点命名空间问题
lxml库,处理xml很强大,官方文档:https://lxml.de/tutorial.html#namespaces 例如: 我们要生成如下格式的报文: <ttt:jesson xmlns: ...
python在lxml中使用XPath语法进行#数据解析
在lxml中使用XPath语法: 获取所有li标签: from lxml import etree html = etree.parse('hello.html') print type(html) ...
转 web项目中的web.xml元素解析
转 web项目中的web.xml元素解析发表于1年前(2014-11-26 15:45) 阅读(497) | 评论(0) 16人收藏此文章, 我要收藏赞0 上海源创会5月15日与你相约[玫瑰里 ...
【python】lxml查找属性为指定值的节点
假设有如下xml在/home/abc.xml位置 <A> <B id=" name="apple"/> <B id=" name= ...
Python 面试中可能会被问到的30个问题
第一家公司问的题目 1 简述解释型和编译型编程语言? 解释型语言编写的程序不需要编译,在执行的时候,专门有一个解释器能够将VB语言翻译成机器语言,每个语句都是执行的时候才翻译.这样解释型语言每执行一次 ...
在.net中序列化读写xml方法的总结
在.net中序列化读写xml方法的总结阅读目录开始最简单的使用XML的方法类型定义与XML结构的映射使用 XmlElement 使用 XmlAttribute 使用 InnerText 重命 ...
struts2中改变struts.xml默认路径
struts2.X配置文件默认存放路径在/WEB-INF/classes目录下,即将struts.xml放在src的目录下. 但是为了方便管理,开发人员把struts.xml放到其他位置,处理方法如下 ...

随机推荐

Shanghai Regional Online Contest 1004
Shanghai Regional Online Contest 1004 In the ACM International Collegiate Programming Contest, each ...
Magic Number（Levenshtein distance算法）
Magic Number Time Limit:1000MS Memory Limit:65536KB 64bit IO Format:%I64d & %I64u Submit ...
大数据之sqoop
一.安装: 1 解压然后把mysql的驱动放在$SQOOP_HOME/lib 目录中2. conf/sqoop-en.sh export HADOOP_COMMON_HOME=/home/hadoop ...
第四天 rxcocoa
HackerNewsReaderDemo HackerNewsAPI.sharedApi.newStories() .observeOn(ConcurrentDispatchQueueSchedule ...
在使用开源library的PullToRefreshView中
下拉刷新几乎是每个应用都会有的功能,且大部分用的都是开源项目,下载地址:下拉刷新.如何在页面刚打开的时候自动触发下拉刷新的呢? 只需要一句代码,在PullToRefreshAdapterView Ba ...
mysql python image 图像存储读取
最近做一些数据库调研的工作,目标是实现影像更快的入库.出库.查询,并实现并行访问等操作. 将结果总结成一个mysqlImg类. 关于mongodb的图像存储,参见http://www.cnblogs. ...
JQuery实战手风琴-遁地龙卷风
(-1)写在前面这个图片是我从网上下载的,向这位前辈致敬.图片资源在我的百度云盘里.http://pan.baidu.com/s/1nvfJHdZ 我用的是chrome49,JQuery3.0,案例 ...
iOS开发——高级篇——iOS键盘的相关设置(UITextfield)
一.键盘风格 UIKit框架支持8种风格键盘. typedef enum { UIKeyboardTypeDefault, // 默认键盘:支持所有字符 UIKeyboardTypeASCIICapa ...
MySQL 同主机不同数据库之间的复制
MySQL同主机不同数据库的复制命令:注意运行在Terminal中,不运行在MySQL命令行中. mysqldump Portal_DEV -u root -ppassword1 --add-drop ...
JavaScript break跳出多重循环
多重循环在编程中会经常遇到,那么在JavaScript中如何指定跳出那层的循环呢.其实这也是break的一个用法,下面是一个不错的例子,来自<JavaScript权威指南>,可以参考下: ...

【python】lxml中多个xml采用相同节点时出现的问题

【python】lxml中多个xml采用相同节点时出现的问题的更多相关文章

随机推荐

热门专题