Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）

xml实例：

版本一：

<?xml version="1.0" encoding="UTF-8"?><country name="chain"><provinces><heilongjiang name="citys"><haerbin/><daqing/></heilongjiang><guangdong name="citys"><guangzhou/><shenzhen/><huhai/></guangdong><taiwan name="citys"><taibei/><gaoxiong/></taiwan><xinjiang name="citys"><wulumuqi waith="tianqi">晴</wulumuqi></xinjiang></provinces></country>

没有空格，换行，的版本

python操作操作实例：

from lxml import etree

class r_xpath_xml(object):

    def __init__(self):

        self.xmetrpa=etree.parse('info.xml') #读取xml数据

        pass

    def xpxm(self):

        xpxlm=self.xmetrpa

        print etree.tostring(xpxlm) #打印xml数据

        root=xpxlm.getroot() #获得该树的树根

        print root.tag,' ',  #打印根标签名

        print root.items() #获得标签属性名称和属性值

        for a in root:  ##遍历根下一集级标签

            print a.tag,a.items(),a.text,' 被打印的类型为： ',type(a)  #打印标签名称，标签属性，标签数据

        for b in a:

            print b.tag,b.items(),b.text#,b

            for c in b:

                print c.tag,c.items(),c.text#,c

        for d in c:

            print d.tag,d.items(),d.test,d

        print xpxlm.xpath('//node()')#.items()#.tag

        print '====================================================================================================='

        xa=xpxlm.xpath('//heilongjiang/*')

        print xa

        for xb in xa:

            print xb.tag,xb.items(),xb.text

        xc=xpxlm.xpath('//xinjiang/*')

        print xc

        for xd in xc:

            print xd.tag,xd.items(),xd.text

if __name__ == '__main__':

    xpx=r_xpath_xml()

    xpx.xpxm()

应用for循环遍历标签层次结构，tag获取标签名，items()通过字典函数获取[（'属性名' , '属性值'）]，text获取标签对之间的数据。tag，items(),text针对的类型为：<type 'lxml.etree._Element'>
打印结果：

<country name="chain"><provinces><heilongjiang name="citys"><haerbin/><daqing/></heilongjiang><guangdong name="citys"><guangzhou/><shenzhen/><huhai/></guangdong><taiwan name="citys"><taibei/><gaoxiong/></taiwan><xinjiang name="citys"><wulumuqi waith="tianqi">晴</wulumuqi></xinjiang></provinces></country>

country   [('name', 'chain')]

provinces [] None  被打印的类型为：  <type 'lxml.etree._Element'>

heilongjiang [('name', 'citys')] None

haerbin [] None

daqing [] None

guangdong [('name', 'citys')] None

guangzhou [] None

shenzhen [] None

huhai [] None

taiwan [('name', 'citys')] None

taibei [] None

gaoxiong [] None

xinjiang [('name', 'citys')] None

wulumuqi [('waith', 'tianqi')] 晴

[<Element country at 0x2d47b20>, <Element provinces at 0x2d47990>, <Element heilongjiang at 0x2d479b8>, <Element haerbin at 0x2d47558>, <Element daqing at 0x2d47328>, <Element guangdong at 0x2d47300>, <Element guangzhou at 0x2d476e8>, <Element shenzhen at 0x2d47530>, <Element huhai at 0x2d472d8>, <Element taiwan at 0x2d47260>, <Element taibei at 0x2d47238>, <Element gaoxiong at 0x2d47080>, <Element xinjiang at 0x2d47710>, <Element wulumuqi at 0x2d47968>, u'\u6674']

=====================================================================================================

[<Element haerbin at 0x2d479b8>, <Element daqing at 0x2d47148>]

haerbin [] None

daqing [] None

[<Element wulumuqi at 0x2d47968>] 类型为： <type 'list'>

wulumuqi [('waith', 'tianqi')] 晴

xml实例：

版本二：

<?xml version="1.0" encoding="UTF-8"?>

<country name="chain">

    <provinces>

        <city:table xmlns:city="http://www.w3school.com.cn/furniture">

        <heilongjiang name="citys"><city:haerbin/><city:daqing/></heilongjiang>

        <guangdong name="citys"><city:guangzhou/><city:shenzhen/><city:zhuhai/></guangdong>

        <taiwan name="citys"><city:taibei/><city:gaoxiong/></taiwan>

        <xinjiang name="citys"><city:wulumuqi>晴</city:wulumuqi></xinjiang>

        </city:table>

    </provinces>

</country>

实例：

print xpxlm.xpath('//node()')

打印结果：
空格回车字符，命名空间。

[<Element country at 0x2e79b20>, '\n    ', <Element provinces at 0x2e79990>, '\n        ', <Element {http://www.w3school.com.cn/furniture}table at 0x2e79710>, '\n        ', <Element heilongjiang at 0x2e799b8>, <Element {http://www.w3school.com.cn/furniture}haerbin at 0x2e79328>, <Element {http://www.w3school.com.cn/furniture}daqing at 0x2e79968>, '\n        ', <Element guangdong at 0x2e79530>, <Element {http://www.w3school.com.cn/furniture}guangzhou at 0x2e79300>, <Element {http://www.w3school.com.cn/furniture}shenzhen at 0x2e792d8>, <Element {http://www.w3school.com.cn/furniture}zhuhai at 0x2e79260>, '\n        ', <Element taiwan at 0x2e79238>, <Element {http://www.w3school.com.cn/furniture}taibei at 0x2e79080>, <Element {http://www.w3school.com.cn/furniture}gaoxiong at 0x2e79058>, '\n        ', <Element xinjiang at 0x2e796e8>, <Element {http://www.w3school.com.cn/furniture}wulumuqi at 0x2e79558>, u'\u6674', '\n        ', '    \n    ', '\n']

去掉空格：

        xp=xpxlm.xpath('//node()')

        print xp,           #.items()#.tag

        for i in xp:

            if '' in i or '\n' in i:

                continue

            else:

                print i.tag

通过判断去除空格换行符号

输出结果：

provinces

{city}table

heilongjiang

{city}haerbin

{city}daqing

guangdong

{city}guangzhou

{city}shenzhen

{city}zhuhai

taiwan

{city}taibei

{city}gaoxiong

xinjiang

{city}wulumuqi

Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）的更多相关文章

python通过LXML库读取xml命名空间
xml实例版本: <a> <city:table xmlns:city="city"> <heilongjiang name="citys& ...
js遍历对象所有的属性名称和值
/* * 用来遍历指定对象所有的属性名称和值 * obj 需要遍历的对象 * author: Jet Mah * website: http://www.javatang.com/archives/2 ...
遍历JavaScript某个对象所有的属性名称和值
/* * 用来遍历指定对象所有的属性名称和值 * obj 需要遍历的对象 */ function allPrpos(obj) { // 用来保存所有的属性名称和值 var props = " ...
python lxml库生成xml文件-节点命名空间问题
lxml库,处理xml很强大,官方文档:https://lxml.de/tutorial.html#namespaces 例如: 我们要生成如下格式的报文: <ttt:jesson xmlns: ...
C#使用Linq to XML进行XPath查询
最近在用到HtmlAgliltyPack进行结点查询时,发现这里选择结点使用的是XPath.所以这里总结一下在C#中使用XPath查询XML的方法.习惯了用Linq,这里也是用的Linq to xml ...
【xml】python的lxml库使用
1.官方教程:http://lxml.de/tutorial.html#parsing-from-strings-and-files 最重要的文档,看完基本就能用了 2.lxml支持xpath,xp ...
Python 使用PyMySql 库连接MySql数据库时查询中文遇到的乱码问题（实测可行） python 连接 MySql 中文乱码 pymysql库
最近所写的代码中需要用到python去连接MySql数据库,因为是用PyQt5来构建的GUI,原本打算使用PyQt5中的数据库连接方法,后来虽然能够正确连接上发现还是不能提交修改内容,最后在qq交流群 ...
Python中使用面状矢量裁剪栅格影像，并依据Value值更改矢量属性
本文整体思路:在Python中使用Geopandas库,依次读取shp文件的每一个面状要素,获取其空间边界信息并裁剪对应的栅格影像,计算所裁剪影像Value值的众数,将其设置为对应面状要素的NewTY ...
Python 爬虫解析库的使用 --- XPath
一.使用XPath XPath ,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言.它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索. 所 ...

随机推荐

高级UI-UI绘制流程
UI的绘制流程和事件分发,属于Android里面的重点内容,在做自定义UI的时候,更是应该了解UI的绘制流程是如何的,此篇文章就是说明UI的绘制流程,事件分发前面已经详细讲过了 UI绘制流程探索这里 ...
k8s 集群节点状态显示notready
一般情况下我们是在maste节点上安装网络插件的,然后在join node 节点,这样导致node节点可能无法加载到这些插件使用 journalctl -f -u kubelet 显示如下内容 N ...
ubuntu samba 服务器搭建
最近总是在搭建 samba 环境,写在笔记上记录下以备后用,长时间不操作了肯定会忘记. Linux 版本:Ubuntu 18.04 具体的操作命令: 1. 安装: sudo apt-get insta ...
java中的Stream流
java中的Stream流说到Stream便容易想到I/O Stream,而实际上,谁规定"流"就一定是"IO流"呢?在Java 8中,得益于Lambda所带 ...
QT/C++ 类型转换
"轻轻地我走了,正如我轻轻地来,我挥一挥衣袖,不带走一片云彩"------阿魔 1) int转为QString: QString::number(int) 2) std::stri ...
怎么查看服务器的cpu和内存的硬件信息
在linux 下怎么查看服务器的cpu和内存的硬件信息可以按照如下方式进行操作: 一.查看cpu总个数方法: 1.首先执行top命令,如下图中内容所表示. 2.在top命令的显示界面,按数字 ...
Java开发笔记（一百二十一）AWT输入框
前面介绍了文本标签Label,该控件展示的文字是不可编辑的,若要用户在界面上输入文本,就得使用专门的编辑框控件.在AWT的控件家族当中,用作编辑框的有两种控件,分别是单行输入框TextField和多行 ...
爬虫解析库beautifulsoup
一.介绍 Beautiful Soup是一个可以从HTML或XML文件中提取数据的python库. #安装Beautiful Soup pip install beautifulsoup4 #安装解析 ...
spring-data-jpa模糊查询
记录一条关于spring-data-jpa模糊查询的语句方法一: @Query(value="select * from search_key a where a.key_name lik ...
[UOJ #167]【UR #11】元旦老人与汉诺塔
题目大意:给你一个有$n$个盘子的汉诺塔状态$S$,问有多少种不同的操作方法,使得可以在$m$步以内到达状态$T$.$n,m\leqslant100$ 题解:首先可以知道的是,一个状态最多可以转移到其 ...

Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）

Python通过lxml库遍历xml通过xpath查询（标签，属性名称，属性值，标签对属性）的更多相关文章

随机推荐

热门专题