python 标准库包含SAX解析器,SAX用事件驱动模型,通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件

在python中使用sax方式处理xml要先引入xml.sax中的parse函数,还有xml.sax.handler中的ContentHandler

ContentHandler类方法介绍

# characters(content)方法
# 调用时机:
# 从行开始,遇到标签之前,存在字符,content的值为这些字符串。
# 从一个标签,遇到下一个标签之前, 存在字符,content的值为这些字符串。
# 从一个标签,遇到行结束符之前,存在字符,content的值为这些字符串。
# 标签可以是开始标签,也可以是结束标签。 # startDocument()方法
# 文档启动的时候调用。 # endDocument()方法
# 解析器到达文档结尾时调用。 # startElement(name, attrs)方法
# 遇到XML开始标签时调用,name是标签的名字,attrs是标签的属性值字典。 # endElement(name)方法
# 遇到XML结束标签时调用。 # make_parser方法
# 创建一个新的解析器对象并返回。
# xml.sax.make_parser( [parser_list] ) # (parser_list - 可选参数,解析器列表) # parser方法
# 创建一个 SAX 解析器并解析xml文档:
# xml.sax.parse( xmlfile, contenthandler[, errorhandler])
# 参数说明:
# xmlfile - xml文件名
# contenthandler - 必须是一个ContentHandler的对象
# errorhandler - 如果指定该参数,errorhandler必须是一个SAX ErrorHandler对象 # parseString方法
# parseString方法创建一个XML解析器并解析xml字符串
# xml.sax.parseString(xmlstring, contenthandler[, errorhandler])
# 参数说明:
# xmlstring - xml字符串
# contenthandler - 必须是一个ContentHandler的对象
# errorhandler - 如果指定该参数,errorhandler必须是一个SAX ErrorHandler对象
# eg_v1

import xml.sax

class MovieHandler(xml.sax.ContentHandler):
def __init__(self):
self.CurrentData = ""
self.type = ""
self.format = ""
self.year = ""
self.rating = ""
self.stars = ""
self.description = "" # 开始元素处理
def startElement(self, tag, attributes):
self.CurrentData = tag
if tag == "movie":
print ("*****movie*****")
title = attributes["title"]
print ("title:",title) # 元素结束处理
def endElement(self, tag):
if self.CurrentData == "type":
print ("type:",self.type)
elif self.CurrentData == "format":
print ("format:",self.format)
elif self.CurrentData == "year":
print ("year:",self.year)
elif self.CurrentData == "rating":
print ("rating:",self.rating)
elif self.CurrentData == "stars":
print ("stars:",self.stars)
elif self.CurrentData == "description":
print ("description:",self.description) # 内容事件处理
def characters(self, content):
if self.CurrentData == "type":
self.type = content
elif self.CurrentData == "format":
self.format = content
elif self.CurrentData == "year":
self.year = content
elif self.CurrentData == "rating":
self.rating = content
elif self.CurrentData == "stars":
self.stars = content
elif self.CurrentData == "description":
self.description =content if (__name__ == "__main__"): parser = xml.sax.make_parser()
parser.setFeature(xml.sax.handler.feature_namespaces,0) Headler = MovieHandler()
parser.setContentHandler( Headler ) parser.parse("movies.xml") # *****movie*****
# title: Enemy Behind
# type: War, Thriller
# format: DVD
# year: 2003
# rating: PG
# stars: 10
# description: Talk about a US-Japan war
# description:
#
# *****movie*****
# title: Transformers
# type: Anime, Science Fiction
# format: DVD
# year: 1989
# rating: R
# stars: 8
# description: A schientific fiction
# description:
#
# *****movie*****
# title: Trigun
# type: Anime, Action
# format: DVD
# rating: PG
# stars: 10
# description: Vash the Stampede!
# description:
#
# *****movie*****
# title: Ishtar
# type: Comedy
# format: VHS
# rating: PG
# stars: 2
# description: Viewable boredom
# description:

  

python使用SAX解析xml的更多相关文章

  1. Python:使用基于事件驱动的SAX解析XML

    SAX的特点: 是基于事件的 API 在一个比 DOM 低的级别上操作 为您提供比 DOM 更多的控制 几乎总是比 DOM 更有效率 但不幸的是,需要比 DOM 更多的工作 基于对象和基于事件的接口 ...

  2. python sax解析xml

    #books.xml<catalog> <book isbn="0-596-00128-2"> <title>Python & XML& ...

  3. Python—使用xml.sax解析xml文件

    什么是sax? SAX是一种基于事件驱动的API. 利用SAX解析XML文档牵涉到两个部分:解析器和事件处理器. 解析器负责读取XML文档,并向事件处理器发送事件,如元素开始跟元素结束事件; 而事件处 ...

  4. Android之SAX解析XML

    一.SAX解析方法介绍 SAX(Simple API for XML)是一个解析速度快并且占用内存少的XML解析器,非常适合用于Android等移动设备. SAX解析器是一种基于事件的解析器,事件驱动 ...

  5. Android 使用pull,sax解析xml

    pull解析xml文件 1.获得XmlpullParser类的引用 这里有两种方法 //解析器工厂 XmlPullParserFactory factory=XmlPullParserFactory. ...

  6. JAVA使用SAX解析XML文件

    在我的另一篇文章(http://www.cnblogs.com/anivia/p/5849712.html)中,通过一个例子介绍了使用DOM来解析XML文件,那么本篇文章通过相同的XML文件介绍如何使 ...

  7. DOM&SAX解析XML

    在上一篇随笔中分析了xml以及它的两种验证方式.我们有了xml,但是里面的内容要怎么才能得到呢?如果得不到的话,那么还是没用的,解析xml的方式主要有DOM跟SAX,其中DOM是W3C官方的解析方式, ...

  8. cocos2d-x 3.0 使用Sax解析xml文件(中国显示器问题解决)

    今天是个好日子.我以为事情可以变得,明天是个好日子.打开门儿春风... 恩,听着歌写文档生活就是这么享受. 今天曾经的邻居大神突然在qq上赞了我一下,这让我异常激动啊.. 这还要从前前前几天说起,那会 ...

  9. SAX解析xml浅析

    SAX解析XML文件采用事件驱动的方式进行,也就是说,SAX是逐行扫描文件,遇到符合条件的设定条件后就会触发特定的事件,回调你写好的事件处理程序.使用SAX的优势在于其解析速度较快,占用内存较少(相对 ...

随机推荐

  1. 计算机网络 0.初识Internet与TCP/IP协议

    互联网,即因特网,Internet.互联网是一个世界范围的计算机网络.连接了世界上无数的计算设备,这些计算设备为PC.基于Linux的工作站,serverservers等等. 这些设备依据其作用不同可 ...

  2. gitlab+jenkins多项目,多依赖,继承等上下级项目关系的自动部署

    案例: 现有三个项目,Common,entity,serviceAPIentity依赖于Common,serviceAPI依赖于entity,也就是说common的下级项目是entity,而entit ...

  3. Redis基本管理

    Redis介绍 开源 内存存储 数据结构存储  1.字符串(数字)    2.列表    3.hash    4.set 集合   5.sorted set 有序集合 用途 :数据库  缓存  消息队 ...

  4. open '/dev/hwlog_switch' fail -1, 13. Permission denied

    https://blog.csdn.net/qq_36317441/article/details/79376522 将HBuilder开发的APP运行在华为手机上时,控制台显示 open '/dev ...

  5. [wx]雪落香杉树人物关系图

    雪落香杉树 开始的时候场面比较宏大,出场的人比较多.加上外国人名字没辨识度,所以容易乱 被告人: 宫本天道 9 10 11 12月被关77天(谋杀罪,9.16日早谋杀卡尔.海因)--妻子:初枝 白色衬 ...

  6. iot平台在k8s搭建过程

    统一在   cd /opt/iot nohup /opt/iopservices.sh >/var/log/helmapi.log & 直接查看pod日志? kubectl logs i ...

  7. LVS+Keepalived高可用部署

    一.LVS+Keepalived高可用部署 一.keepalived节点部署 1.安装keepalived yum install keepalived ipvsadm -y mkdir -p /op ...

  8. gerrit上的commit msg中关联jira单号(含gerrit的安装)

    这个问题折腾了很久,前期后后大概一个月吧,终于搞定了,查了很多资料,有的不完整,有的完全就不能用,有的没说完整,所以一定要记录下来,我的心血啊. 由于公司在用的gerrit的是正式环境中的,大家都在使 ...

  9. js计算斐波拉切

    function feibo(a){ if(!a || a <= 0){ throw new Error("参数错误,必须大于0"); }else if(a == 1){ r ...

  10. js 检查文件格式和文件大小

    之前有个工作需要用到js检查文件大小和文件格式,网上查了下有个兄弟写的不错,拿过来就能直接用,感谢他顺便记录下.原始文章地址http://www.jb51.net/article/43498.htm ...