Python连载44-XML其他注意点
一、XML文件注意点
1.内容中不能出现尖括号
例如:下面是不合法的
<grade>成绩<90</grade>
解决方案:使用实体引用<EntityReference>,可以理解为转义
<grade>成绩&st;90</grade> #<代表小于号,>代表大于号
2.另一种方法:把含有保留字符的部分放在CDATA块内部,CDATA块把内部信息视为不需要转义
<![CDATA[ select name,age from Student where score>80 ]]>
3.常用的需要转义的保留字符和对应的实体应用
&:&
<:<
>:>
':'
":"
一共五个,每个实体引用都是以&开头并且以分号结尾的
4.命名规则
Pascal命名法;用单词命名,首字母大写;大小写严格区分;配对的标签必须是一致的。
5.命名空间
为了防止命名冲突,需要给可能产生冲突的元素添加命名空间
xmlns:xml name space 的缩写
例子:
<Schooler xmlns:student="http://my_student" xmlns="http://my_room"> <student:Name>LiuYing</student:Name><!--其实这里面的name容易产生歧义,所以定义了两个命名空间来对name加以区分--> <Age>23</Age> <room:Name>2014</room:Name> <Location>1-23-1</Location> </Schooler>
6.xml访问
(1)读取
SAX(Simple API for XML):基于事件驱动API
利用SAX解析文档设计到解析器和事件处理两部分
特点:i.快;ii.流式读取(通俗的来说按顺序读下去);
DOM:i.是w3c规定的XML编程接口;ii.一个XML文件在缓存中以树形结构保存,读取;iii.用途:定位浏览XML任何一个节点信息;添加删除相应内容;iv.minidom:
minidom.parse(filename):加载读取的xml文件,filename也可以是xml代码。
doc.documentElement:获取xml文档对象,一个xml文件只有一个对于的文档对象。
node.getAttribute(attr_name):获取xml节点的属性值。
node.getElementByTagName(tag_name):得到一个节点对象集合。
node.childNodes:得到所有孩子节点。
node.childNodes[indexs].nodeValue:获取单个节点值。
node.fistNode:得到第一个节点,等价于:node.childInde[0]
node.attributes[tag_name]
三、源码
D30_1_XmlNameSpace.xml
https://github.com/ruigege66/Python_learning/blob/master/D30_1_XmlNameSpace.xml
2.CSDN:https://blog.csdn.net/weixin_44630050(心悦君兮君不知-睿)
3.博客园:https://www.cnblogs.com/ruigege0000/
4.欢迎关注微信公众号:傅里叶变换,个人公众号,仅用于学习交流,后台回复”礼包“,获取大数据学习资料
Python连载44-XML其他注意点的更多相关文章
- 用 ElementTree 在 Python 中解析 XML
用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...
- python标准库xml.etree.ElementTree的bug
使用python生成或者解析xml的方法用的最多的可能就数python标准库xml.etree.ElementTree和lxml了,在某些环境下使用xml.etree.ElementTree更方便一些 ...
- 在python中处理XML
XML是实现不同语言或程序之间进行数据交换的协议,XML文件格式如下: <data> <country name="Liechtenstein"> < ...
- [python标准库]XML模块
1.什么是XML XML是可扩展标记语言(Extensible Markup Language)的缩写,其中的 标记(markup)是关键部分.您可以创建内容,然后使用限定标记标记它,从而使每个单词. ...
- python专题-读取xml文件
关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...
- python模块:xml
"""Core XML support for Python. This package contains four sub-packages: dom -- The W ...
- 【304】python专题-读取xml文件
参考:XML DOM 参考手册(w3school) 参考:python专题-读取xml文件 参考:请问用python怎么修改xml的节点值? 1. 读取标签内的文本(Python) 如下的 xml 文 ...
- Python模块 shelve xml configparser hashlib
常用模块1. shelve 一个字典对象模块 自动序列化2.xml 是一个文件格式 写配置文件或数据交换 <a name="hades">123</a>3. ...
- Python连载13-shutile模块(续)和zipfile模块
一.shutil模块(续) 1.函数:upack_archive() (1)用法:解包操作 (2)格式:shutil.unpack_archive("归档文件地址“,”解包之后的地址“) ( ...
- Python连载12-shutil模块
一.shutil模块 1.函数:copy() (1)用法:复制文件0 (2)格式:copy(来源路径,目标路径) (3)返回值:返回目标路径 (4)注意:拷贝的同时可以给文件重命名 source_pa ...
随机推荐
- Netfilter,获取http明文用户名和密码
目录 Netfilter简介 实验-target端 内核模块的操作 初始化netfilter 解析http包,获取用户名和密码 实验-hack端 遇到的问题 @ Netfilter简介 Netfilt ...
- Python升级后ssl模块不可用问题解决和浅析
在Cent0S 7.5下将Python 2.7.5升级到Python 3.6.6后,发现ssl模块不可用,具体详细信息如下所示: [root@db-server ~]# pip list Packag ...
- 表单生成器(Form Builder)之伪造表单数据番外篇——指定范围随机时间
为了伪造一些尽量真实的假数据,也真是够费劲的.上一篇笔记记录了一下获取一个随机车辆牌照,这篇笔记记录一下怎么获取一个随机时间.这篇就不说那么多废话了,直接上代码 // 获取指定范围的随机数 var g ...
- leetcode——链表
206. 反转链表(易) 反转一个单链表. 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2->1->N ...
- BITCTF-MISC
MISC 以此笔记来记录本菜鸡做misc的历程 签到85 首先看题 提示base85 打开kali,使用python的base64库来解码(内有base85解码) (其实只要输python3即可 我还 ...
- python 导入同级目录文件时报错
当你import的时候,python解释器只会在sys.path这个变量(一个list,你可以print出来看)里面的路径中找可能匹配的package或module. 而一个package跟一个普通文 ...
- 如何用node.js中的ejs写入页面_以6.19京东秒杀的商品为例
用erpress搭建好基本框架后,在自己新建的express文件夹下将会生成;bin,public,routes,views,app.js,package.json,node_modules目录哟!, ...
- python del和垃圾回收
1. del是删除对象 2. python中的垃圾回收是删除引用计数
- Java题库——Chapter4 循环
1)How many times will the following code print "Welcome to Java"? int count = 0; while (co ...
- Django路由系统的简介与使用
Django的路由系统 Django 1.11版本 URLConf官方文档 URL配置(URLconf)就像Django 所支撑网站的目录.它的本质是URL 与 为该URL调用的视图函数之间的映射表. ...