一、XML文件注意点

1.内容中不能出现尖括号

例如:下面是不合法的

<grade>成绩<90</grade>

解决方案:使用实体引用<EntityReference>,可以理解为转义

<grade>成绩&st;90</grade>  #&lt;代表小于号,&gt;代表大于号

2.另一种方法:把含有保留字符的部分放在CDATA块内部,CDATA块把内部信息视为不需要转义

<![CDATA[

  select name,age

  from Student

  where score>80

  ]]>

3.常用的需要转义的保留字符和对应的实体应用

&:&amp;

<:&lt;

>:&gt;

':&apos;

":&quot;

一共五个,每个实体引用都是以&开头并且以分号结尾的

4.命名规则

Pascal命名法;用单词命名,首字母大写;大小写严格区分;配对的标签必须是一致的。

5.命名空间

为了防止命名冲突,需要给可能产生冲突的元素添加命名空间

xmlns:xml  name  space  的缩写

例子:


<Schooler xmlns:student="http://my_student"  xmlns="http://my_room">

    <student:Name>LiuYing</student:Name><!--其实这里面的name容易产生歧义,所以定义了两个命名空间来对name加以区分-->

    <Age>23</Age>

    <room:Name>2014</room:Name>

    <Location>1-23-1</Location>

</Schooler>

6.xml访问

(1)读取

SAX(Simple API for XML):基于事件驱动API

利用SAX解析文档设计到解析器和事件处理两部分

​特点:i.快​;ii.​流式读取(通俗的来说按顺序读下去);

DOM​:i.是w3c规定的XML编程接口;ii.一个XML文件在缓存中以树形结构保存,读取​;iii.​用途:定位浏览XML​任何一个节点信息;添加删除相应内容;iv.minidom:

minidom.parse(filename):加载读取的xml文件,filename也可以是xml代码​。

doc.documentElement:获取xml文档对象,一个xml文件只有一个对于的文档对象​。

node.getAttribute(attr_name):获取xml节点的属性值。

node.getElementByTagName(tag_name):得到一个节点对象集合。

node.childNodes:得到所有孩子节点​。

node.childNodes[indexs].nodeValue​:获取单个节点值。

node.fistNode:得到第一个节点,等价于:node.childInde[0]

node.attributes[tag_name]

三、源码

D30_1_XmlNameSpace.xml

https://github.com/ruigege66/Python_learning/blob/master/D30_1_XmlNameSpace.xml​

2.CSDN:https://blog.csdn.net/weixin_44630050(心悦君兮君不知-睿)

3.博客园:https://www.cnblogs.com/ruigege0000/

4.欢迎关注微信公众号:傅里叶变换,个人公众号,仅用于学习交流,后台回复”礼包“,获取大数据学习资料

Python连载44-XML其他注意点的更多相关文章

  1. 用 ElementTree 在 Python 中解析 XML

    用 ElementTree 在 Python 中解析 XML 原文: http://eli.thegreenplace.net/2012/03/15/processing-xml-in-python- ...

  2. python标准库xml.etree.ElementTree的bug

    使用python生成或者解析xml的方法用的最多的可能就数python标准库xml.etree.ElementTree和lxml了,在某些环境下使用xml.etree.ElementTree更方便一些 ...

  3. 在python中处理XML

    XML是实现不同语言或程序之间进行数据交换的协议,XML文件格式如下: <data> <country name="Liechtenstein"> < ...

  4. [python标准库]XML模块

    1.什么是XML XML是可扩展标记语言(Extensible Markup Language)的缩写,其中的 标记(markup)是关键部分.您可以创建内容,然后使用限定标记标记它,从而使每个单词. ...

  5. python专题-读取xml文件

    关于python读取xml文章很多,但大多文章都是贴一个xml文件,然后再贴个处理文件的代码.这样并不利于初学者的学习,希望这篇文章可以更通俗易懂的教如何使用python 来读取xml 文件. 什么是 ...

  6. python模块:xml

    """Core XML support for Python. This package contains four sub-packages: dom -- The W ...

  7. 【304】python专题-读取xml文件

    参考:XML DOM 参考手册(w3school) 参考:python专题-读取xml文件 参考:请问用python怎么修改xml的节点值? 1. 读取标签内的文本(Python) 如下的 xml 文 ...

  8. Python模块 shelve xml configparser hashlib

    常用模块1. shelve 一个字典对象模块 自动序列化2.xml 是一个文件格式 写配置文件或数据交换 <a name="hades">123</a>3. ...

  9. Python连载13-shutile模块(续)和zipfile模块

    一.shutil模块(续) 1.函数:upack_archive() (1)用法:解包操作 (2)格式:shutil.unpack_archive("归档文件地址“,”解包之后的地址“) ( ...

  10. Python连载12-shutil模块

    一.shutil模块 1.函数:copy() (1)用法:复制文件0 (2)格式:copy(来源路径,目标路径) (3)返回值:返回目标路径 (4)注意:拷贝的同时可以给文件重命名 source_pa ...

随机推荐

  1. Netfilter,获取http明文用户名和密码

    目录 Netfilter简介 实验-target端 内核模块的操作 初始化netfilter 解析http包,获取用户名和密码 实验-hack端 遇到的问题 @ Netfilter简介 Netfilt ...

  2. Python升级后ssl模块不可用问题解决和浅析

    在Cent0S 7.5下将Python 2.7.5升级到Python 3.6.6后,发现ssl模块不可用,具体详细信息如下所示: [root@db-server ~]# pip list Packag ...

  3. 表单生成器(Form Builder)之伪造表单数据番外篇——指定范围随机时间

    为了伪造一些尽量真实的假数据,也真是够费劲的.上一篇笔记记录了一下获取一个随机车辆牌照,这篇笔记记录一下怎么获取一个随机时间.这篇就不说那么多废话了,直接上代码 // 获取指定范围的随机数 var g ...

  4. leetcode——链表

    206. 反转链表(易) 反转一个单链表. 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2->1->N ...

  5. BITCTF-MISC

    MISC 以此笔记来记录本菜鸡做misc的历程 签到85 首先看题 提示base85 打开kali,使用python的base64库来解码(内有base85解码) (其实只要输python3即可 我还 ...

  6. python 导入同级目录文件时报错

    当你import的时候,python解释器只会在sys.path这个变量(一个list,你可以print出来看)里面的路径中找可能匹配的package或module. 而一个package跟一个普通文 ...

  7. 如何用node.js中的ejs写入页面_以6.19京东秒杀的商品为例

    用erpress搭建好基本框架后,在自己新建的express文件夹下将会生成;bin,public,routes,views,app.js,package.json,node_modules目录哟!, ...

  8. python del和垃圾回收

    1. del是删除对象 2. python中的垃圾回收是删除引用计数

  9. Java题库——Chapter4 循环

    1)How many times will the following code print "Welcome to Java"? int count = 0; while (co ...

  10. Django路由系统的简介与使用

    Django的路由系统 Django 1.11版本 URLConf官方文档 URL配置(URLconf)就像Django 所支撑网站的目录.它的本质是URL 与 为该URL调用的视图函数之间的映射表. ...