python模块--json \ pickle \ shelve \ XML模块
一、json模块
之前学习过的eval内置方法可以将一个字符串转成一个python对象,不过eval方法时有局限性的,对于普通的数据类型,json.loads和eval都能用,但遇到特殊类型的时候,eval就不管用了。所以eval的重点还是通常用来执行一个字符串表达式,并返回表达式的值。
import json
x = "[null,true,false,1]"
# print(eval(x)) #用eval会报错
print(json.loads(x)) # 用json就不会报错
什么是序列化?
我们把对象(变量)从内存种变成可存储或传输的过程称之为序列化,在python种叫picking,在其他语言种也被称之为serialiation,marshalling,flattening,等等,都是一个意思。序列化之后,就可以把徐磊话后的内容写入磁盘,或者通过网络传输到机器上。反过来,把变量内容从徐磊话的对象重新督导内存里称之为反序列化,即unpicking.
json
如果我们要在不同的编程语言之间传递对象,就必须把对象序列化为标准式,比如XML,但更好的方法是序列化为json,因为json表示出来就是一个字符串,可以被所有语言读取。也可以方便的存储到磁盘或者通过网络传输。json不仅是标准式,并且比XML更快,而且可以直接在web页面种读取,非常方便。
json表示的对象就是标准的JavaScript语言的对象,json和python内置的书v类型如下: JSON PYTHON类型
{} dict
[] list
"string" str
1234.56 int或float
true/false Ture/False
null None
json的内部转成
dic={'name':'alex'}#---->{"name":"alex"}----->'{"name":"alex"}'
i=8 #---->'8'
s='hello' #---->"hello"------>'"hello"'
l=[11,22] #---->"[11,22]"
例1:json和eval的区别
import json
x = "[null,true,false,1]"
# print(eval(x)) #用eval会报错
print(json.loads(x)) # 用json就不会报错,即eval有局限性
例2:不用json时的读写文件方式
dic = '{"name":"老王","age":18}'
f = open("hello","w",encoding="utf-8")
f.write(dic)
f.close() # 注意,写完文件后要记得关闭文件
f_read = open("hello","r",encoding="utf-8")
data = f_read.read()
# print(data)
print(type(data))
dat = eval(data)
print(dat)
print(dat["name"])
例3:运用json时的读写方式
import json
dic = {'name':'老王','age':19}
f = open("new_hello","w",encoding="utf-8")
dic_str = json.dumps(dic) #将字典编译成json格式的字符串,因为json格式的可以进行多种数据传输。即序列化的过程
f.write(dic_str) #写入文件,最后存在文件中的形式都是字符串格式的,已经不是字典了。
f.close()
#json.dump(dic,f) #该句相当于以上两句的效果,平时用上面的比较好。 f_read = open("new_hello","r",encoding="utf-8")
data = json.loads(f_read.read()) #进行反序列化,将json格式的字符串转成普通的字符串
#data = json.load(f_read) #该句相当于以上一句。可以简单化,但是平时用上面的比较多。
print(data)
print(type(data)) #由此可见,反序列化后,又转成了字典形式。
print(data["name"]) #由上一部可以得知,这里可以进行由键取值
{'name': '老王', 'age': 19}
<class 'dict'>
老王
例4:注意一些细节
import json
with open("new_hello1","r") as f: #这种读取方式可以命名,如别名 "f",也要有打开方式
data = f.read()
data = json.loads(data)
print(data["name"])
二,pickle模块
pickle
pickle的问题和所有其他编程语言特有的序列化问题一样,就是它只能用于python,并且可能不同版本的python彼此都不兼容,因此,只能用pickle保存那些不重要的数据,不能成功地反序列化也没关系。
例:pickle的序列化与反序列化的过程
dic = {"name":"老王","age":18,"gender":"male"}
import pickle
print(type(dic)) #<class 'dict'> j = pickle.dumps(dic)
print(type(j)) #<class 'bytes'> f = open("序列化_str","wb") #"w"是写入str; "wb"是写入bytes.注意这个细节
f.write(j)
f.close()
#j = picklr.dumps(dic) 和f.write(j) 这两句等价于 pickle.dump(f)
####-----> 以上pickle.dumps() 的过程就相当于 【序列化】 的过程 ####-----> 以下pickle.loads() 就是反序列化的过程
f_read = open("序列化_str","rb")
data = pickle.loads(f_read.read()) #相当于 data = pickle.load(f.read)
print(data["name"])
print(data["age"])
<class 'dict'>
<class 'bytes'>
老王
18
三,shelve模块
shelve
shelve模块比pickle模块简单,只有一个open函数,返回类似字典的对象,可读可写;key必须为字符串,而值可以是python所支持的数据类。
import shelve
f = shelve.open(r"shelve1.txt") # 此处是将一个字典放入文本 f = {}
f['info1'] = {"name":"老王","age":18,"gender":"male"}
f['info2'] = {"name":"老李","age":20,"gender":"male"}
f['school_info'] = {'website':'www.baidu.com','city':'beijing'}
##---------> 以上这些是写入内容
f.close()
####运行会生成三个文件
f = shelve.open(r"shelve1.txt")
print(f.get('info1')['name']) #读取方法用f.get,读取前要打开文件。打开方式如上
四、XML
XML模块
xml是实现不同语言或程序之间进行数据交换的协议,跟json差不多,但json使用起来更简单,不过,古时候,在json还没有诞生的的年代里,大家只能选择用xml,至今很多传统公司如金融行业的很多系统的接口还主要是xml.
xml的格式如下,就是通过<>节点来区别数据结构的:
数据代码如下
<data>
<country name="Liechtenstein">
<rank updated="yes">2</rank>
<year updated="yes">2010</year>
<gdppc>141100</gdppc>
<neighbor direction="E" name="Austria" />
<neighbor direction="W" name="Switzerland" />
</country>
<country name="Singapore">
<rank updated="yes">5</rank>
<year updated="yes">2013</year>
<gdppc>59900</gdppc>
<neighbor direction="N" name="Malaysia" />
</country>
<country name="Panama">
<rank updated="yes">69</rank>
<year updated="yes">2013</year>
<gdppc>13600</gdppc>
<neighbor direction="W" name="Costa Rica" />
<neighbor direction="E" name="Colombia" />
</country>
</data>
注释:属性用来解释标签;属性加在标签的第一个<>里面;xml都是tag属性。
xml协议在各个语言里都是支持的,在python中可以用以下模块操作xml:
#####--------------------------> XML
import xml.etree.ElementTree as ET # 原名太长,可以起别名,方便下面引用 tree = ET.parse('xml_lesson1') #??
root = tree.getroot() #??
print(root.tag) #打印根节点 for i in root:
# print(i.tag) #打印data下的第一层节点,即三个country
# print(i.attrib) # 打印每个节点的属性,即country,<>内部紧跟country的部分
for j in i:
# print(j.tag) #打印data下的第二层节点,即country下的节点,
# print(j.attrib) # 打印该层每个节点的属性
print(j.text) #打印 每两个<>之间包括的值 ##-------> 遍历xml文档 for child in root:
print(child.tag,child.attrib)
for n in child:
print(n.tag,n.text) ##------> 只遍历year节点
for code in root.iter('year'):
print(code.tag,code.text) ###-------------> 修改
import xml.etree.ElementTree as ET # 原名太长,可以起别名,方便下面引用 tree = ET.parse('xml_lesson1')
root = tree.getroot() ###-------------> 修改
for code in root.iter('year'):
new_year = int(code.text) + 1
code.text = str(new_year)
code.set("updated","yes")
tree.write('xml_lesson') ##--------------> 删除节点
for node in root.findall('country'):
rank = int(node.find('rank').text)
if rank > 5:
root.remove(node)
tree.write('output.xml')
import xml.etree.ElementTree as ET # 原名太长,可以起别名,方便下面引用 tree = ET.parse('xml_lesson1') #解析xml,读取数据,摄取数据赋给变量tree,tree即成对象,
# 且是一个实体对象,可以调用一系类方法
#'xml_lesson1 里面存的都是文档树
#data是根对象,下面的country都是节点对象
root = tree.getroot() #获取tree的根节点
print(root.tag) #打印根节点
自己创建xml文档
####--------------------------> 自己创建标签语言
import xml.etree.ElementTree as ET
new_xml = ET.Element('namelist')
name = ET.SubElement(new_xml,'name',attrib={'enrolled':'yes'})
age = ET.SubElement(name,'age',attrib={'checked':'no'})
sex = ET.SubElement(name, "sex")
sex.text = ''
name2 = ET.SubElement(new_xml, 'name', attrib={"enrolled": "no"})
age = ET.SubElement(name2, 'age')
age.text = '' et = ET.ElementTree('newx_xml') #生成文档对象
et.write('test.xml',encoding='utf-8',xml_declaration=True)
#ET.dump(new_xml) # 打印生成的格式
python模块--json \ pickle \ shelve \ XML模块的更多相关文章
- python 全栈开发,Day25(复习,序列化模块json,pickle,shelve,hashlib模块)
一.复习 反射 必须会 必须能看懂 必须知道在哪儿用 hasattr getattr setattr delattr内置方法 必须能看懂 能用尽量用__len__ len(obj)的结果依赖于obj. ...
- 常用模块(json/pickle/shelve/XML)
一.json模块(重点) 一种跨平台的数据格式 也属于序列化的一种方式 介绍模块之前,三个问题: 序列化是什么? 我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化. 反序列化又是什么? 将 ...
- 模块 - json/pickle/shelve/xml/configparser
序列化: 序列化是指把内存里的数据类型转变成字符串,以使其能存储到硬盘或通过网络传输到远程,因为硬盘或网络传输时只能接受bytes. 为什么要序列化: 有种办法可以直接把内存数据(eg:10个列表,3 ...
- python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess logging re正则
python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess ...
- Python学习笔记——基础篇【第六周】——json & pickle & shelve & xml处理模块
json & pickle 模块(序列化) json和pickle都是序列化内存数据到文件 json和pickle的区别是: json是所有语言通用的,但是只能序列化最基本的数据类型(字符串. ...
- python 序列化及其相关模块(json,pickle,shelve,xml)详解
什么是序列化对象? 我们把对象(变量)从内存中编程可存储或传输的过程称之为序列化,在python中称为pickle,其他语言称之为serialization ,marshalling ,flatter ...
- Python全栈开发记录_第八篇(模块收尾工作 json & pickle & shelve & xml)
由于上一篇篇幅较大,留下的这一点内容就想在这里说一下,顺便有个小练习给大家一起玩玩,首先来学习json 和 pickle. 之前我们学习过用eval内置方法可以将一个字符串转成python对象,不过, ...
- Python day19 模块介绍3(sys,json,pickle,shelve,xml)
1.sys模块 import sys sys.path()#打印系统path sys.version()#解释程序版本信息 sys.platform()#系统平台 sys.exit(0)#退出程序 c ...
- python笔记-7(shutil/json/pickle/shelve/xml/configparser/hashlib模块)
一.shutil模块--高级的文件.文件夹.压缩包处理模块 1.通过句柄复制内容 shutil.copyfileobj(f1,f2)对文件的复制(通过句柄fdst/fsrc复制文件内容) 源码: Le ...
随机推荐
- Eclipse中快速定位
Eclipse中快速定位 选中项目,ctrl+h 一.目标 查找如下的页面属于哪个activity 二.步骤 1.查找关键字 上述页面中“点我”两个字比较显眼,我们可以去android项目中搜索出现“ ...
- 【51nod-1396】还是01串
给定一个0-1串s,长度为n,下标从0开始,求一个位置k,满足0<=k<=n, 并且子串s[0..k - 1]中的0的个数与子串s[k..n - 1]中1的个数相等. 注意: (1) 如果 ...
- bzoj1711
题解: 原点->食物建一个1 食物->牛见一个1 牛->牛'见一个1 牛'->饮料1 饮料->汇点1 代码: #include<cstdio> #includ ...
- ZOJ 3696 Alien's Organ(泊松定理,期望值)
Alien's Organ Time Limit: 2 Seconds Memory Limit: 65536 KB There's an alien whose name is Marja ...
- 在QT中使用静态对象
最近做教研室的项目,需要只能存在一个接收数据的线程,那么我就想把这个线程设置成一个静态对象.但是在connect信号与槽的时候出了一点问题,最后搞好了,现在这mark一下: 比如说一个声明了一个静态的 ...
- U盘做了一个启动盘来安装Ubuntu,装好后,U盘不能进行格式化了,现在说一下网上找的方法
参考网址:http://wenwen.sogou.com/z/q289778573.htm 说是这种情况需要对U盘进行低级格式化,具体方法如下: 你可以尝试使用diskpart命令 ① 以管理员身份运 ...
- New Concept English there (9)
31 65% Cats never fail to fascinate human beings. They can be friendly and affectionate towards huma ...
- 迭代器、foreach循环、泛型集合
集合的迭代 语法:Iterator<Object> it=集合.iterator(); while(it.hasNext()){ Object obj=it.next(); } is.ha ...
- MP3格式音频文件结构解析
MP3的全称是MPEG Audio Layer3,它是一种高效的计算机音频编码方案,它以较大的压缩比将音频文件转换成较小的扩展名为.MP3的文件,基本保持原文件的音质.MP3是ISO/MPEG标准的一 ...
- [置顶]
kubernetes1.7新特性:PodDisruptionBudget控制器变化
背景概念 在Kubernetes中,为了保证业务不中断或业务SLA不降级,需要将应用进行集群化部署.通过PodDisruptionBudget控制器可以设置应用POD集群处于运行状态最低个数,也可以设 ...