python序列化模块 json&&pickle&&shelve
#序列化模块
#what
#什么叫序列化--将原本的字典、列表等内容转换成一个字符串的过程叫做序列化。
#why
#序列化的目的
##1.以某种存储形式使自定义对象持久化
##2.将对象从一个地方传递到另一个地方
##3.使程序更具有维护性 #str-------------反序列化-------->>>数据结构
#数据结构<<<-------序列化-------------str #json
#json模块提供了四个功能:dumps,dump,loads,load #loads 和 dumps **************** import json dic0 = {'k1':'v1', 'k2':'v2'}
str_dic = json.dumps(dic0) #序列化:将一个字典转换成一个字符串
print(str_dic, type(str_dic))#{"k1": "v1", "k2": "v2"} <class 'str'>
#注意:要用json转换完的字符串类型的字典中的字符串是由""表示的 dic1 = json.loads(str_dic) #反序列化:将一个字符串格式的字典转换为一个字典
#注意:要用json的loads功能处理的字符串类型的字典中的字符串必须由""表示
print(dic1, type(dic1))#{'k1': 'v1', 'k2': 'v2'} <class 'dict'> list_dic = [1,['a','b','c'],3,{'k1':'v1','k2':'v2'}]
str_dic = json.dumps(list_dic) #也可以处理嵌套的数据类型
print(type(str_dic),str_dic) #<class 'str'> [1, ["a", "b", "c"], 3, {"k1": "v1", "k2": "v2"}]
list_dic2 = json.loads(str_dic)
print(type(list_dic2),list_dic2) #<class 'list'> [1, ['a', 'b', 'c'], 3, {'k1': 'v1', 'k2': 'v2'}] #load 和 dump ****************** import json f = open('json_file','w')
dic0 = {'k1':'v1', 'k2':'v2'}
json.dump(dic0,f) #dump方法接收一个文件句柄,直接将字典转为json字符串写入文件
f.close() f = open('json_file', 'r')
dic1 = json.load(f) #load方法接收一个文件句柄,直接将文件中的json字符串转换成数据结构返回
f.close()
print(dic1, type(dic1))#{'k1': 'v1', 'k2': 'v2'} <class 'dict'> #ensure_ascii关键字参数 ******** import json f = open('file.txt','w',encoding='utf-8')
ret = json.dumps({'国籍':'美国'},ensure_ascii=False)
f.write(ret+'\n')
f.close() #其他参数说明 # 1.Serialize obj to a JSON formatted str.(字符串表示的json对象)
# 2.Skipkeys:默认值是False,如果dict的keys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None),设置为False时,就会报TypeError的错误。此时设置成True,则会跳过这类key
# 3.ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为\uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。)
# If check_circular is false, then the circular reference check for container types will be skipped and a circular reference will result in an OverflowError (or worse).
# If allow_nan is false, then it will be a ValueError to serialize out of range float values (nan, inf, -inf) in strict compliance of the JSON specification, instead of using the JavaScript equivalents (NaN, Infinity, -Infinity).
# 4.indent:应该是一个非负的整型,如果是0就是顶格分行显示,如果为空就是一行最紧凑显示,否则会换行且按照indent的数值显示前面的空白分行显示,这样打印出来的json数据也叫pretty-printed json
# 5.separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,’:’);这表示dictionary内keys之间用“,”隔开,而KEY和value之间用“:”隔开。
# 6.default(obj) is a function that should return a serializable version of obj or raise TypeError. The default simply raises TypeError.
# 7.sort_keys:将数据根据keys的值进行排序。
# To use a custom JSONEncoder subclass (e.g. one that overrides the .default() method to serialize additional types), specify it with the cls kwarg; otherwise JSONEncoder is used. #json的格式化输出 import json
data = {'username':['李大爷','二大爷'],'sex':'male','age':16}
json_dic2 = json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False)
print(json_dic2) #总结:
#1.json格式的key必须是字符串数据类型,json格式中的字符串必须是”“双引号
#2.如果数字是key,那么dump之后会强行转为字符串类型
#3.json对元组做value的字典会把元组强行转为列表,json对元组做key,不支持,会报错
#4.中文格式在文件中dumps和dump有关键字参数ensure_ascii
#5.json的其他参数 sort_keys,indent,separators
#6.不允许存set数据类型,set不能被dump和dumps
#7.不可以多次dunp #pickle
# 用于序列化的两个模块 # json,用于字符串 和 python数据类型间进行转换
# pickle,用于python特有的类型 和 python的数据类型间进行转换 # pickle模块提供了四个功能:dumps、dump(序列化,存)、loads(反序列化,读)、load (不仅可以序列化字典,列表...可以把python中任意的数据类型序列化 import pickle
dic = {'k1':'v1','k2':'v2','k3':'v3'}
str_dic = pickle.dumps(dic)
print(str_dic) #一串二进制内容 dic2 = pickle.loads(str_dic)
print(dic2) #字典 import time
struct_time = time.localtime(1000000000)
print(struct_time)
f = open('pickle_file','wb')
pickle.dump(struct_time,f)
f.close() f = open('pickle_file','rb')
struct_time2 = pickle.load(f)
print(struct_time2.tm_year) # 这时候机智的你又要说了,既然pickle如此强大,为什么还要学json呢?
# 这里我们要说明一下,json是一种所有的语言都可以识别的数据结构。
# 如果我们将一个字典或者序列化成了一个json存在文件里,那么java代码或者js代码也可以拿来用。
# 但是如果我们用pickle进行序列化,其他语言就不能读懂这是什么了~
# 所以,如果你序列化的内容是列表或者字典,我们非常推荐你使用json模块
# 但如果出于某种原因你不得不序列化其他的数据类型,而未来你还会用python对这个数据进行反序列化的话,那么就可以使用pickle #总结:
#1.dump的结果是bytes,dunp用的文件句柄需要wb,load需要用rb
#2.支持几乎所有对象的序列化,对应对象的序列化需要这个对象对应的类在内存中
#3.可以多次dump while i: try: picle.load(f) excepe EOFError: break #shelve # shelve也是python提供给我们的序列化工具,比pickle用起来更简单一些。
# shelve只提供给我们一个open方法,是用key来访问的,使用起来和字典类似。 import shelve
f = shelve.open('shelve_file')
f['key'] = {'int':10, 'float':9.5, 'string':'Sample data'} #直接对文件句柄操作,就可以存入数据
f.close() import shelve
f1 = shelve.open('shelve_file')
existing = f1['key'] #取出数据的时候也只需要直接用key获取即可,但是如果key不存在会报错
f1.close()
print(existing) # 这个模块有个限制,它不支持多个应用同一时间往同一个DB进行写操作。
#所以当我们知道我们的应用如果只进行读操作,我们可以让shelve通过只读方式打开DB f = shelve.open('shelve_file', flag='r')
existing = f['key']
f.close()
print(existing) # 由于shelve在默认情况下是不会记录待持久化对象的任何修改的,
#所以我们在shelve.open()时候需要修改默认参数,否则对象的修改不会保存。 import shelve
f1 = shelve.open('shelve_file')
print(f1['key'])
f1['key']['new_value'] = 'this was not here before'
f1.close() f2 = shelve.open('shelve_file', writeback=True)
print(f2['key'])
f2['key']['new_value'] = 'this was not here before'
f2.close() # writeback方式有优点也有缺点。
#优点是减少了我们出错的概率,并且让对象的持久化对用户更加的透明了;
#但这种方式并不是所有的情况下都需要,首先,使用writeback以后,
#shelf在open()的时候会增加额外的内存消耗,并且当DB在close()
#的时候会将缓存中的每一个对象都写入到DB,这也会带来额外的等待时间。
#因为shelve没有办法知道缓存中哪些对象修改了,哪些对象没有修改,
#因此所有的对象都会被写入
python序列化模块 json&&pickle&&shelve的更多相关文章
- python 全栈开发,Day25(复习,序列化模块json,pickle,shelve,hashlib模块)
一.复习 反射 必须会 必须能看懂 必须知道在哪儿用 hasattr getattr setattr delattr内置方法 必须能看懂 能用尽量用__len__ len(obj)的结果依赖于obj. ...
- python序列化: json & pickle & shelve 模块
一.json & pickle & shelve 模块 json,用于字符串 和 python数据类型间进行转换pickle,用于python特有的类型 和 python的数据类型间进 ...
- python开发模块基础:序列化模块json,pickle,shelve
一,为什么要序列化 # 将原本的字典.列表等内容转换成一个字符串的过程就叫做序列化'''比如,我们在python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给?现在我们能想到的方法就是存在文 ...
- Python序列化,json&pickle&shelve模块
1. 序列化说明 序列化可将非字符串的数据类型的数据进行存档,如字典.列表甚至是函数等等 反序列化,将通过序列化保存的文件内容反序列化即可得到数据原本的样子,可直接使用 2. Python中常用的序列 ...
- python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess logging re正则
python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess ...
- python全栈开发day17-常用模块collections,random,time,os,sys,序列化(json pickle shelve)
1.昨日内容回顾 1.正则表达式 # 正则表达式 —— str # 检测字符串是否符合要求 # 从大段的文字中找到符合要求的内容 1).元字符 #. # 匹配除换行 ...
- day6_python序列化之 json & pickle & shelve 模块
一.json & pickle & shelve 模块 json,用于字符串 和 python数据类型间进行转换pickle,用于python特有的类型 和 python的数据类型间进 ...
- Day 21 序列化模块_Json,Pickle,Shelve
序列化 , 数据类型,列表 元组, 字符串 只有字符串能被写入文件中. 能在网络上传输的只能是bytes - 字符串 把要传输的和要存储的内容转换成字符串. 字符串 转换回 要传输和存储的内容 序列化 ...
- Python全栈之路----常用模块----序列化(json&pickle&shelve)模块详解
把内存数据转成字符,叫序列化:把字符转成内存数据类型,叫反序列化. Json模块 Json模块提供了四个功能:序列化:dumps.dump:反序列化:loads.load. import json d ...
随机推荐
- BZOJ 2101 [Usaco2010 Dec]Treasure Chest 藏宝箱:区间dp 博弈【两种表示方法】【压维】
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=2101 题意: 共有n枚金币,第i枚金币的价值是w[i]. 把金币排成一条直线,Bessie ...
- php设置文件编码
<?php @header('Content-type: text/html;charset=UTF-8'); ?>
- [原创]Java在线编辑word文档调用PageOffice实现并发控制
1.功能介绍 PageOffice的并发控制功能用来解决多个用户在线编辑同一篇文档可能造成的互相覆盖修改结果的技术难题. B/S架构下用户访问都是并发的,也就是说经常会出现同时N个用户对一个服务器页面 ...
- win32com操作word(3):导入VBA常量
导入VBA常量方法:http://blog.sina.com.cn/s/blog_a73687bc0101k8x8.html 我们之前说过,win32com组件为python提供处理COM组件(.dl ...
- k8s-部署WEB-UI(dashboard)
[root@k8s-master dashboard]# pwd/usr/local/src/kubernetes/cluster/addons/dashboard [root@k8s-master ...
- P3515 [POI2011]Lightning Conductor[决策单调性优化]
给定一序列,求对于每一个$a_i$的最小非负整数$p_i$,使得$\forall j \neq i $有$ p_i>=a_j-a_i+ \sqrt{|i-j|}$. 绝对值很烦 ,先分左右情况单 ...
- python optparse命令解析模块
来源:http://www.cnblogs.com/pping/p/3989098.html?utm_source=tuicool&utm_medium=referral 来源:http:// ...
- Ubuntu下mysql修改连接超时wait_timeout
命令行登入mysql show variables like '%timeout%':(其中有用的是: interactive_timeout 和wait_timeout 为28800,默认为8小 ...
- layout属性
RelativeLayout 第一类:属性值为true可false android:layout_centerHrizontal 水平居中 android:layout_centerVe ...
- 浏览器原生 form 表单POST 数据的两种方式
我们在提交表单的时候,form表单参数中会有一个enctype的参数.enctype指定了HTTP请求的Content-Type. 常用有两种:application/x-www-form-urlen ...