什么是序列化?

将一组或多组数据结构转化成一个字符串的过程就叫做序列化

它的目的:

序列化的结构是字符串,准确的说是bytes类型,方便存储

方便于网络传输,

既然序列化是从数据类型到字符串的过程,那是不是可以在反序列化的时候使用eval呢

事实证明:eval对于很多类型反序列化的时候改变了原来数据的类型,再一个就是不安全

序列化: 数据结构  --》 字符串

反序列化:字符串  --》数据结构

一 json

json 是大部分语言都支持的的序列化格式,但是对于python而言支持的数据类型有限。

它支持的类型有:字典,列表,数字类型,而且json里面只允许使用双引号,

还有一点,当将两个以上的数据类型(即使是同一个类型)写入一行,读取也会报错

json的序列化

下面看看json的一个例子

  1. import json
  2. dic={'a':1}
  3. x=None
  4. res=json.dumps(dic)
  5. print(res,type(res)) #{"a": 1} <class 'str'> 这里面的是双引号
  6. print(json.dumps(x)) #由None转化成了null

如果写入文件呢

  1. import json
  2. dic={'a':1,'name':'xinxin'}
  3. with open('user.json','w',encoding='utf-8') as f:
  4. f.write(json.dumps(dic))
  5. #查看文件的结果为:{"a": 1, "name": "xinxin"} 着里面都变成双引号了

那上面的写入文件是不是可以简便点呢?答案是可以

  1. json.dump(dic,open('user_new.json','w',encoding='utf-8'))
  2. #结果是一样的

json的反序列化

  1. # json.dump(dic,open('user_new.json','w',encoding='utf-8'))
  2. # with open('user.json','r',encoding='utf-8') as f:
  3. # user=json.loads(f.read())
  4. # print(user['name'])
  5.  
  6. #上面的太麻烦,简便点
  7. user=json.load(open('user.json','r',encoding='utf-8'))
  8. print(user['name'])

json对字符串的处理

  1. # json_str='{"count":1}'
  2. # print(json.loads(json_str)['count']) #答案为 1 说明是可以解析出来
  3.  
  4. json_str="{'count':1}"
  5. print(json.loads(json_str)['count']) #json对于这种格式会报错
  6.  
  7. #如果在文件里面写单引号会怎么样?
  8. #答案:json使用load和loads都会报错

json的一行内是不能存储两个类型的数据类型的,即使是同一个类型的两个,那么怎么解决呢

  1. a={'':'a'}
  2. b={'':'b'}
  3. c={'':'c'}
  4.  
  5. msg=''
  6. msg+=json.dumps(a)+'\n'
  7. msg+=json.dumps(b)+'\n'
  8. msg+=json.dumps(c)+'\n'
  9. # with open('user_new.json','w',encoding='utf-8') as f:
  10. # f.write(msg)
  11.  
  12. # res=json.load(open('user_new.json','r',encoding='utf-8'))
  13. # print(res) #报错 json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 11)
  14. with open('user_new.json','r',encoding='utf-8') as f:
  15. for i in f:
  16. print(json.loads(i.strip()))
  17.  
  18. '''
  19. {'1': 'a'}
  20. {'2': 'b'}
  21. {'3': 'c'}
  22. 原本字典里面的整数变成了字符串,这是一个缺陷
  23. '''

上面的例子是使用dumps拼接然后使用loads读取的例子,那么使用load是否可以读取呢

  1. res=json.load(open('user_new.json','r',encoding='utf-8'))
  2. print(res) #报错 json.decoder.JSONDecodeError: Extra data: line 2 column 1 (char 11)
  3. #之后我将着三行数据只留下一行,发现可以读取了
  4. #看来,存入多行内容到文件时,
  5. # 1 分别使用dumps转化成字符串 +上\n
  6. # 2 反序列化的时候,按行读取去掉\n,再使用loads反序列化

如果对于拼接后的字符串使用dump直接写入呢

  1. json.dump(msg,open('user.json','w',encoding='utf-8')) #文件中的结果 "{\"1\": \"a\"}\n{\"2\": \"b\"}\n{\"3\": \"c\"}\n"
  2. #结果就变得不一样了

下面是一个json序列化和反序列化中文的情况

  1. dicc={'序号':'one'}
  2. # res=json.dumps(dicc)
  3. # ret=json.loads(res)
  4. # print(ret) #正常显示中文
  5. # f=open('user.json','w',encoding='utf-8')
  6. # json.dump(dicc,f) #查看文件 {"\u5e8f\u53f7": "one"}
  7. # f.close()
  8.  
  9. # f=open('user.json','r',encoding='utf-8')
  10. # res=json.load(f)
  11. # print(res) #正常显示中文
  12. # f.close()
  13.  
  14. f=open('user.json','w',encoding='utf-8')
  15. json.dump(dicc,f,ensure_ascii=False) #查看文件{"序号": "one"} 正常显示中文了
  16. f.close()
  17.  
  18. #json使用dumps序列化后,使用loads是能正常显示中文的,这个是变量的情况,在内存中
  19. #但是写入文件里面,查看文件的内容却是二进制,当然还是可以dump导出看出中文
  20. #要想在文件里面也显示为中文,使用 ensure_ascii=False
  1. 总结:
  2.  
  3. dumps序列化 loads反序列化 只在内存中操作数据 主要用于网络传输 和多个数据与文件打交道
  4. dump序列化 load反序列化 主要用于一个数据直接存在文件里—— 直接和文件打交道

json的其他参数说明

  1. Serialize obj to a JSON formatted str.(字符串表示的json对象)
  2. Skipkeys:默认值是False,如果dictkeys内的数据不是python的基本类型(str,unicode,int,long,float,bool,None),设置为False时,就会报TypeError的错误。此时设置成True,则会跳过这类key
  3. ensure_ascii:,当它为True的时候,所有非ASCII码字符显示为\uXXXX序列,只需在dump时将ensure_ascii设置为False即可,此时存入json的中文即可正常显示。)
  4. If check_circular is false, then the circular reference check for container types will be skipped and a circular reference will result in an OverflowError (or worse).
  5. If allow_nan is false, then it will be a ValueError to serialize out of range float values (nan, inf, -inf) in strict compliance of the JSON specification, instead of using the JavaScript equivalents (NaN, Infinity, -Infinity).
  6. indent:应该是一个非负的整型,如果是0就是顶格分行显示,如果为空就是一行最紧凑显示,否则会换行且按照indent的数值显示前面的空白分行显示,这样打印出来的json数据也叫pretty-printed json
  7. separators:分隔符,实际上是(item_separator, dict_separator)的一个元组,默认的就是(‘,’,’:’);这表示dictionarykeys之间用“,”隔开,而KEYvalue之间用“:”隔开。
  8. default(obj) is a function that should return a serializable version of obj or raise TypeError. The default simply raises TypeError.
  9. sort_keys:将数据根据keys的值进行排序。
  10. To use a custom JSONEncoder subclass (e.g. one that overrides the .default() method to serialize additional types), specify it with the cls kwarg; otherwise JSONEncoder is used.

举例:json的格式话输出:

  1. data={'username':['李华','二愣子'],'sex':'male','age':16}
  2. json_dic=json.dumps(data,sort_keys=True,indent=2,separators=(',',':'),ensure_ascii=False)
  3. print(json_dic)
  4. '''
  5. 显示结果为:
  6. {
  7. "age":16,
  8. "sex":"male",
  9. "username":[
  10. "李华",
  11. "二愣子"
  12. ]
  13. }
  14. 如果indent=0 就顶格写了
  15. '''

二 pickle

pickle支持python中几乎所有的数据类型,包括自定义的类和对象

它和json的区别:json序列化之后是字符串,pickle是bytes类型

  1. dic={'k1':'v1','k2':'v2','k3':'v3'}
  2. str_dic=pickle.dumps(dic) #序列化
  3. print(str_dic) #显示的一串bytes类型的字符串
  4.  
  5. dic2=pickle.loads(str_dic) #反序列化
  6. print(dic2) #{'k1': 'v1', 'k2': 'v2', 'k3': 'v3'}
  7.  
  8. import time
  9. # struct_time=time.localtime(1000000000)
  10. # print(struct_time)
  11. # f=open('pickle_file','wb')
  12. # pickle.dump(struct_time,f) #它写入文件查看时时乱码
  13. # f.close()
  14. #读取文件
  15. # f=open('pickle_file','rb')
  16. # struct_time2=pickle.load(f)
  17. # print(struct_time2.tm_year) #成功显示2001
  18. # f.close()
  19.  
  20. #将文件的写入和读取使用其他编码时报错,因此,pickle只能使用bytes类型的方式操作

其他:

  1. 这时候机智的你又要说了,既然pickle如此强大,为什么还要学json呢?
  2. 这里我们要说明一下,json是一种所有的语言都可以识别的数据结构。
  3. 如果我们将一个字典或者序列化成了一个json存在文件里,那么java代码或者js代码也可以拿来用。
  4. 但是如果我们用pickle进行序列化,其他语言就不能读懂这是什么了~
  5. 所以,如果你序列化的内容是列表或者字典,我们非常推荐你使用json模块
  6. 但如果出于某种原因你不得不序列化其他的数据类型,而未来你还会用python对这个数据进行反序列化的话,那么就可以使用pickle

三 shelve

shelve也是python中提供序列化的模块,使用方法简单

shelve只提供给我们一个open方法,是用key来访问的,使用起来和字典类似。

缺点:

适合读,不适合更新,在writeback时会把所有的数据都重新写入,结果就是可能消耗内存很多,写入耗时;
不能并发的读写,不过可以使用Unix文件锁进行控制(fcntl);

  1. import shelve
  2. f=shelve.open('shelve_file')
  3. f['key']={'int':10, 'float':9.5, 'string':'Sample data'}
  4. f.close()

上面的例子执行后,会产生3个文件,类似于mysql的myisam表

shelve_file.bak   查看:'key', (0, 72)

shelve_file.dat    查看:乱码

shelve_file.dir     查看: 'key', (0, 72)

下面时读取文件

  1. import shelve
  2. f1=shelve.open('shelve_file')
  3. existing=f1['key'] ##取出数据的时候也只需要直接用key获取即可,但是如果key不存在会报错
  4. f1.close()
  5. print(existing) #可以读出内容{'int': 10, 'float': 9.5, 'string': 'Sample data'}

这个模块有个限制,它不支持多个应用同一时间往同一个DB进行写操作。所以当我们知道我们的应用如果只进行读操作,我们可以让shelve通过只读方式打开DB

  1. import shelve
  2. f = shelve.open('shelve_file', flag='r')
  3. existing = f['key']
  4. f.close()
  5. print(existing)

由于shelve在默认情况下是不会记录待持久化对象的任何修改的,所以我们在shelve.open()时候需要修改默认参数,否则对象的修改不会保存。

  1. import shelve
  2. f1 = shelve.open('shelve_file')
  3. print(f1['key'])
  4. f1['key']['new_value'] = 'this was not here before'
  5. f1.close()
  6.  
  7. f2 = shelve.open('shelve_file', writeback=True)
  8. print(f2['key'])
  9. f2['key']['new_value'] = 'this was not here before'
  10. f2.close()

writeback方式有优点也有缺点。优点是减少了我们出错的概率,并且让对象的持久化对用户更加的透明了;但这种方式并不是所有的情况下都需要,首先,使用writeback以后,shelf在open()的时候会增加额外的内存消耗,并且当DB在close()的时候会将缓存中的每一个对象都写入到DB,这也会带来额外的等待时间。因为shelve没有办法知道缓存中哪些对象修改了,哪些对象没有修改,因此所有的对象都会被写入。

序列化模块json--pickle--shelve的更多相关文章

  1. python 全栈开发,Day25(复习,序列化模块json,pickle,shelve,hashlib模块)

    一.复习 反射 必须会 必须能看懂 必须知道在哪儿用 hasattr getattr setattr delattr内置方法 必须能看懂 能用尽量用__len__ len(obj)的结果依赖于obj. ...

  2. python开发模块基础:序列化模块json,pickle,shelve

    一,为什么要序列化 # 将原本的字典.列表等内容转换成一个字符串的过程就叫做序列化'''比如,我们在python代码中计算的一个数据需要给另外一段程序使用,那我们怎么给?现在我们能想到的方法就是存在文 ...

  3. python序列化模块 json&&pickle&&shelve

    #序列化模块 #what #什么叫序列化--将原本的字典.列表等内容转换成一个字符串的过程叫做序列化. #why #序列化的目的 ##1.以某种存储形式使自定义对象持久化 ##2.将对象从一个地方传递 ...

  4. python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib subprocess logging re正则

    python 常用模块 time random os模块 sys模块 json & pickle shelve模块 xml模块 configparser hashlib  subprocess ...

  5. python序列化: json & pickle & shelve 模块

    一.json & pickle & shelve 模块 json,用于字符串 和 python数据类型间进行转换pickle,用于python特有的类型 和 python的数据类型间进 ...

  6. python全栈开发day17-常用模块collections,random,time,os,sys,序列化(json pickle shelve)

    1.昨日内容回顾 1.正则表达式     # 正则表达式 —— str           # 检测字符串是否符合要求     # 从大段的文字中找到符合要求的内容 1).元字符 #. # 匹配除换行 ...

  7. day6_python序列化之 json & pickle & shelve 模块

    一.json & pickle & shelve 模块 json,用于字符串 和 python数据类型间进行转换pickle,用于python特有的类型 和 python的数据类型间进 ...

  8. Day 21 序列化模块_Json,Pickle,Shelve

    序列化 , 数据类型,列表 元组, 字符串 只有字符串能被写入文件中. 能在网络上传输的只能是bytes - 字符串 把要传输的和要存储的内容转换成字符串. 字符串 转换回 要传输和存储的内容 序列化 ...

  9. Python全栈之路----常用模块----序列化(json&pickle&shelve)模块详解

    把内存数据转成字符,叫序列化:把字符转成内存数据类型,叫反序列化. Json模块 Json模块提供了四个功能:序列化:dumps.dump:反序列化:loads.load. import json d ...

  10. Python模块:shutil、序列化(json&pickle&shelve)、xml

    shutil模块: 高级的 文件.文件夹.压缩包 处理模块 shutil.copyfileobj(fscr,fdst [, length])   # 将文件内容拷贝到另一个文件中 import shu ...

随机推荐

  1. JavaScript中实现最高效的数组乱序方法

    数组乱序的意思是,把数组内的所有元素排列顺序打乱. 常用的办法是给数组原生的sort方法传入一个函数,此函数随机返回1或-1,达到随机排列数组元素的目的. 复制代码代码如下: arr.sort(fun ...

  2. 关联容器map(红黑树,key/value),以及所有的STL容器详解

    字符串或串(String)是由数字.字母.下划线组成的一串字符.一般记为 s=“a1a2···an”(n>=0).它是编程语言中表示文本的数据类型.在程序设计中,字符串(string)为符号或数 ...

  3. kettle的输入输出组件和脚本组件

    一. 输入组件 1.1表输入 从指定的数据库中,通过sql语句来查询数据加载到内存. 允许简易转换:勾选后可以避免不必要的字段的数据类型转换,从而提高性能. 替换sql语句里的变量:勾选后可以通过${ ...

  4. MSDN Windows XP Professional x64 Edition with SP2 +VL简体中文语言包+序列号

    [资源名称]---Windows XP Professional x64 Edition with SP2 - VL (English)[资源类型]---ISO镜像[资源语言]---英语+简体中文[杀 ...

  5. zmediaboard-Hi3518参数及配置

    1.12_13.uboot的烧写和flash分区1_21.12.1.裸机烧录uboot(1)什么叫裸机烧录?设备是空白的,未经烧录的,就叫裸机.(2)裸机烧录一个设备有2种方案:1是用外部烧录器来烧录 ...

  6. FastAdmin 插件刷新缓存出现 200 红色提示框解决 always_populate_raw_post_data

    使用 phpStudy 全新安装了 FastAdmin,PHP 版本是 5.6. 安装完成后在刷新插件缓存时出现红色 提示消息,但状态 为 200. 打开 F12 看,发现有以下信息. <br ...

  7. PHP安全相关的配置(1)

    PHP作为一门强大的脚本语言被越来越多的web应用程序采用,不规范的php安全配置可能会带来敏感信息泄漏.SQL注射.远程包含等问题,规范的安全配置可保障最基本的安全环境.下面我们分析几个会引发安全问 ...

  8. docker 使用教程(2)常用命令

    1. 查看docker信息(version.info) # 查看docker版本$docker version # 显示docker系统的信息$docker info 2. 对image的操作(sea ...

  9. Joyoi公路乘车(原tyvj1015)

    题目:http://www.joyoi.cn/problem/tyvj-1015 水题.连优化都不用. #include<iostream> #include<cstdio> ...

  10. Microsoft Dynamics CRM 4.0 Plugin 取值,赋值,查询

    DynamicEntity postImageEntity = (DynamicEntity)context.PostEntityImages["PostImage"]; if ( ...