1 引言

　　在日常开发中，所有的对象都是存储在内存当中，尤其是像python这样的坚持一切接对象的高级程序设计语言，一旦关机，在写在内存中的数据都将不复存在。另一方面，存储在内存够中的对象由于编程语言、网络环境等等因素，很难在网络中进行传输交互。由此，就诞生了一种机制，可以实现内存中的对象与方便持久化在磁盘中或在网络中进行交互的数据格式（str、bites)之间的相互转换。这种机制就叫序列化与发序列化：

　　序列化：将内存中的不可持久化和传输对象转换为可方便持久化和传输对象的过程。

　　反序列化：将可持久化和传输对象转换为不可持久化和传输对象的过程。

　　Python中提供pickle和json两个模块来实现序列化与反序列化，pickle模块和json模块dumps()、dump()、loads()、load()这是个函数，其中dumps()、dump()用于实现序列化，loads()、load()用于实现反序列化。下面，我们分别对pickle和json模块进行介绍。

2 pickle模块

　　pickle模块的dumps()、dump()、loads()、load()是个函数按功能划分可以分为两组：

　　序列化：dumps()、dump()

　　反序列化：loads()、load()

　　dumps()与dump()的区别是dumps()只是单纯得将对象序列化，而dump()会在序列化之后将结果写入到文件当中；与之对应，loads()与load()区别至于loads()是对dumps的序列化结果进行反序列化，而dump()会从文件中读取内容进行反序列化。

2.1 dumps()与loads()

>>> import pickle

>>> p_dict = {'name':'张三' , 'age':30 , 'isMarried':False} # 定义一个字典

>>> p_str = pickle.dumps(p_dict) # 序列化

>>> type(p_dict)

<class 'dict'>

>>> type(p_str)

<class 'bytes'>

>>> p_str

b'\x80\x03}q\x00(X\x04\x00\x00\x00nameq\x01X\x06\x00\x00\x00\xe5\xbc\xa0\xe4\xb8\x89q\x02X\x03\x00\x00\x00ageq\x03K\x1eX\t\x00\x00\x00isMarriedq\x04\x89u.'

>>> p = pickle.loads(p_str)

>>> type(p)

<class 'dict'>

>>> p

{'name': '张三', 'age': 30, 'isMarried': False}

　　可以看到，反序列化后得到的p和序列化之前的p_dict内容是一模一样的。不过，p与p_dict已经是两个不同的对象了：

>>> id(p)==id(p_dict)

False

2.2 dump()与load()

　　序列化：

>>> import pickle

>>> p_dict = {'name':'张三' , 'age':30 , 'isMarried':False} # 定义一个字典

>>> file = open("my_dump.txt", "wb") # 因为序列化只有的是bites类型，所以必须以wb模式打开

>>> pickle.dump(p_dict, file)

>>> file.close()

　　此时，通过上面代码我们已经将p_dict序列化成功，并写入到了一个名为my_dump.txt文件中。你可以找到这个文件，然后将它拷贝到任何电脑上进行反序列化：

>>> file=open("my_dump.txt","rb")

>>> p=pickle.load(file)

>>> file.close()

>>> type(p)

<class 'dict'>

>>> p

{'name': '张三', 'age': 30, 'isMarried': False}

　　看，反序列化后得到的内容与序列化之前的内容完全一样。体会到序列化与反序列化的作用了吗？序列化之后的内容可以方便得保存到磁盘中，电脑关机也不怕。

3 json模块

　　如果你阅读并理解了上文中关于pickle的部门内容，对于这一部分的json模块内容，你可以不费吹灰之力掌握。上文中说到过，与pickle一样，json模块也提供了dumps()、dump()、loads()、load()则是个函数，且其中区别也与pickle中是个函数的区别是一样的。

3.1 dumps()与loads()

>>> import pickle

>>> p_dict = {'name':'张三' , 'age':30 , 'isMarried':False} # 定义一个字典

>>> import json

>>> p_dict = {'name':'张三' , 'age':30 , 'isMarried':False} # 定义一个字典

>>> p_str = json.dumps(p_dict)

>>> type(p_str)

<class 'str'>

>>> p_str

'{"name": "\\u5f20\\u4e09", "age": 30, "isMarried": false}'

　　可以看到，json序列化之后得到的是json格式字符串，但上述json字符串中，中文部分内容显示为了“乱码”。怎么办呢？json的dumps()函数（dump()函数也有）中提供了一个ensure_ascii参数，将该参数的值设置为False，可令序列化后中文依然正常显示。

>>> p_str2 = json.dumps(p_dict, ensure_ascii=False)

>>> p_str2

'{"name": "张三", "age": 30, "isMarried": false}'

　　接着上面的内容进行反序列化：

>>> p1 = json.loads(p_str)

>>> p1

{'name': '张三', 'age': 30, 'isMarried': False}

>>> p2 = json.loads(p_str)

>>> p2

{'name': '张三', 'age': 30, 'isMarried': False}

3.2 dump()与load()

>>> import json

>>> p_dict = {'name':'张三' , 'age':30 , 'isMarried':False} # 定义一个字典

>>> file = open('d:/mydump.txt' , 'w')

>>> json.dump(p_dict , file)

>>> file.close()

　　当然，你也可以加上ensure_ascii这一参数，并将其值设置为False，这样你打开mydump.txt文件里面的中文就能正常显示。（执行完代码之后，本地会有一个mydump.txt文件，诸位可以验证该内容）

>>> file = open('d:/mydump.txt' , 'w')

>>> json.dump(p_dict , file , ensure_ascii=False)

>>> file.close()

　　继续反序列化：

>>> file = open('d:/mydump.txt' , 'r')

>>> p = json.load(file)

>>> file.close()

>>> type(p)

<class 'dict'>

>>> p

{'name': '张三', 'age': 30, 'isMarried': False}

　　通过上面内容，pickle和json模块关于序列化与反序列化的操作就介绍完了。我们可以发现，pickle与json两个模块无论是在函数名，还是在功能上，都是机器相似的。既然这样，有了pickle模块，为什么还有json模块的诞生呢？接下来来说说pickle与json模块的区别。

4 pickle模块与json模块的区别

　　（1）pickle模块用于Python语言特有的类型和用户自定义类型与Python基本数据类型之间的转换

　　json模块用于字符串和python数据类型间进行转换。如下所示，我们自定义一个Person类，分别用pickle和json进行序列化：

>>> class Person:

def __init__(self , name , age , isMarried):

self.name = name

self.age = age

self.isMarried = isMarried

>>> p = Person('张三' , 30 , False)

　　使用pickle模块进行序列化与反序列化：

>>> p = Person('张三' , 30 , False)

>>> import pickle

>>> pp = pickle.dumps(p)

>>> type(pp)

<class 'bytes'>

>>> pp

b'\x80\x03c__main__\nPerson\nq\x00)\x81q\x01}q\x02(X\x04\x00\x00\x00nameq\x03X\x06\x00\x00\x00\xe5\xbc\xa0\xe4\xb8\x89q\x04X\x03\x00\x00\x00ageq\x05K\x1eX\t\x00\x00\x00isMarriedq\x06\x89ub.'

>>> p2 = pickle.loads(pp)

>>> type(p2)

<class '__main__.Person'>

>>> p2.name

'张三'

　　甚至pickle模块还能够对Peron本身进行序列化：

>>> per = pickle.dumps(Person)

>>> per

b'\x80\x03c__main__\nPerson\nq\x00.'

>>> per2 = pickle.loads(per)

>>> per2

<class '__main__.Person'>

　　如果用json对Person实例对象进行序列化，就会报错：

>>> import json

>>> p = Person('张三' , 30 , False)

>>> json.dumps(p)

Traceback (most recent call last):

File "<pyshell#49>", line 1, in <module>

json.dumps(p)

……

TypeError: Object of type 'Person' is not JSON serializable

　　如果非要用json对Person对象进行序列化，必须先定义一个将Person对象转化为字典（dict)的方法：

>>> def person2dict(per):

return {

'name':per.name ,

'age':per.age ,

'isMarried':per.isMarried

}

>>> p3 = json.dumps(p , default=person2dict)

>>> type(p3)

<class 'str'>

>>> p3

'{"name": "\\u5f20\\u4e09", "age": 30, "isMarried": false}'

>>> p3 = json.dumps(p , default=person2dict , ensure_ascii=False)

>>> type(p3)

<class 'str'>

>>> p3

'{"name": "张三", "age": 30, "isMarried": false}'

　　当然，也不能直接进行反序列化，不然也只会得到一个字典：

>>> p4 = json.loads(p3)

>>> type(p4)

<class 'dict'>

>>> p4

{'name': '张三', 'age': 30, 'isMarried': False}

　　此时，也要定义一个将字典转换为Person类实例的方法，在进行反序列化：

>>> def dict2person(d):

return Person(d['name'],d['age'],d['isMarried'])

>>> p5 = json.loads(p3 , object_hook=dict2person)

>>> type(p5)

<class '__main__.Person'>

>>> p5.name

'张三'

　　（2）pickle序列化结果为bites类型，只适合于Python机器之间的交互。

　　　　json序列化结果为str类型，能够被多种语言识别，可用于与其他程序设计语言交互。

　　目前，JSON格式字符串已经成为网络传输中的一种标准格式，所以在web后台开发中通常用json模块来序列化而不是pickle模块。

　　JSON和Python内置的数据类型对应如下：

JSON类型	Python类型
{}	dict
[]	list
"string"	'str'或u'unicode'
1234.56	int或float
true/false	True/False
null	None

5 总结

　　（1）序列化与反序列化是为了解决内存中对象的持久化与传输问题；

　　（2）Python中提供了pickle和json两个模块进行序列化与反序列化；

　　（3）dumps()和dump()用于序列化，loads()和load()用于反序列化；

　　（4）pickle模块能序列化任何对象，序列化结果为bites类型，只适合于Python机器之间交互；

　　json模块只能序列化Python基本类型，序列化结果为json格式字符串，适合不同开发语言之间交互。

Python开发之序列化与反序列化：pickle、json模块使用详解的更多相关文章

python json模块超级详解
JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式.JSON的数据格式其实就是python里面的字典格式,里面可以包含方括号括起来的数组,也 ...
Python 双向队列Deque、单向队列Queue 模块使用详解
Python 双向队列Deque 模块使用详解创建双向队列Deque序列双向队列Deque提供了类似list的操作方法: #!/usr/bin/python3 import collections ...
Python: json模块实例详解
ref:https://www.jianshu.com/p/e29611244810 https://www.cnblogs.com/qq78292959/p/3467937.html https:/ ...
python day7： time,datetime,sys,pickle,json模块
目录 python day 7 1. time模块 2. datetime模块 2.1 date类 2.2 time类 2.3 datetime类 2.4 timedelta类 2.5 tzinfo时 ...
Python开发环境Wing IDE之Search in Files工具详解
Search in Files工具是Wing IDE中最强大的搜索选项.它支持磁盘.项目,打开编辑器,或其它文件集的多文件批量搜索.它还可以使用通配符搜索,并可以做基于正则表达式的搜索/替换. 建议用 ...
模块讲解----pickle模块（只在python用的序列化与反序列化）
特点 1.只能在python中使用,只支持python的基本数据类型. 2.可以处理复杂的序列化语法.(例如自定义的类的方法,游戏的存档等) 3.序列化的时候,只是序列化了整个序列对象,而不是内存地址 ...
python类库32[序列化和反序列化之pickle]
一 pickle pickle模块用来实现python对象的序列化和反序列化.通常地pickle将python对象序列化为二进制流或文件. python对象与文件之间的序列化和反序列化: pi ...
序列化与反序列化之JSON
在不同编程语言之间传递对象,须把对象序列化为标准格式,比如XML 但更好的方法是序列化为JSON,因为JSON表示出来就是一个字符串,可被所有语言读取,也可方便地存储到磁盘或者通过网络传输 JSON不 ...
Java对象序列化与反序列化一 JSON
Java对象序列化与反序列化一 JSON 1. 依赖库 jackson-all-1.6.1.jar 2. 代码 public class Student { private String nam ...

随机推荐

Python(十三)python的函数重载
首先,重载函数的功能是实现参数不同情况下功能相同的函数. 函数重载的目的是解决功能相同的函数的以下问题: 1.参数的类型: 2.参数的个数: 对于情况1,函数功能呢相同,参数不同的情况. python ...
spring整合ehcache2.5.2缓存异常-- net.sf.ehcache.CacheException
报错如下: The source of the existing CacheManager is: DefaultConfigurationSource [ ehcache.xml or ehcach ...
SpringBoot定制错误页面
(1)有模板引擎的情况下,例如404错误,将会在thymeleaf的templates的error下寻找404.html,如果找不到再寻找4xx.html *所有4开头的错误状态码如果找不到特定的ht ...
java并发编程系列四、AQS-AbstractQueuedSynchronizer
什么是AbstractQueuedSynchronizer?为什么我们要分析它? AQS:抽象队列同步器,原理是:当多个线程去获取锁的时候,如果获取锁失败了,当前线程就会被打包成一个node节点放入 ...
redis学习笔记（面试题）
1. 什么是redis Redis是一个数据库,他和我们传统的oracle数据库差别是它是基于内存的数据库:因为是基于内存,所以效率就高,在某些场景下就可以对我们传统的关系型数据库做一个补充 2. r ...
ajax模拟获取json
现在工作中我用到获取数据的方式,基本都是ajax.前台获取后端的数据后,需要进行处理,然后把他们放进页面中的相应标签里.下面举一个简单的例子,来模拟数据的获取和摆放. 这里用ng框架获取数据然后处理, ...
activit流程引擎启动流程报错
代码如下: 目录结构 ProcessEngine processEngine = ProcessEngines.getDefaultProcessEngine(); @Test public void ...
js检测当前设备是移动端还是PC端
加上下面js即可硬核判断: <script type="text/javascript"> //平台.设备和操作系统 var system ={ win : fals ...
ANN算法总结
kd-tree kd-tree works poorly in high dimensions (k<30) 自己实验的时候差不多20到30左右吧,超过之后,就真的很慢了 faiss suppo ...
java多线程快速入门（八）
设置线程优先级:join() package com.cppdy; class MyThreadA extends Thread{ MyThreadB b; public MyThreadA(MyTh ...

Python开发之序列化与反序列化：pickle、json模块使用详解