python之json、pickle模块

一、json模块

之前我们学习过用eval内置方法可以将一个字符串转成python对象，不过，eval方法是有局限性的，对于普通的数据类型，json.loads和eval都能用，但遇到特殊类型的时候，eval就不管用了,所以eval的重点还是通常用来执行一个字符串表达式，并返回表达式的值。

import json

x="[null,true,false,1]"

print(eval(x)) #报错，无法解析null类型，而json就可以

print(json.loads(x))

什么是序列化？

我们把对象(变量)从内存中变成可存储或传输的过程称之为序列化，在Python中叫pickling，在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。

为什么要序列化？

1：持久保存状态

需知一个软件/程序的执行就在处理一系列状态的变化，在编程语言中，'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。

内存是无法永久保存数据的，当程序运行了一段时间，我们断电或者重启程序，内存中关于这个程序的之前一段时间的数据（有结构）都被清空了。

在断电或重启程序之前将程序当前内存中所有的数据都保存下来（保存到文件中），以便于下次程序执行能够从文件中载入之前的数据，然后继续执行，这就是序列化。

具体的来说，你玩使命召唤闯到了第13关，你保存游戏状态，关机走人，下次再玩，还能从上次的位置开始继续闯关。或如，虚拟机状态的挂起等。

2：跨平台数据交互

序列化之后，不仅可以把序列化后的内容写入磁盘，还可以通过网络传输到别的机器上，如果收发的双方约定好实用一种序列化的格式，那么便打破了平台/语言差异化带来的限制，实现了跨平台数据交互。

反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。

如何序列化之json和pickle：

json

如果我们要在不同的编程语言之间传递对象，就必须把对象序列化为标准格式，比如XML，但更好的方法是序列化为JSON，因为JSON表示出来就是一个字符串，可以被所有语言读取，也可以方便地存储到磁盘或者通过网络传输。JSON不仅是标准格式，并且比XML更快，而且可以直接在Web页面中读取，非常方便。

JSON表示的对象就是标准的JavaScript语言的对象，JSON和Python内置的数据类型对应如下：

 注意点

import json

dic={'name':'alvin','age':23,'sex':'male'}

print(type(dic))#<class 'dict'>

j=json.dumps(dic)

print(type(j))#<class 'str'>

f=open('序列化对象','w')

f.write(j)  #-------------------等价于json.dump(dic,f)

f.close()

#-----------------------------反序列化<br>

import json

f=open('序列化对象')

data=json.loads(f.read())#  等价于data=json.load(f)

import json

#dct="{'1':111}"#json 不认单引号

#dct=str({"1":111})#报错,因为生成的数据还是单引号:{'one': 1}

dct='{"1":"111"}'

print(json.loads(dct))

#conclusion:

#        无论数据是怎样创建的，只要满足json格式，就可以json.loads出来,不一定非要dumps的数据才能loads

了解

# 在python解释器2.7与3.6之后都可以json.loads(bytes类型)，但唯独3.5不可以

>>> import json

>>> json.loads(b'{"a":111}')

Traceback (most recent call last):

  File "<stdin>", line 1, in <module>

  File "/Users/linhaifeng/anaconda3/lib/python3.5/json/__init__.py", line 312, in loads

    s.__class__.__name__))

TypeError: the JSON object must be str, not 'bytes'

猴子补丁与ujson

# 一.什么是猴子补丁?

      属性在运行时的动态替换，叫做猴子补丁（Monkey Patch）。

      猴子补丁的核心就是用自己的代码替换所用模块的源代码，详细地如下

　　1，这个词原来为Guerrilla Patch，杂牌军、游击队，说明这部分不是原装的，在英文里guerilla发音和gorllia(猩猩)相似，再后来就写了monkey(猴子)。

　　2，还有一种解释是说由于这种方式将原来的代码弄乱了(messing with it)，在英文里叫monkeying about(顽皮的)，所以叫做Monkey Patch。

# 二. 猴子补丁的功能(一切皆对象)

　　1.拥有在模块运行时替换的功能, 例如: 一个函数对象赋值给另外一个函数对象(把函数原本的执行的功能给替换了)

class Monkey:

    def hello(self):

        print('hello')

    def world(self):

        print('world')

def other_func():

    print("from other_func")

monkey = Monkey()

monkey.hello = monkey.world

monkey.hello()

monkey.world = other_func

monkey.world()

# 三.monkey patch的应用场景

如果我们的程序中已经基于json模块编写了大量代码了，发现有一个模块ujson比它性能更高，

但用法一样，我们肯定不会想所有的代码都换成ujson.dumps或者ujson.loads,那我们可能

会想到这么做

import ujson as json，但是这么做的需要每个文件都重新导入一下，维护成本依然很高

此时我们就可以用到猴子补丁了

只需要在入口处加上

, 只需要在入口加上:

import json

import ujson

def monkey_patch_json():

    json.__name__ = 'ujson'

    json.dumps = ujson.dumps

    json.loads = ujson.loads

monkey_patch_json() # 之所以在入口处加，是因为模块在导入一次后，后续的导入便直接引用第一次的成果

#其实这种场景也比较多, 比如我们引用团队通用库里的一个模块, 又想丰富模块的功能, 除了继承之外也可以考虑用Monkey

Patch.采用猴子补丁之后，如果发现ujson不符合预期，那也可以快速撤掉补丁。个人感觉Monkey

Patch带了便利的同时也有搞乱源代码的风险!

二、pickle

import pickle

dic={'name':'alvin','age':23,'sex':'male'}

print(type(dic))#<class 'dict'>

j=pickle.dumps(dic)

print(type(j))#<class 'bytes'>

f=open('序列化对象_pickle','wb')#注意是w是写入str,wb是写入bytes,j是'bytes'

f.write(j)  #-------------------等价于pickle.dump(dic,f)

f.close()

#-------------------------反序列化

import pickle

f=open('序列化对象_pickle','rb')

data=pickle.loads(f.read())#  等价于data=pickle.load(f)

print(data['age'])

# coding:utf-8

import pickle

with open('a.pkl',mode='wb') as f:

    # 一：在python3中执行的序列化操作如何兼容python2

    # python2不支持protocol>2，默认python3中protocol=4

    # 所以在python3中dump操作应该指定protocol=2

    pickle.dump('你好啊',f,protocol=2)

with open('a.pkl', mode='rb') as f:

    # 二：python2中反序列化才能正常使用

    res=pickle.load(f)

    print(res)

python2与python3的pickle兼容性问题

Pickle的问题和所有其他编程语言特有的序列化问题一样，就是它只能用于Python，并且可能不同版本的Python彼此都不兼容，因此，只能用Pickle保存那些不重要的数据，不能成功地反序列化也没关系。

python之json、pickle模块的更多相关文章

python之os与json&pickle模块
一.os模块简单概述一下os模块就是与操作系统交互的一个接口 import os #os.getcwd() print(os.getcwd()) # 获取到当前工作目录 # 运行结果:E:\pyt ...
Pythoy 数据类型序列化——json&pickle 模块
Pythoy 数据类型序列化--json&pickle 模块 TOC 什么是序列化/反序列化 pickle 模块 json 模块对比json和pickle json.tool 命令行接口什 ...
20181205（模块循环导入解决方案，json&pickle模块，time，date，random介绍）
一.补充内容循环导入解决方案: 1.将导入的语句挪到后面. 2.将导入语句放入函数,函数在定义阶段不运行 #m1.pyprint('正在导入m1') #②能够正常打印from m2 imp ...
[re模块、json&pickle模块]
[re模块.json&pickle模块] re模块什么是正则? 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则 ...
Python（正则 Time datatime os sys random json pickle模块）
正则表达式: import re #导入模块名 p = re.compile(-]代表匹配0至9的任意一个数字, 所以这里的意思是对传进来的字符串进行匹配,如果这个字符串的开头第一个字符是数字,就代表 ...
Python Json & Pickle模块
用于序列化的两个模块 Json,用于字符串和 python数据类型间进行转换 Pickle,用于python特有的类型和 python的数据类型间进行转换 Json模块提供了四个功能:dumps. ...
python基础--json,pickle和shelve模块
一.JSON &pickle 用于序列化的两个模块 json,用于字符串和 python数据类型间进行转换字符串必须是双引号,不能是单引号 pickle,用于python特有的类型和 ...
python 序列化 json pickle
python的pickle模块实现了基本的数据序列和反序列化.通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去,永久存储:通过pickle模块的反序列化操作,我们能够从文件 ...
[python标准库]Pickle模块
Pickle-------python对象序列化本文主要阐述以下几点: 1.pickle模块简介 2.pickle模块提供的方法 3.注意事项 4.实例解析 1.pickle模块简介 The pic ...
json & pickle 模块
用于序列化的两个模块 json,用于字符串和 python数据类型间进行转换 pickle,用于python特有的类型和 python的数据类型间进行转换 dump和load 都各自使用一次 py ...

随机推荐

PyQt（Python+Qt）学习随笔：QListWidget的addItem方法
老猿Python博文目录专栏:使用PyQt开发图形界面Python应用老猿Python博客地址在QListWidget对象中,增加一个项的方法是调用addItem方法,addItem方法有2种重 ...
PyQt(Python+Qt)学习随笔：toolButton的autoRaise和arrowType属性
autoRaise属性 autoRaise属性表示toolButton按钮是否自动凸出,类型为布尔类型.默认值为False,可以通过autoRaise().setAutoRaise(bool enab ...
PyQt(Python+Qt)学习随笔：设定toolButton弹出菜单的方法
在Qt Designer中toolButton可以通过popupMode设定菜单弹出的模式,但并不能在Qt Designer中指定toolButton的弹出菜单,toolButton只能通过代码来指定 ...
Panda Global 要点聚焦，区块链在数字医疗的落地应
据Panda Global,随着区块链技术影响力的不断扩大,其应用性已涉及更加广泛的领域,不断更新着人们的认知.在区块链技术未介入之前,关于医疗行业和数字经济结合早已不是什么新鲜话题,相关研究不少但 ...
uni-app中使用sass
uni-app在创建时,工程目录下会有个uni.scss文件,我们可以直接在里面定制化scss变量. 全局scss中的坑: 1.如果要引用全局外部scss文件,可以考虑在uni.scss这个系统全局s ...
springboot：异步调用@Async
在后端开发中经常遇到一些耗时或者第三方系统调用的情况,我们知道Java程序一般的执行流程是顺序执行(不考虑多线程并发的情况),但是顺序执行的效率肯定是无法达到我们的预期的,这时就期望可以并行执行,常规 ...
Oh my God, Swagger API文档竟然可以这样写？
最好的总会在不经意间出现. 作为后端程序员,免不了与前端同事对接API, 一个书写良好的API设计文档可有效提高与前端对接的效率. 为避免联调时来回撕逼,今天我们聊一聊正确使用Swaager的姿势. ...
Mongdb优化
1.索引1)基础索引--为集合colt1的x列创建升序基础索引# cd /usr/local/mongodb4.2.2/bin# ./mongo -uroot -p> use db_test&g ...
Linux安装Mysql8.0.11
0. 安装环境 1. 下载安装包方式一:百度网盘下载链接:https://pan.baidu.com/s/11t_JXUp-SXRaioNDvdltNg 提取码:uzyj 方式二:在线下载 1 ...
牛客练习赛 73 D
题目链接离别离线算法+线段树容易发现当我们枚举右端点r时,符合条件的左端点是一段连续的区间我们可以用队列来维护这个连续区间的左右端点当枚举到端点\(i\)时,将下标\(i\)插入到队列\(q ...

python之json、pickle模块

python之json、pickle模块的更多相关文章

随机推荐

热门专题