一 pickle

pickle模块用来实现python对象的序列化和反序列化。通常地pickle将python对象序列化为二进制流或文件。
 
python对象与文件之间的序列化和反序列化:
pickle.dump()
pickle.load()
 
如果要实现python对象和字符串间的序列化和反序列化,则使用:
pickle.dumps()
pickle.loads()
 
可以被序列化的类型有:
* None,True 和 False;
* 整数,浮点数,复数;
* 字符串,字节流,字节数组;
* 包含可pickle对象的tuples,lists,sets和dictionaries;
* 定义在module顶层的函数:
* 定义在module顶层的内置函数;
* 定义在module顶层的类;
* 拥有__dict__()或__setstate__()的自定义类型;
 
注意:对于函数或类的序列化是以名字来识别的,所以需要import相应的module。

二 pickle的运行过程

在大部分情况下,要是的对象picklable,我们不需要额外的代码。默认地pickle将智能地检查类和实例的属性,当一个类实例反序列化的时候,它的__init__()方法通常不被调用。而是首先创建一个未初始化的实例,然后再回复存储的属性。
 
但是可以通过实现下列的方法来修改默认的行为:
object.__getstate__() :默认地序列化对象的__dict__,但是如果你实现了__getstate__(),则__getstate__()函数返回的值将被序列化。
object.__setstate__(state) :如果类型实现了此方法,则在反序列化的时候,此方法用来恢复对象的属性。
object.__getnewargs__() : 如果实例构造的时候(__new__())需要参数,则需要实现此函数。
 
 
注意:如果__getstate__()返回False,则在反序列化的时候__setstate__()则不被调用。
 
有的时候为了效率,或上面的3个函数不能满足需求时,需要实现__reduce__()函数。
 
三 实例
  1.  
  2. import pickle
  3.  
  4. # An arbitrary collection of objects supported by pickle.
  5. data = {
  6.     'a': [1, 2.0, 3, 4+6j],
  7.     'b': ("character string", b"byte string"),
  8.     'c': set([None, True, False])
  9. }
  10.  
  11. with open('data.pickle', 'wb') as f:
  12.     # Pickle the 'data' dictionary using the highest protocol available.
  13.     pickle.dump(data, f, pickle.HIGHEST_PROTOCOL)
  14.  
  15.     
  16. with open('data.pickle', 'rb') as f:
  17.     # The protocol version used is detected automatically, so we do not
  18.     # have to specify it.
  19.     data = pickle.load(f)
  20.     print(str(data))
  21.     
 
 

四 修改picklable类型的默认行为

  1.  
  2. class TextReader:
  3.     """Print and number lines in a text file."""
  4.  
  5.     def __init__(self, filename):
  6.         self.filename = filename
  7.         self.file = open(filename)
  8.         self.lineno = 0
  9.  
  10.     def readline(self):
  11.         self.lineno += 1
  12.         line = self.file.readline()
  13.         if not line:
  14.             return None
  15.         if line.endswith('\n'):
  16.             line = line[:-1]
  17.         return "%i: %s" % (self.lineno, line)
  18.  
  19.     def __getstate__(self):
  20.         # Copy the object's state from self.__dict__ which contains
  21.         # all our instance attributes. Always use the dict.copy()
  22.         # method to avoid modifying the original state.
  23.         state = self.__dict__.copy()
  24.         # Remove the unpicklable entries.
  25.         del state['file']
  26.         return state
  27.  
  28.     def __setstate__(self, state):
  29.         # Restore instance attributes (i.e., filename and lineno).
  30.         self.__dict__.update(state)
  31.         # Restore the previously opened file's state. To do so, we need to
  32.         # reopen it and read from it until the line count is restored.
  33.         file = open(self.filename)
  34.         for _ in range(self.lineno):
  35.             file.readline()
  36.         # Finally, save the file.
  37.         self.file = file
  38.         
  39. reader = TextReader("hello.txt")
  40. print(reader.readline())
  41. print(reader.readline())
  42. = pickle.dumps(reader)
  43. #print(s)
  44. new_reader = pickle.loads(s)
  45. print(new_reader.readline())
  46.  
  47. # the output is 
  48. # 1: hello
  49. # 2: how are you
  50. # 3: goodbye
  51.     

python类库32[序列化和反序列化之pickle]的更多相关文章

  1. Python开发之序列化与反序列化:pickle、json模块使用详解

    1 引言 在日常开发中,所有的对象都是存储在内存当中,尤其是像python这样的坚持一切接对象的高级程序设计语言,一旦关机,在写在内存中的数据都将不复存在.另一方面,存储在内存够中的对象由于编程语言. ...

  2. Python库:序列化和反序列化模块pickle介绍

    1 前言 在“通过简单示例来理解什么是机器学习”这篇文章里提到了pickle库的使用,本文来做进一步的阐述. 通过简单示例来理解什么是机器学习 pickle是python语言的一个标准模块,安装pyt ...

  3. 【转】Python之数据序列化(json、pickle、shelve)

    [转]Python之数据序列化(json.pickle.shelve) 本节内容 前言 json模块 pickle模块 shelve模块 总结 一.前言 1. 现实需求 每种编程语言都有各自的数据类型 ...

  4. day5-python中的序列化与反序列化-json&pickle

    一.概述 玩过稍微大型一点的游戏的朋友都知道,很多游戏的存档功能使得我们可以方便地迅速进入上一次退出的状态(包括装备.等级.经验值等在内的一切运行时数据),那么在程序开发中也存在这样的需求:比较简单的 ...

  5. python类库32[多进程同步Lock+Semaphore+Event]

    python类库32[多进程同步Lock+Semaphore+Event]   同步的方法基本与多线程相同. 1) Lock 当多个进程需要访问共享资源的时候,Lock可以用来避免访问的冲突. imp ...

  6. 模块讲解----pickle模块(只在python用的序列化与反序列化)

    特点 1.只能在python中使用,只支持python的基本数据类型. 2.可以处理复杂的序列化语法.(例如自定义的类的方法,游戏的存档等) 3.序列化的时候,只是序列化了整个序列对象,而不是内存地址 ...

  7. Python之数据序列化(json、pickle、shelve)

    本节内容 前言 json模块 pickle模块 shelve模块 总结 一.前言 1. 现实需求 每种编程语言都有各自的数据类型,其中面向对象的编程语言还允许开发者自定义数据类型(如:自定义类),Py ...

  8. python marshal 对象序列化和反序列化

    有时候,要把内存中的一个对象持久化保存到磁盘上,或者序列化成二进制流通过网络发送到远程主机上.Python中有很多模块提供了序列化与反序列化的功能,如:marshal, pickle, cPickle ...

  9. python接口测试之序列化与反序列化(四)

    在python中,序列化可以理解为:把python的对象编码转换为json格式的字符串,反序列化可以理解为:把json格式 字符串解码为python数据对象.在python的标准库中,专门提供了jso ...

随机推荐

  1. squid代理使用yum源

    参考文档:https://blog.csdn.net/tuolaji8/article/details/73613859https://www.centos.bz/2017/10/centos-7%E ...

  2. Unity旋转问题的总结

    1.物体的直接旋转 transform.Rotate();这个函数是在当前状态下网某个方向旋转.并且这里可以设置为世界空间或者自身空间. transform.rotation;这里可以通过直接定义一个 ...

  3. JavaScript中:地址引用的特性,导致静态初始值被修改

    问题分类 JavaScript,值引用,地址引用 问题描述 开发过程中,服务端将静态配置数据从mysql数据库中读取到内存中,方便调用. 在实现流派功能时,需从数据库中读取流派种类数据到内存中,由于其 ...

  4. Spring MVC 启动报错

    Tomcat 启动Spring MVC工程报如下错误 java.lang.ClassNotFoundException: org.springframework.web.context.Context ...

  5. [转帖]「白帽黑客成长记」Windows提权基本原理(下)

    「白帽黑客成长记」Windows提权基本原理(下) https://www.cnblogs.com/ichunqiu/p/10968674.html 提权.. 之前还在想 为什么 我的 sqlserv ...

  6. 高性能异步分布式事务TCC框架(资料汇总)

    https://github.com/yu199195/hmily tcc源码解析系列(一)之项目结构 https://yu199195.github.io/2017/10/11/TCC/tcc-on ...

  7. [Codeforces 1005F]Berland and the Shortest Paths(最短路树+dfs)

    [Codeforces 1005F]Berland and the Shortest Paths(最短路树+dfs) 题面 题意:给你一个无向图,1为起点,求生成树让起点到其他个点的距离最小,距离最小 ...

  8. P4962 朋也与光玉题解

    题目链接 光坂小镇是一个由 n 个点(编号为 1 ~ n),m 条有向边构成的图,每个节点上都有一个光玉,光玉共有 k 种,编号为 0 ~ k−1. 为了使一切改变,朋也需要找齐全部的 k种光玉.他可 ...

  9. python2.7.5升级到2.7.14或者直接升级到3.6.4

    python2.7.5升级到2.7.14 1.安装升级GCC yum install -y gcc* openssl openssl-devel ncurses-devel.x86_64  bzip2 ...

  10. java中too many characters in character literal

    IDE里发现 too many characters in character literal 翻译过来就是 字符中的字符过多 , 一般情况是:把 多个文字 放在了 '' (单引号)里,应该放到 &q ...