1. 对于python来说,这两个模块是十分实用的两个模块,以一种简单的方法用于储存数据实例。

pickle模块

  1. 提供用来储存Python各种数据序列化存储
  2. # 原来的cPickle已经在python3中与pickle合并
  3.  
  4. dumps(obj) 返回对象信息存储成的二进制字符串
  5. loads(str) 返回二进制字符串的对象信息
  6. dump(obj, file) 将对象信息写入到二进制文件中,包括基本数据结构,函数实例,类实例
  7. load(file) 从二进制文件中读入一个储存的对象,顺序与写入的顺序相同
  8.  
  9. import pickle
  10. >>> d
  11. {'age': 100, 'name': 'BOB', 'degree': 'master'}
  12. >>> work = (1, 2, 3)
  13. >>> pickle.dumps(d)
  14. b'\x80\x03}q\x00(X\x03\x00\x00\x00ageq\x01KdX\x04\x00\x00\x00nameq\x02X\x03\x00\x00\x00BOBq\x03X\x06\x00\x00\x00degreeq\x04X\x06\x00\x00\x00masterq\x05u.'
  15. >>> pickle.dumps(work)
  16. b'\x80\x03K\x01K\x02K\x03\x87q\x00.'
  17. >>> f = open('test.txt', 'wb')
  18. >>> pickle.dump(d,f)
  19. >>> pickle.dump(work,f)
  20. >>> f.close()
  21. >>> f = open('test.txt', 'rb')
  22. >>> pickle.load(f)
  23. {'age': 100, 'name': 'BOB', 'degree': 'master'}
  24. >>> work2 = pickle.load(f)
  25. >>> work2
  26. (1,2,3)
  27. >>> pickle.load(f)
  28. EOFError: Ran out of input

json模块

  1. pickle模块类似,但储存的数据类型不是基于二进制,而是基于文本
  2. pickle使用的数据格式是python特定的,而json是被设计为跨语言使用的

  3.   注:以下部分转自 廖雪峰的官方网站
  4. JSON类型 Python类型
  5. {} dict
  6. [] list
  7. "string" 'str'u'unicode'
  8. 1234.56 intfloat
  9. true/false True/False
  10. null None
  11. Python内置的json模块提供了非常完善的Python对象到JSON格式的转换。我们先看看如何把Python对象变成一个JSON
  12.  
  13. >>> import json
  14. >>> d = dict(name='Bob', age=20, score=88)
  15. >>> json.dumps(d)
  16. '{"age": 20, "score": 88, "name": "Bob"}'
  17. dumps()方法返回一个str,内容就是标准的JSON。类似的,dump()方法可以直接把JSON写入一个file-like Object
  18.  
  19. 要把JSON反序列化为Python对象,用loads()或者对应的load()方法,前者把JSON的字符串反序列化,后者从file-like Object中读取字符串并反序列化:
  20.  
  21. >>> json_str = '{"age": 20, "score": 88, "name": "Bob"}'
  22. >>> json.loads(json_str)
  23. {'age': 20, 'score': 88, 'name': 'Bob'}
  24.  
  25. Pythondict对象可以直接序列化为JSON的{},不过,很多时候,我们更喜欢用class表示对象,比如定义Student类,然后序列化:
  26.  
  27. import json
  28. class Student(object):
  29. def __init__(self, name, age, score):
  30. self.name = name
  31. self.age = age
  32. self.score = score
  33. s = Student('Bob', 20, 88)
  34. print(json.dumps(s))
  35. 运行代码,毫不留情地得到一个TypeError
  36. TypeError: <__main__.Student object at 0x10aabef50> is not JSON serializable
  37. 错误的原因是Student对象不是一个可序列化为JSON的对象。
  38.  
  39. 如果连class的实例对象都无法序列化为JSON,这肯定不合理!
  40. 别急,我们仔细看看dumps()方法的参数列表,可以发现,除了第一个必须的obj参数外,dumps()方法还提供了一大堆的可选参数:
  41.  
  42. 这些可选参数就是让我们来定制JSON序列化。前面的代码之所以无法把Student类实例序列化为JSON,是因为默认情况下,dumps()方法不知道如何将Student实例变为一个JSON的{}对象。
  43.  
  44. 可选参数default就是把任意一个对象变成一个可序列为JSON的对象,我们只需要为Student专门写一个转换函数,再把函数传进去即可:
  45. def student2dict(std):
  46. return {
  47. 'name': std.name,
  48. 'age': std.age,
  49. 'score': std.score
  50. }
  51.  
  52. print(json.dumps(s, default=student2dict))
  53. 这样,Student实例首先被student2dict()函数转换成dict,然后再被顺利序列化为JSON
  54.  
  55. 不过,下次如果遇到一个Teacher类的实例,照样无法序列化为JSON。我们可以偷个懒,把任意class的实例变为dict
  56.  
  57. print(json.dumps(s, default=lambda obj: obj.__dict__))
  58. 因为通常class的实例都有一个__dict__属性,它就是一个dict,用来存储实例变量。也有少数例外,比如定义了__slots__class
  59. 同样的道理,如果我们要把JSON反序列化为一个Student对象实例,loads()方法首先转换出一个dict对象,然后,我们传入的object_hook函数负责把dict转换为Student实例:
  60.  
  61. def dict2student(d):
  62. return Student(d['name'], d['age'], d['score'])
  63.  
  64. json_str = '{"age": 20, "score": 88, "name": "Bob"}'
  65. print(json.loads(json_str, object_hook=dict2student))
  66. 运行结果如下:
  67.  
  68. <__main__.Student object at 0x10cd3c190>
  69. 打印出的是反序列化的Student实例对象。

因为json与pickle模块都只能保存类实例,函数实例,序列等等,而不能保存类,函数。
想必因为这些类或者函数能够被当作一个包/模块导入,而这两个模块作为其实际对象的数据导入,两者相互不干扰。

Python3 学习第十三弹: 模块学习五之pickle与json的更多相关文章

  1. AngularJS学习之旅—AngularJS 模块(十五)

    一.AngularJS 模块 模块定义了一个应用程序. 模块是应用程序中不同部分的容器. 模块是应用控制器的容器. 控制器通常属于一个模块. 1.创建模块 通过 AngularJS 的 angular ...

  2. python学习第十三天 -模块和包

    模块和包 大家都知道,在计算机程序开发的过程中,随着程序代码越写越多,这样代码就会越不容易维护. 有时候为了好维护代码,把不同功能的函数放到不同的xx.py文件中. 在python中,一个.py文件就 ...

  3. 第二十一天python3 python的正则表达式re模块学习

    python的正则表达式 python使用re模块提供了正则表达式处理的能力: 常量 re.M re.MULTILINE 多行模式 re.S re.DOTALL 单行模式 re.I re.IGNORE ...

  4. Python学习日记(十九) 模块导入

    模块导入 当文件夹中有这样一个自定义的command模块 在它的内部写下下列代码: print('这个py文件被调用!') def fuc(): print('这个函数被调用!') 然后我们在comm ...

  5. python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息,抓取政府网新闻内容

    python3.4学习笔记(十三) 网络爬虫实例代码,使用pyspider抓取多牛投资吧里面的文章信息PySpider:一个国人编写的强大的网络爬虫系统并带有强大的WebUI,采用Python语言编写 ...

  6. Python3学习笔记(urllib模块的使用)转http://www.cnblogs.com/Lands-ljk/p/5447127.html

    Python3学习笔记(urllib模块的使用)   1.基本方法 urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None,  ...

  7. python学习笔记之常用模块(第五天)

    参考老师的博客: 金角:http://www.cnblogs.com/alex3714/articles/5161349.html 银角:http://www.cnblogs.com/wupeiqi/ ...

  8. Python3基础(十二) 学习总结·附PDF

    Python是一门强大的解释型.面向对象的高级程序设计语言,它优雅.简单.可移植.易扩展,可用于桌面应用.系统编程.数据库编程.网络编程.web开发.图像处理.人工智能.数学应用.文本处理等等. 在学 ...

  9. Alink漫谈(十三) :在线学习算法FTRL 之 具体实现

    Alink漫谈(十三) :在线学习算法FTRL 之 具体实现 目录 Alink漫谈(十三) :在线学习算法FTRL 之 具体实现 0x00 摘要 0x01 回顾 0x02 在线训练 2.1 预置模型 ...

随机推荐

  1. 一步一步学EF系列二【Fluent API的方式来处理实体与数据表之间的映射关系】

    EF里面的默认配置有两个方法,一个是用Data Annotations(在命名空间System.ComponentModel.DataAnnotations;),直接作用于类的属性上面,还有一个就是F ...

  2. Spark集群 Python Package管理

    具体问题: 不同的数据分析人员/开发团队需要不同版本的Python版本执行PySpark. 同一Python版本下,需要安装多个Python库,甚至需要不同版本的库. 针对问题2的一个解决办法是将Py ...

  3. Mysql 压力测试工具 mysqlslap

    转载至文章作者:杜亦舒 链接:https://www.sdk.cn/news/4512 来源:SDK.cn 摘要:mysqlslap 是 Mysql 自带的压力测试工具,可以模拟出大量客户端同时操作数 ...

  4. 带你走进ajax(4)

    处理ajax返回数据类型 ajax返回数据类型:纯文本格式.xml.json 如果只获取简单的字符串可以采用纯文本格式. 如果返回的数据类型比较复杂,则采用xml或者json. 采用XML来处理数据 ...

  5. Netty资料

    netty 资料  转自   http://calvin1978.blogcn.com/articles/netty-info.html Netty资料皆阵列在前 Posted on 2016-08- ...

  6. js 图表处理之Echar

    官网学习链接:http://echarts.baidu.com/tutorial.html#5%20分钟上手%20ECharts 案例代码: <!DOCTYPE html> <htm ...

  7. CentOS系统下yum命令的详细使用方法

    yum是什么yum = Yellow dog Updater, Modified 主要功能是更方便的添加/删除/更新RPM包. 它能自动解决包的倚赖性问题. 它能便于管理大量系统的更新问题 yum特点 ...

  8. 关于HttpRuntime.Cache的运用

    存Cache方法: HttpRuntime.Cache.Add( KeyName,//缓存名 KeyValue,//要缓存的对象 Dependencies,//依赖项 AbsoluteExpirati ...

  9. C++求矩阵的鞍点

    矩阵的鞍点就是指它在本行中的值最大,在本列中的值最小. 求解思路: 求出每行的最大值MaxRow以及每列的最小值MinColumn 保存行最大值的位置和列最小值的位置 如果行最大值得位置和列最小值的相 ...

  10. 学Git,用Git ①

    本月开始接触到Git版本管理工具,觉得很有意思,在这里总结一下学习Git的一些心得体会. 要在Mac上完整的使用git进行版本管理,需要熟悉Mac终端操作命令和Git操作命令两种命令,索性两种命令加在 ...