什么是序列化/反序列化?

  序列化就是将内存中的数据结构转换成一种中间格式存储到硬盘或者基于网络传输,反序列化就是硬盘中或者网络中传来的一种数据格式转换成内存中数据结构

为什么要有序列化/反序列化?

  1、可以保存程序的运行状态

  2、数据的跨平台交互

shelve模块:也用于序列化,它于 pickle 不同之处在于不需要关心文件模式等,而是直接把它当成一个字典来看待,它可以直接对数据进行修改,而不用覆盖原来的数据,但 pickle 想要修改只能用 wb 模式来覆盖

import shelve

dic1 = {'pwd': 'qiu123', 'age': 22}
dic2 = {'pwd': 'xi456', 'age': 22} d = shelve.open('db.txt') d['qiu'] = dic1
d['xi'] = dic2 print(d['qiu']['pwd'])
d.close()

shelve序列化

import shelve

d = shelve.open('db.txt')

print(d['qiu'])
print(d['qiu']['pwd'])
d.close()

shelve反序列化

import shelve

# 对子字典的修改需要参数
d = shelve.open('db.txt', writeback=True)
d['qiu']['age'] = 20
print(d['qiu'])
d.close()

对子字典的修改需要参数

pickle模块:一个用来序列化的模块

  主要功能有dump(序列化)、load(反序列化)、dumps、loads。dump/load 相比于 dumps/loads,封装了 write 和 read,使用操作更方便

import pickle

dic = {'a':1, 'b':2, 'c':3}

# 1. 序列化
pkl = pickle.dumps(dic)
print(pkl, type(pkl)) # 2. 写入文件
with open('db.pkl', 'wb') as f:
f.write(pkl) # 1和2可以合成一步
with open('db.pkl', 'wb') as f:
res = pickle.dump(dic, f)

pickle序列化

import pickle

# 1. 从文件中读取pickle格式
with open('db.pkl', 'rb') as f:
pkl = f.read() # 2. 将pkl_str转成内存中的数据类型
dic = pickle.loads(pkl)
print(dic) # 1和2可以合成一步
with open('db.pkl', 'rb') as f:
dic = pickle.load(f)
print(dic)

pickle反序列化

优点:可以支持 Python 中所有的数据类型

缺点:只能被 Python 识别,不能跨平台

json模块:一个用于序列化的模块

在使用 json 模块之前,需要先了解 JSON(JavaScript Object Notation,JS的对象简谱),它表示出来的是一个字符串,可以被任何语言解析读取,方便使用

JSON 表示的对象就是标准的 JavaScript 语言的对象,JSON 和 Python 内置的数据类型对应如下:

import json

dic = {'name': 'qiuxi', 'age': 22}
# 序列化: 内存中的数据类型转化成中间格式json json_str = json.dumps(dic)
print(json_str, type(json_str)) # 运行
{"name": "qiuxi", "age": 22} <class 'str'>

JSON格式不能识别单引号,全都是双引号

import json

dic = {'name': 'qiuxi', 'age': 22}

# 1. 序列化得到json_str
json_str = json.dumps(dic) # 2. 把json_str写入文件
# 因为json表示出来的都是字符串, 所以用wt且指定编码
with open('db.json', 'wt', encoding='utf-8') as f:
f.write(json_str) # 1和2合并一步
with open('db.json', 'wt', encoding='utf-8') as f:
json.dump(dic, f)

json序列化

import json

# 1. 从文件中读取json格式
with open('db.json', 'rt', encoding='utf-8') as f:
json_str = f.read() # 2. 将json_str转成内存中的数据类型
dic = json.loads(json_str)
print(dic) # 1和2合并一步
with open('db.json', 'rt', encoding='utf-8') as f:
dic = json.load(f)
print(dic)

json反序列化

当自己手写的 json 文件时,可以到网上进行JSON格式化校验

优点:跨平台性强

缺点:只能支持 Python 部分的数据类型

xml模块:也是用于序列化的一种模块

在使用 xml 模块之前,需要先了解 XML(可扩展标记语言),也是一种通用的数据格式。

语法格式:

  1、任何的起始标签都必须有一个结束标签

  2、可以采用另一种简化语法,可以在一个标签中同时表示起始和结束标签。这种语法是在大于符号之前紧跟一个斜线(/),例如<百度百科词条/>,XML解析器会将其翻译成 <百度百科词条></百度百科词条>

  3、标签必须按合适的顺序进行嵌套,所以结束标签必须按镜像顺序匹配起始签。这好比是将起始和结束标签看作是数学中的左右括号:在没有关闭所有的内部括号之前,是不能关闭外面的括号的。

  4、所有的属性都必须有值

  5、所有的属性都必须在值的周围加上双引号

标签的组成

<tagname attributename="value">text
<subtags/>
</tagname> <标签名 属性="属性值">文本
</子标签>
</标签名>

标签组成格式

import xml.etree.ElmentTree    # 表示节点树
<studentinfo>
<stu age="" name="张三">
<phone name="华为">这是华为手机</phone>
<computer name="Mac">14888</computer>
</stu>
<stu age="" name="李四">
<phone name="华为">这是华为手机</phone>
<computer name="联想">4888</computer>
</stu>
</studentinfo>

初始的数据

标签的三个特征:标签名tag、标签属性attrib、标签的文本内容text

import xml.etree.ElementTree as ET

# 解析d.xml
tree = ET.parse('d.xml')
print(tree)
# 获取根标签
rootTree = tree.getroot() # 第一种获取标签的方式
# iter用于在全文范围获取标签
for item in rootTree.iter('phone'):
print(item.tag) # 标签名
print(item.attrib) # 标签的属性
print(item.text) # 文本内容 # 第二种获取标签的方式
# find用于从根标签的子标签中查找一个名为stu的标签, 如果有多个, 找到的是第一个
print(rootTree.find('stu').attrib) # 第三种获取标签的方式
# findall用于从同级标签中查找所有名为phone的标签
print(rootTree.findall('phone')) # 1、查
# 遍历整个文档
for stu in rootTree:
for item in stu:
print(item.tag)
print(item.attrib)
print(item.text) # 2、改
for phone in rootTree.iter('phone'):
print(phone.tag)
phone.attrib = {'name': '华为'}
phone.text = '这是华为手机' tree.write('d.xml',encoding='utf-8') # 3、增
for stu in rootTree:
computer = stu.find('computer')
if int(computer.text) > 5000:
print('价钱大于5000的电脑的使用者', stu.attrib)
tag = ET.Element('qiuxi')
tag.attrib = {'hobby': 'music'}
tag.text = '喜欢音乐'
stu.append(tag) tree.write('d.xml', encoding='utf-8') # 4、删
for stu in rootTree:
tag = stu.find('qiuxi')
if tag is not None:
print("========")
stu.remove(tag) tree.write('d.xml', encoding='utf-8')

xml模块的使用

configparser模块:用于解析配置文件的模块

配置文件即包含配置程序信息的文件,一些需要修改但不经常修改的信息,例如数据文件的路径等

配置文件中只有两种内容,一种是 section 分区,另一种是 option  选项,就是一个 key=value 形式

使用最多的是 get ,用来从配置文件获取一个配置选项

# 路径的相关配置
[path]
db_path = C://myfile/test.txt # 用户相关的配置
[user]
name = qiuxi
age = 22

初始的配置文件

import configparser

# 创建一个解析器
config = configparser.ConfigParser() # 读取并解析test.cfg
config.read('test.cfg', encoding='utf-8') # 获取需要的信息
print(config.sections()) # 获取分区
print(config.options('user')) # 获取选项 # 获取某个选项的值
print(config.get('path', 'db_path'))
print(config.get('user', 'age')) # get返回的都是字符串类型, 如果需要转换类型, 直接使用get+对应的类型
print(type(config.getint("user","age"))) # 是否有某个分区
print(config.has_section('user'))
# 是否有某个选项
print(config.has_option('user', 'name')) # 一些不太常用的操作
# 添加
config.add_section("server")
config.set("server","url","192.168.1.2") # 删除
config.remove_option("user","age") # 修改
config.set("server","url","192.168.1.2") # 增删改查操作完成后写回文件中
with open("test.cfg", "wt", encoding="utf-8") as f:
config.write(f)

configparser模块操作

Learning-Python【20】:Python常用模块(3)—— shelve、pickle、json、xml、configparser的更多相关文章

  1. python常用模块之shelve模块

    python常用模块之shelve模块 shelve模块是一个简单的k,v将内存中的数据通过文件持久化的模块,可以持久化任何pickle可支持的python数据类型 我们在上面讲json.pickle ...

  2. 十八. Python基础(18)常用模块

    十八. Python基础(18)常用模块 1 ● 常用模块及其用途 collections模块: 一些扩展的数据类型→Counter, deque, defaultdict, namedtuple, ...

  3. python笔记之常用模块用法分析

    python笔记之常用模块用法分析 内置模块(不用import就可以直接使用) 常用内置函数 help(obj) 在线帮助, obj可是任何类型 callable(obj) 查看一个obj是不是可以像 ...

  4. python基础31[常用模块介绍]

    python基础31[常用模块介绍]   python除了关键字(keywords)和内置的类型和函数(builtins),更多的功能是通过libraries(即modules)来提供的. 常用的li ...

  5. Python学习 :常用模块(四)----- 配置文档

    常用模块(四) 八.configparser 模块 官方介绍:A configuration file consists of sections, lead by a "[section]& ...

  6. pickle,shelve,json,configparser 的模块使用

    主要内容1. 什么是序列化2. pickle3. shelve4. json5. configparser模块 一. 什么是序列化在我们存储数据或者网络传输数据的时候. 需要对我们的对象进行处理. 把 ...

  7. Python 常用模块(2) 序列化(pickle,shelve,json,configpaser)

    主要内容: 一. 序列化概述 二. pickle模块 三. shelve模块 四. json模块(重点!) 五. configpaser模块 一. 序列化概述1. 序列化: 将字典,列表等内容转换成一 ...

  8. Day5 - Python基础5 常用模块学习

    Python 之路 Day5 - 常用模块学习   本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shel ...

  9. Python全栈开发之路 【第六篇】:Python基础之常用模块

    本节内容 模块分类: 好处: 标准库: help("modules") 查看所有python自带模块列表 第三方开源模块: 自定义模块: 模块调用: import module f ...

  10. Python基础5 常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configpars ...

随机推荐

  1. Java中的 内部类(吐血总结)

    1. 内部类的作用 内部类是一个独立的实体,可以用来实现闭包:能与外部类通信:内部类与接口使得多继承更完整 2. 内部类的分类 1)普通内部类 类的实例相关,可以看成是一个实例变量.内部类的类名由 “ ...

  2. Unity 为队伍设置不同颜色的shader

    在魔兽争霸等一些游戏中,我们通过模型的颜色就能很轻松的区分队伍,如下:   实现的方法有很多,比如: 1,为不同队伍各出一张不同颜色的贴图(Hmmm,war3有的地图可以容纳12只队伍,美术大大们会很 ...

  3. python全栈开发 * 进程理论 进程创建 * 180724

    一.进程理论 1.进程是资源分配的最小单位. 2.进程调度就是多个进程在操作系统的控制下被CPU执行,去享用计算机的资源. 先来先服务 短作业优先 时间片轮转 多级反馈队列 3.进程调度的过程是不能够 ...

  4. 通过Navicat远程连接MySQL

    参考: http://blog.csdn.net/apple9005/article/details/53033148 问题一:在主机下通过Navicat连接服务器MySql的时候,提示“2003 C ...

  5. 扫二维码登录实现原理,php版

    基础的逻辑图就是这样,但是实际情况还是有几种可能 比如QQ登录,微信登录,微博登录,基本设计都差不多,根据实际情况会有一些差异 问题是,如果设计合理的接口在保证数据的安全性和快速性 设计到的技术不复杂 ...

  6. word2vec生成词向量和字向量

    生成字符向量的过程中需要注意: 1)在收集数据生成corpus时候,通过Word2Vec生成字向量的时候,产生了“ ”空格字符向量,但是加载模型是不会成功的.那么你不是生成的binary文件,就可以修 ...

  7. nginx配置框架问题

    1.框架源文件没有引入 2.nginx fastcgi.conf配置允许访问上级目录地址 3.使用autoindex on;参数

  8. python_打包成exe

    1. 安装pyinstaller pip install pyinstaller 或通过国内镜像下载(较快): pip install pyinstaller -i http://pypi.douba ...

  9. Windows 10 家庭版/专业版 彻底关闭windows update自动更新

    转载: https://blog.csdn.net/u014162133/article/details/84973426# https://blog.csdn.net/qq_40820862/art ...

  10. winfrom弹出窗口用timer控件控制倒计时20秒后关闭

    功能描述: 因为在程序退出时需要确认是否是误操作,所以加了密码输入的子窗体,子窗体在20秒内会自动关闭 代码如下: private int count; private void Form2_Load ...