python摸爬滚打之day022----模块(序列化操作)
1、pickle
可以将我们python中的任意数据类型转化成bytes并写入到文件中. 同样也可以把文件中写好的bytes转换回我们python的数据.
pickle可以直接序列化对象.
class Fruit:
def __init__(self,name,color):
self.name = name
self.color = color def eat(self):
return "haochi" p1 = Fruit("apple1","red1")
p2 = Fruit("apple2","red4")
p3 = Fruit("apple3","red2")
p4 = Fruit("apple4","red6")
lst = [p1,p2,p3,p4] pickle.dump(lst,open("fruit_info","wb")) lst = pickle.load(open("fruit_info","rb"))
for i in lst:
print(i.name)
pickle序列化对象
2、shelve
shelve提供python的持久化操作. 什么叫持久化操作呢? 说白话,就是把数据写到硬盘上. 在操作shelve的时候非常的像操作一个字典. 这个东西到后期. 就像redis差不多.
# shelve 数据的持久化操作, 像操作字典一样去操作shelve -----------------------------------------------------------------
d = shelve.open("shelve_file")
d["wlh"] = "王力宏"
d["ljj"] = {"name":"林俊杰","id":"singer"}
d["zj"] = {"name":"张杰","wife":{"name":"谢娜","gender":"女","worke":"大本营"}}
d.close() d = shelve.open("shelve_file")
d.pop("zj") # 能删除,但是再查询时会报错.
d.close() d = shelve.open("shelve_file",writeback=True) # 如果是嵌套字典的话, 必须得加上writeback回写参数, 不然没法修改
d["ljj"]["id"] = "歌手"
print(d["ljj"]["id"])
d.close()
shelve
3、configparser
该模块适用于配置文件的格式与windows ini文件类似,可以包含一个或多个节(section), 每个节可以有多个参数(键=值)
import configparser
config = configparser.ConfigParser()
config["DEFAULT"] = { # DEFAULT 是默认配置, 下面的一些子配置都会带上DEFAULT 里面的配置.
"默认设置1":"...1",
"默认设置2":"....2",
"默认设置3":".....3",
}
config["配置11"] = {
"设置11":"",
"设置12":"",
"设置13":"",
}
config["配置22"] = {
"设置21":"",
"设置22":"",
"设置23":"",
}
config["配置33"] = {
"设置31":"",
"设置32":"",
"设置33":"",
} with open("peizhi.ini","w",encoding="utf8") as f:
config.write(f) # 这里的write()方法是configparser自己重新写的,不是调用的文件操作的write() # 查
config = configparser.ConfigParser()
config.read("peizhi.ini",encoding="utf8")
print(config.sections()) # ['配置11', '配置22', '配置33']
print(config["配置33"]["设置33"]) # # 添加一个章节 先读取文件, 再修改, 最后写入文件
config = configparser.ConfigParser()
config.read("peizhi.ini",encoding="utf8")
config.add_section("配置44")
config["配置44"] = {
"设置41": "",
"设置42": "",
"设置43": "",
}
config.write(open("peizhi.ini","w",encoding="utf8")) # 修改章节
config = configparser.ConfigParser()
config.read("peizhi.ini",encoding="utf8")
config.set("配置44","设置43","")
config.write(open("peizhi.ini","w",encoding="utf8")) # 删除章节或 章节元素
config = configparser.ConfigParser()
config.read("peizhi.ini",encoding="utf8")
config.remove_section("配置44") # 删除"配置44"章节
config.remove_option("配置44","设置43") # 删除"配置44"里的"设置43"元素
config.write(open("peizhi.ini","w",encoding="utf8")) # 对config的所有修改操作都是先创建config对象,然后用config读取内容, 修改完之后再将config写进文件.
configparser
4、json
json是所有语言都通用的模块
4.1 json和pickle的比较?
dic = {1:"青铜",2:"白银",3:"黄金",4:"铂金",5:"钻石"}
ret = json.dumps(dic,ensure_ascii=False) # 用 ensure_ascii=False 来处理非中文显示
print(ret,type(ret)) # json结果是 str 类型
# ret = pickle.dumps(dic)
# print(ret,type(ret)) # pickle结果是 bytes 类型
4.2 json写进文件
dic = {'王力宏':{"ji":"新加坡","gender":"男","album":"盖世英雄"},
"林俊杰":"爱笑的眼睛",
"张靓颖":{"gender":"女","album":"如果这就是爱情"},
"张杰":"云中的angle"
}
with open("singer_info.json","w",encoding="utf8") as f:
json.dump(dic,f,ensure_ascii=False,indent=4) # indent=4 即在json文件中改成好看点的格式
# 即下面格式:
# {
# "王力宏": {
# "ji": "新加坡",
# "gender": "男",
# "album": "盖世英雄"
# },
# "林俊杰": "爱笑的眼睛",
# "张靓颖": {
# "gender": "女",
# "album": "如果这就是爱情"
# },
# "张杰": "云中的angle"
# }
json数据写进文件
4.3 json也能处理对象, 也能将对象写进文件(通过间接方式将对象转成字典的形式,然后序列化字典写进文件)
class Fruit:
def __init__(self,name,color):
self.name = name
self.color = color def trans1(obj):
return {
"name": obj.name,
"color": obj.color,
}
# 用json序列化对象 ???
ap = Fruit("苹果","红色") # 方法一: __dict__ 对obj的各种封装信息(也是字典)进行序列化
# ret = json.dumps(ap.__dict__, ensure_ascii=False)
# print(ret) # 方法二: 对函数返回的结果进行序列化
ret = json.dumps(ap,default=trans1,ensure_ascii=False) # 把obj对象作为参数传进trans里,将返回的字典结果进行序列化
print(ret)
json序列化对象
class Fruit:
def __init__(self,name,color):
self.name = name
self.color = color def trans2(dic):
print(type(dic))
return Fruit(dic["name"],dic["color"]) # 返回自己构造的Fruit对象 # 用json反序列化
s = '{"name": "苹果", "color": "红色"}'
ap = json.loads(s,object_hook=trans2) # 先将s进行反序列化, 然后将反序列化结果作为参数传进trans2 ,在函数里自己构造对象
print(ap.color)
json反序列化对象
4.4 如何将大量数据写进文件?
不用 dump. 改用dumps和loads. 对每一行分别进行处理.
用dumps将数据逐个序列化, 并写进文件; 用loads逐行将字符串反序列化, 并输出(不能用load, 逐行读出来的字符串是不符合json语法规范, 没法load, 会直接报错).
# 用json写进大量数据
dic1 = {"name":"乱世佳人","show_time":1975,"score":8.5,"time":"180min"}
dic2 = {"name":"闻香识女人","show_time":1998,"score":8.8,"time":"160min"}
dic3 = {"name":"飞越疯人院","show_time":1973,"score":8.7,"time":"140min"}
dic4 = {"name":"霸王别姬","show_time":2001,"score":9.3,"time":"150min"}
lst = [dic1,dic2,dic3,dic4]
# with open("movie.json","w",encoding="utf8") as f:
# for i in lst:
# s = json.dumps(i,ensure_ascii=False)
# f.write(s+"\n") with open("movie.json","r",encoding="utf8") as f:
for line in f:
line = line.strip()
if not line:
continue
cont = json.loads(line) # 只是一个反序列化操作, 把字符串式的line转成字典形式.
# cont = json.load(line) # 错误写法, 这里line只是读取了json文件的一行,并没有全部读取,
# line里面所存的字符串是不符合json语法的,没法load, 所以读取出错.
print(cont)
json写入大量数据
python摸爬滚打之day022----模块(序列化操作)的更多相关文章
- Python json.dumps 特殊数据类型的自定义序列化操作
场景描述: Python标准库中的json模块,集成了将数据序列化处理的功能:在使用json.dumps()方法序列化数据时候,如果目标数据中存在datetime数据类型,执行操作时, 会抛出异常:T ...
- Python序列化操作与反序列操作
一.概念 序列化:转向一个字符串数据类型序列:字符串 二.需要做序列化操作的情况1.数据存储2.网络上数据传输 从数据类型到字符串的过程叫序列化从字符串到数据类型的过程叫反序列化 三.现有序列化模块1 ...
- python 常用模块(一): os模块,序列化模块(json模块 pickle模块 )
1.os模块 2.序列化模块:(1)json模块 和 pickle模块 一.os模块 os.path.abspath: (1)把路径中不符合规范的/改成操作系统默认的格式 import os path ...
- python常用模块: random模块, time模块, sys模块, os模块, 序列化模块
一. random模块 import random # 任意小数 print(random.random()) # 0到1的任意小数 print(random.uniform(-10, 10)) # ...
- python的I/O编程:文件打开、操作文件和目录、序列化操作
1 文件读写 1.1 打开文件: open(r'D:\text.txt') 1.2 文件模式 值 功能描述 'r' 读模式 'w' 写模式 'a' 追加模式 'b' 二进制模式 '+' 读写模式 1. ...
- Python第十四天 序列化 pickle模块 cPickle模块 JSON模块 API的两种格式
Python第十四天 序列化 pickle模块 cPickle模块 JSON模块 API的两种格式 目录 Pycharm使用技巧(转载) Python第一天 安装 shell 文件 Py ...
- Python快速学习08:模块的操作
前言 系列文章:[传送门] 天气干燥,我就上火,流鼻血.希望身子好起来. 正文 函数和对象都是为了更好的组织已经有的程序,以方便重复利用. 模块(module)也是为了同样的目的.模块可以包含可执行代 ...
- python OS 模块 文件目录操作
Python OS 模块 文件目录操作 os模块中包含了一系列文件操作的函数,这里介绍的是一些在Linux平台上应用的文件操作函数.由于Linux是C写的,低层的libc库和系统调用的接口都是C AP ...
- python学习之模块导入,操作邮件,redis
python基础学习06 模块导入 导入模块的顺序 1.先从当前目录下找 2.当前目录下找不到,再从环境变量中找,如果在同时在当前目录和环境变量中建立相同的py文件,优先使用当前目录下的 导入模块的实 ...
随机推荐
- crawler_exa1
编辑中... #! /usr/bin/env python # -*- coding:utf-8 -*- # Author: Tdcqma ''' 网页爬虫,版本 2017-09-20 21:16 ' ...
- 【iCore4 双核心板_uC/OS-II】例程六:信号量——任务同步
一.实验说明: 信号量是一个多任务内核提出的一个协议机构,上一个实验中我们介绍了信号量访问共享资源 的功能,其实信号量最初是用来控制访问共享资源的,它还可以用来同步一个中断服务函数和一个任 务,或者同 ...
- CMakeLists
#cmake最低版本需求,不加入此行会受到警告信息CMAKE_MINIMUM_REQUIRED(VERSION 2.6)PROJECT(HELLO) #项目名称#把当前目录(.)下所有源代码文件和头文 ...
- Web重温系列(一):利用寄宿于IIS的WCF序列化文件
这两年一直在做WinForm,对于Web已经比较生疏了,其实之前做的也不是很多. 这两天做了一个小工具,功能很简单,就是想有个地方存放办公室同事的机器名和IP的信息,包括附加的用户名和更新时间.比较之 ...
- C# 移除Response Header,403调整返回为404Make IIS return a 404 status code instead of 403
Server Information Revealed For the benefit of those who land here through a google/bing search:: He ...
- OpenGL 获取当前屏幕坐标的三维坐标(gluUnProject使用例子 Qt)
之前使用VS+glut实现了gluUnProject使用例子,用于渲染管道的逆过程,将屏幕坐标转换为opengl三维坐标,本文将尝试使用QT来实现. 代码如下: main.cpp 12345678 ...
- CentOS安装和配置Nginx
1. 首先Nginx官网找到最新的稳定版本,网站地址:http://nginx.org/en/linux_packages.html#stable 在/etc/yum.repos.d 下面创建一个文件 ...
- exists oracle 的用法
CREATE TABLE `A` ( `id` ) NOT NULL AUTO_INCREMENT, `name` ) DEFAULT NULL, PRIMARY KEY (`id`) ) ENGIN ...
- 4e00~9fa5
<script> function init (){ var begin = 0x4e00; var end = 0x9fa5; var str = ''; for(var a=begin ...
- [原]获取openstack-pike安装包
linux version: CentOS 7.5.1804 #进入仓库配置目录 cd /etc/yum.repo.d/ #批量重命名所有文件 for files in `ls *`; do mv $ ...