Python【第五课】迭代器,生成器,数据序列化
本节内容
列表生成式,生成器,迭代器
Json & pickle 数据序列化
1.列表生成式,生成器,迭代器
1.1 列表生成式
列表生成式?不就是生成个列表的表达式,恩~~~ 差不多。
一般生成一个列表怎么生成,如下方法可以实现
# 可以生成一个顺序的列表
a = list(range(10))
print(a)
要生成一个不是顺序的列表要怎么做呢?想想~~~,哈哈,还是看我的吧。
# 输出一个偶数列表
a = map(lambda x:x*2,range(1,11))
print(a)
for i in a:
print(i)
其实还有一种写法:
# 这就叫做列表生成式
a = [i*2 for i in range(10)]
print(a)
列表生成式的其他玩法:
# 如果x可以整除3,返回x的平方
a = [x*x for x in range(10) if x %3 ==0]
print(a)
# 输出所有0,1,2中两个数组成的元组的列表
a = [(x,y) for x in range(3) for y in range(3)]
print(a)
# 把两个列表中的相同数据输出
a = [(x,y) for x in range(100000) for y in range(100) if x == y ]
print(a)
1.2 生成器
通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]
改成()
,就创建了一个generator:
# 把列表生成式的'[]'改为'()',就变为了一个生成器
a = (i*2 for i in range(10))
for i in a:
print(i)
创建列表生成式和生成器的区别仅在于最外层的[]
和()。
我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?
如果要一个一个打印出来,可以通过next()
函数获得generator的下一个返回值:
a = (i*2 for i in range(5)) # 方便测试,改为range(5)
print(next(a),next(a),next(a),next(a),next(a))
print(next(a))
# 输出
# 0 2 4 6 8
# 以下为部分报错信息:
# print(next(a))
# StopIteration
我们讲过,generator保存的是算法,每次调用next(g)
,就计算出生成器的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration
的错误。
当然,上面这种不断调用next(g)
实在是太变态了,正确的方法是使用for
循环,因为generator也是可迭代对象:
所以,我们创建了一个generator后,基本上永远不会调用next()
,而是通过for
循环来迭代它,并且不需要关心StopIteration
的错误。
generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for
循环无法实现的时候,还可以用函数来实现。
a = (i*2 for i in range(5)) # 方便测试,改为range(5)
for i in a :
print(i,end=' ') # 配置end=' ',使输出显示在同一行
插入一个知识点:
# 赋值语句
a, b = b, a + b
# 相当于:
t = (b, a + b) # t是一个tuple
a = t[0]
b = t[1]
# 但不必显式写出临时变量t就可以赋值。
著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:
例如:1, 1, 2, 3, 5, 8, 13, 21, 34, ...
斐波那契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:
# 显示斐波那契数的前N个数:
def fib(max):
n, a, b = 0, 0, 1
while n < max:
print(b,end=' ')
a, b = b, a + b
n = n + 1
fib(5)
# 输出
# 1 1 2 3 5
可以看出,fib
函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。
也就是说,上面的函数和generator仅一步之遥。要把fib
函数变成generator,只需要把print(b)
改为yield b
就可以了:
def fib(max):
n, a, b = 0, 0, 1
while n < max:
# print(b,end=' ')
yield b # 这就是定义generator的另一种方法。如果一个函数定义中包含yield
关键字,那么这个函数就不再是一个普通函数,而是一个generator:
a, b = b, a + b
n = n + 1
# fib(5)
f=fib(5)
print(f)
for i in f:
print(i,end=' ') # 相当于 print(next(f),next(f),next(f),next(f),next(f))
# 输出
# <generator object fib at 0x00000010829ECF68>
# 1 1 2 3 5
这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return
语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()
的时候执行,遇到yield
语句返回,再次执行时从上次返回的yield
语句处继续执行。
f=fib(5)
print(next(f))
print('hello,world!')
print(next(f))
print(next(f))
print(next(f)) # 输出
# 1
# hello world!
# 1
# 2
# 3
next方法和for循环的方法都可以取出generator的值,两种方式各有各的好处。
在使用next时,如果generator的值取完后会有报错。怎么处理呢,先大概的提一下。
def fib(max):
n, a, b = 0, 0, 1
while n < max:
# print(b,end=' ')
yield b
a, b = b, a + b
n = n + 1 f=fib(5) while True:
try:
print(next(f))
except StopIteration:
print('数字取完了!')
break
# 输出结果自己去试试吧。
还可通过yield实现在单线程的情况下实现并发运算的效果
# yield 并发
import time
def consumer(name):
print("%s-->来了" % name)
while True:
baozi = yield
print('%s 吃了包子 %s' % (name,baozi)) def shengchanzhe():
c = consumer('刘浩')
c2 = consumer('小强')
c.__next__()
c2.__next__()
print("我开始了卖包子之路")
for i in range(10):
time.sleep(1)
print(''.center(50,'-'))
print("做第%s个包子" %i )
c.send(i)
c2.send(i) shengchanzhe()
1.3 迭代器
我们已经知道,可以直接作用于for
循环的数据类型有以下几种:
一类是集合数据类型,如list
、tuple
、dict
、set
、str
等;
一类是generator
,包括生成器和带yield
的generator function。
这些可以直接作用于for
循环的对象统称为可迭代对象:Iterable
。
可以使用isinstance()
判断一个对象是否是Iterable
对象:
# 判断对象是否可迭代
from collections import Iterable
print(isinstance([],Iterable))
print(isinstance({},Iterable))
print(isinstance((),Iterable))
print(isinstance('',Iterable))
print(isinstance(100,Iterable))
而生成器不但可以作用于for
循环,还可以被next()
函数不断调用并返回下一个值,直到最后抛出StopIteration
错误表示无法继续返回下一个值了。
*可以被next()
函数调用并不断返回下一个值的对象称为迭代器:Iterator
。
# 判断对象是否是迭代器
from collections import Iterator
print(isinstance([],Iterator))
print(isinstance({},Iterator))
print(isinstance((),Iterator))
print(isinstance('',Iterator))
print(isinstance(100,Iterator))
print(isinstance((x for x in range(10)),Iterator))
生成器都是Iterator
对象,但list
、dict
、str
虽然是Iterable
,却不是Iterator
。
把list
、dict
、str
等Iterable
变成Iterator
可以使用iter()
函数:
from collections import Iterator
print(isinstance(iter([]),Iterator))
print(isinstance(iter([]),Iterator))
为什么list
、dict
、str
等数据类型不是Iterator
?
因为Python的Iterator
对象表示的是一个数据流,Iterator对象可以被next()
函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration
错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()
函数实现按需计算下一个数据,所以Iterator
的计算是惰性的,只有在需要返回下一个数据时它才会计算。
Iterator
甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。
2 Json & pickle 数据序列化
用于序列化的两个模块
- json,用于字符串 和 python数据类型间进行转换
- pickle,用于python特有的类型 和 python的数据类型间进行转换
Json模块提供了四个功能:dumps、dump、loads、load
pickle模块提供了四个功能:dumps、dump、loads、load
1.1 Json
Json是不同语言直接常使用的一种序列化方法。
Json可以序列化简单的数据类型,例如字符串、列表、字典、元组、集合等。
import json
date = {
'name':'40kuai',
'age':22
}
# 序列化
f = open('date.json','w',encoding='utf-8')
f.write(json.dumps(date)) # 是将数据通过特殊形式转化为所有语言都认识的字符串
f.close()
# 反序列化
f = open('date.json',encoding='utf-8')
date=json.loads(f.read())
print(date['name']) # 从文件中取出数据,还原为原有的数据类型
f.close()
# 输出
# 40kuai
Json还有两个方法分别和dumps和loads有什么区别呢?
json.dump和json.load可以接收文件对象的参数,也就是说可以在序列化和反序列化的时候把文件对象传给json,让json自来读取或写入数据到文件。
还是上边的代码再来一遍:
import json
date = {
'name':'40kuai',
'age':22
}
# 序列化
f = open('date.json','w',encoding='utf-8')
# f.write(json.dumps(date)) # 是将数据通过特殊形式转化为所有语言都认识的字符串
json.dump(date,f)
f.close()
# 反序列化
f = open('date.json',encoding='utf-8')
# date=json.loads(f.read())
date = json.load(f)
print(date['name']) # 从文件中取出数据,还原为原有的数据类型
f.close()
1.2 Pickle
Pickle 是Python语言使用的一种序列化方法。
Pickle 可以序列化任何Python的数据类型,是Python专有的。
下面来演示下picle的序列化和反序列化:
# 序列化
import pickle
date = {
'name':'40kuai',
'age':22
} f = open('date.pickle','wb')
pickle.dump(date,f)
# f.write(pickle.dumps(date))
f.close()
# 反序列化
import pickle f = open('date.pickle','rb')
# date = pickle.loads(f.read())
date = pickle.load(f)
print(date['name'])
如有不完善的地方...你看着办吧。
Python【第五课】迭代器,生成器,数据序列化的更多相关文章
- Python装饰器、迭代器&生成器、re正则表达式、字符串格式化
Python装饰器.迭代器&生成器.re正则表达式.字符串格式化 本章内容: 装饰器 迭代器 & 生成器 re 正则表达式 字符串格式化 装饰器 装饰器是一个很著名的设计模式,经常被用 ...
- python基础6之迭代器&生成器、json&pickle数据序列化
内容概要: 一.生成器 二.迭代器 三.json&pickle数据序列化 一.生成器generator 在学习生成器之前我们先了解下列表生成式,现在生产一个这样的列表[0,2,4,6,8,10 ...
- python之 可迭代 迭代器 生成器
0. 1.总结 (1) (a)iterable 可迭代(对象) 能力属性 指一个对象能够一次返回它的一个成员,for i in a_list 而不需要通过下标完成迭代. 例子包括所有序列类型(list ...
- python学习笔记(5)--迭代器,生成器,装饰器,常用模块,序列化
生成器 在Python中,一边循环一边计算的机制,称为生成器:generator. 如: >>> g = (x * x for xin range(10)) >>> ...
- 潭州课堂25班:Ph201805201 第十五课 迭代器,生成器 (课堂笔记)
推导表达式 li1 = list() for i in range(10): # 迭代循环内容 li1.append(i) print( li1 ) ---->>> [0, 1, 2 ...
- python之路(八)-迭代器&生成器
迭代器 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大优点是 ...
- Python学习---装饰器/迭代器/生成器的学习【all】
Python学习---装饰器的学习1210 Python学习---生成器的学习1210 Python学习---迭代器学习1210
- 从零开始的Python学习Episode 12——迭代器&生成器
生成器 列表生成式 用于快速地生成一个列表 a = [x*x for x in range(1,9)] print(a) #输出[1, 4, 9, 16, 25, 36, 49, 64] 也可以用于生 ...
- Python四大神兽(迭代器&生成器&闭包&装饰器)
一.迭代器 迭代是Python最强大的功能之一,是访问集合元素的一种方式.. 迭代器是一个可以记住遍历的位置的对象. 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不 ...
- python入门之json与pickle数据序列化
前提实例: 将一个字典存放在文件里 #存入数据info = { 'name':'chy', 'age':18 } f = open("test.txt","w" ...
随机推荐
- Node入门教程(3)第二章: Node 安装
Node 安装 官网下载地址: https://nodejs.org/en/download/ 安装方式 windows 下安装 建议直接选择:Windows Installer (.msi)下载进行 ...
- Session 和 Cookie 区别
会话跟踪是Web程序中常用的技术,用来跟踪用户的整个会话.常用的会话跟踪技术是Cookie与Session.==Cookie通过在客户端记录信息确定用户身份,Session通过在服务器端记录信息确定用 ...
- Python之旅.第四章.模块与包.总结(未完待遇)
一.模块 模块: 一系列功能的集合体,在python中一个py文件就是一个模块,模块名就是py文件的文件名: 模块的好处: 1.减少重复的代码 2.拿来主义 定义模块: 就是创建一个py文件: 使用模 ...
- markdown最基本的几种语法
1.标题 # 相当于<h1></h1> ## 相当于<h2></h2> ### 相当于<h3></h3> #### 相当于< ...
- OpenShift实战(二):OpenShift节点扩容
1.新增节点信息 增加节点如下,请将xxx改为自己的域名 node6.xxx.net Node 192.168.8.90 8G 20G/60G 4C node7.xxx.net Node 192.16 ...
- 裸辞两个月,海投一个月,从Android转战Web前端的求职之路
前言 看到这个标题的童鞋,可能会产生两种想法: 想法一:这篇文章是标题党 想法二:Android开发越来越不景气了吗?前端越来越火了吗? 我一向不喜欢标题党,标题中的内容是我的亲身经历.我是2016年 ...
- maven入门(8)maven的依赖管理
我们项目中用到的jar包可以通过依赖的方式引入,构建项目的时候从Maven仓库下载即可. 1. 依赖配置 依赖可以声明如下: <project> ... <dependenci ...
- Apache命令
参考于:http://www.jinbuguo.com/apache/menu22/programs/apxs.html 安装httpd-devel才有apxs
- Android自定义圆形图片工具类(CTRL+C加CTRL+V直接使用)
先贴一下工具类的代码!可直接复制粘贴 public class RoundImageView extends ImageView { private Paint mPaint; //画笔 privat ...
- Linux平台部署.Net Core SDK
根据微软MSDN,.Net Core无论是1.x还是2.0都只支持64位系统. 准备 以下是.NetCore支持的系统版本 以下 Linux 64 位(x86_64 或 amd64)发行版本/版本支持 ...