本节内容

  1. 列表生成式,生成器,迭代器

  2. Json & pickle 数据序列化

1.列表生成式,生成器,迭代器

1.1 列表生成式

列表生成式?不就是生成个列表的表达式,恩~~~ 差不多。

一般生成一个列表怎么生成,如下方法可以实现

  1. # 可以生成一个顺序的列表
  2. a = list(range(10))
  3. print(a)

要生成一个不是顺序的列表要怎么做呢?想想~~~,哈哈,还是看我的吧。

  1. # 输出一个偶数列表
  2. a = map(lambda x:x*2,range(1,11))
  3. print(a)
  4. for i in a:
  5. print(i)

其实还有一种写法:

  1. # 这就叫做列表生成式
  2. a = [i*2 for i in range(10)]
  3. print(a)

列表生成式的其他玩法:

  1. # 如果x可以整除3,返回x的平方
  2. a = [x*x for x in range(10) if x %3 ==0]
  3. print(a)
  4. # 输出所有0,1,2中两个数组成的元组的列表
  5. a = [(x,y) for x in range(3) for y in range(3)]
  6. print(a)
  7. # 把两个列表中的相同数据输出
  8. a = [(x,y) for x in range(100000) for y in range(100) if x == y ]
  9. print(a)

1.2 生成器

通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。

要创建一个generator,有很多种方法。第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

  1. # 把列表生成式的'[]'改为'()',就变为了一个生成器
  2. a = (i*2 for i in range(10))
  3. for i in a:
  4. print(i)

创建列表生成式和生成器的区别仅在于最外层的[]()。

我们可以直接打印出list的每一个元素,但我们怎么打印出generator的每一个元素呢?

如果要一个一个打印出来,可以通过next()函数获得generator的下一个返回值:

  1. a = (i*2 for i in range(5)) # 方便测试,改为range(5)
  2. print(next(a),next(a),next(a),next(a),next(a))
  3. print(next(a))
  4. # 输出
  5. # 0 2 4 6 8
  6. # 以下为部分报错信息:
  7. # print(next(a))
  8. # StopIteration

我们讲过,generator保存的是算法,每次调用next(g),就计算出生成器的下一个元素的值,直到计算到最后一个元素,没有更多的元素时,抛出StopIteration的错误。

当然,上面这种不断调用next(g)实在是太变态了,正确的方法是使用for循环,因为generator也是可迭代对象:

所以,我们创建了一个generator后,基本上永远不会调用next(),而是通过for循环来迭代它,并且不需要关心StopIteration的错误。

generator非常强大。如果推算的算法比较复杂,用类似列表生成式的for循环无法实现的时候,还可以用函数来实现。

  1. a = (i*2 for i in range(5)) # 方便测试,改为range(5)
  2. for i in a :
  3. print(i,end=' ') # 配置end=' ',使输出显示在同一行

插入一个知识点:

  1. # 赋值语句
  2. a, b = b, a + b
  3. # 相当于:
  4. t = (b, a + b) # t是一个tuple
  5. a = t[0]
  6. b = t[1]
  7. # 但不必显式写出临时变量t就可以赋值。

著名的斐波拉契数列(Fibonacci),除第一个和第二个数外,任意一个数都可由前两个数相加得到:

例如:1, 1, 2, 3, 5, 8, 13, 21, 34, ...

斐波那契数列用列表生成式写不出来,但是,用函数把它打印出来却很容易:

  1. # 显示斐波那契数的前N个数:
  2. def fib(max):
  3. n, a, b = 0, 0, 1
  4. while n < max:
  5. print(b,end=' ')
  6. a, b = b, a + b
  7. n = n + 1
  8. fib(5)
  9. # 输出
  10. # 1 1 2 3 5

可以看出,fib函数实际上是定义了斐波拉契数列的推算规则,可以从第一个元素开始,推算出后续任意的元素,这种逻辑其实非常类似generator。

也就是说,上面的函数和generator仅一步之遥。要把fib函数变成generator,只需要把print(b)改为yield b就可以了:

  1. def fib(max):
  2. n, a, b = 0, 0, 1
  3. while n < max:
  4. # print(b,end=' ')
  5. yield b # 这就是定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator:
  6. a, b = b, a + b
  7. n = n + 1
  8. # fib(5)
  9. f=fib(5)
  10. print(f)
    for i in f:
      print(i,end=' ') # 相当于 print(next(f),next(f),next(f),next(f),next(f))
  1. # 输出
    # <generator object fib at 0x00000010829ECF68>
    # 1 1 2 3 5

这里,最难理解的就是generator和函数的执行流程不一样。函数是顺序执行,遇到return语句或者最后一行函数语句就返回。而变成generator的函数,在每次调用next()的时候执行,遇到yield语句返回,再次执行时从上次返回的yield语句处继续执行。

  1. f=fib(5)
  2. print(next(f))
  3. print('hello,world!')
  4. print(next(f))
  5. print(next(f))
  6. print(next(f))
  7.  
  8. # 输出
    # 1
    # hello world!
    # 1
    # 2
    # 3

next方法和for循环的方法都可以取出generator的值,两种方式各有各的好处。

在使用next时,如果generator的值取完后会有报错。怎么处理呢,先大概的提一下。

  1. def fib(max):
  2. n, a, b = 0, 0, 1
  3. while n < max:
  4. # print(b,end=' ')
  5. yield b
  6. a, b = b, a + b
  7. n = n + 1
  8.  
  9. f=fib(5)
  10.  
  11. while True:
  12. try:
  13. print(next(f))
  14. except StopIteration:
  15. print('数字取完了!')
  16. break
    # 输出结果自己去试试吧。

还可通过yield实现在单线程的情况下实现并发运算的效果

  1. # yield 并发
  2. import time
  3. def consumer(name):
  4. print("%s-->来了" % name)
  5. while True:
  6. baozi = yield
  7. print('%s 吃了包子 %s' % (name,baozi))
  8.  
  9. def shengchanzhe():
  10. c = consumer('刘浩')
  11. c2 = consumer('小强')
  12. c.__next__()
  13. c2.__next__()
  14. print("我开始了卖包子之路")
  15. for i in range(10):
  16. time.sleep(1)
  17. print(''.center(50,'-'))
  18. print("做第%s个包子" %i )
  19. c.send(i)
  20. c2.send(i)
  21.  
  22. shengchanzhe()

1.3 迭代器

我们已经知道,可以直接作用于for循环的数据类型有以下几种:

一类是集合数据类型,如listtupledictsetstr等;

一类是generator,包括生成器和带yield的generator function。

这些可以直接作用于for循环的对象统称为可迭代对象:Iterable

可以使用isinstance()判断一个对象是否是Iterable对象:

  1. # 判断对象是否可迭代
  2. from collections import Iterable
  3. print(isinstance([],Iterable))
  4. print(isinstance({},Iterable))
  5. print(isinstance((),Iterable))
  6. print(isinstance('',Iterable))
  7. print(isinstance(100,Iterable))

而生成器不但可以作用于for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值了。

*可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator

  1. # 判断对象是否是迭代器
  2. from collections import Iterator
  3. print(isinstance([],Iterator))
  4. print(isinstance({},Iterator))
  5. print(isinstance((),Iterator))
  6. print(isinstance('',Iterator))
  7. print(isinstance(100,Iterator))
  8. print(isinstance((x for x in range(10)),Iterator))

生成器都是Iterator对象,但listdictstr虽然是Iterable,却不是Iterator

listdictstrIterable变成Iterator可以使用iter()函数:

  1. from collections import Iterator
  2. print(isinstance(iter([]),Iterator))
  3. print(isinstance(iter([]),Iterator))

为什么listdictstr等数据类型不是Iterator

因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。

Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。

2 Json & pickle 数据序列化

用于序列化的两个模块

  • json,用于字符串 和 python数据类型间进行转换
  • pickle,用于python特有的类型 和 python的数据类型间进行转换

Json模块提供了四个功能:dumps、dump、loads、load

pickle模块提供了四个功能:dumps、dump、loads、load

1.1 Json

Json是不同语言直接常使用的一种序列化方法。

Json可以序列化简单的数据类型,例如字符串、列表、字典、元组、集合等。

  1. import json
  2. date = {
  3. 'name':'40kuai',
  4. 'age':22
  5. }
    # 序列化
  6. f = open('date.json','w',encoding='utf-8')
  7. f.write(json.dumps(date)) # 是将数据通过特殊形式转化为所有语言都认识的字符串
  8. f.close()
  9. # 反序列化
  10. f = open('date.json',encoding='utf-8')
  11. date=json.loads(f.read())
  12. print(date['name']) # 从文件中取出数据,还原为原有的数据类型
  13. f.close()
  14. # 输出
  15. # 40kuai

Json还有两个方法分别和dumps和loads有什么区别呢?

json.dump和json.load可以接收文件对象的参数,也就是说可以在序列化和反序列化的时候把文件对象传给json,让json自来读取或写入数据到文件。

还是上边的代码再来一遍:

  1. import json
  2. date = {
  3. 'name':'40kuai',
  4. 'age':22
  5. }
    # 序列化
  6. f = open('date.json','w',encoding='utf-8')
  7. # f.write(json.dumps(date)) # 是将数据通过特殊形式转化为所有语言都认识的字符串
  8. json.dump(date,f)
  9. f.close()
  10. # 反序列化
  11. f = open('date.json',encoding='utf-8')
  12. # date=json.loads(f.read())
  13. date = json.load(f)
  14. print(date['name']) # 从文件中取出数据,还原为原有的数据类型
  15. f.close()

1.2 Pickle

Pickle 是Python语言使用的一种序列化方法。

Pickle 可以序列化任何Python的数据类型,是Python专有的。

下面来演示下picle的序列化和反序列化:

  1. # 序列化
    import pickle
  2. date = {
  3. 'name':'40kuai',
  4. 'age':22
  5. }
  6.  
  7. f = open('date.pickle','wb')
  8. pickle.dump(date,f)
  9. # f.write(pickle.dumps(date))
  10. f.close()
  1. # 反序列化
  2. import pickle
  3.  
  4. f = open('date.pickle','rb')
  5. # date = pickle.loads(f.read())
  6. date = pickle.load(f)
  7. print(date['name'])

如有不完善的地方...你看着办吧。

Python【第五课】迭代器,生成器,数据序列化的更多相关文章

  1. Python装饰器、迭代器&生成器、re正则表达式、字符串格式化

    Python装饰器.迭代器&生成器.re正则表达式.字符串格式化 本章内容: 装饰器 迭代器 & 生成器 re 正则表达式 字符串格式化 装饰器 装饰器是一个很著名的设计模式,经常被用 ...

  2. python基础6之迭代器&生成器、json&pickle数据序列化

    内容概要: 一.生成器 二.迭代器 三.json&pickle数据序列化 一.生成器generator 在学习生成器之前我们先了解下列表生成式,现在生产一个这样的列表[0,2,4,6,8,10 ...

  3. python之 可迭代 迭代器 生成器

    0. 1.总结 (1) (a)iterable 可迭代(对象) 能力属性 指一个对象能够一次返回它的一个成员,for i in a_list 而不需要通过下标完成迭代. 例子包括所有序列类型(list ...

  4. python学习笔记(5)--迭代器,生成器,装饰器,常用模块,序列化

    生成器 在Python中,一边循环一边计算的机制,称为生成器:generator. 如: >>> g = (x * x for xin range(10)) >>> ...

  5. 潭州课堂25班:Ph201805201 第十五课 迭代器,生成器 (课堂笔记)

    推导表达式 li1 = list() for i in range(10): # 迭代循环内容 li1.append(i) print( li1 ) ---->>> [0, 1, 2 ...

  6. python之路(八)-迭代器&生成器

    迭代器 迭代器是访问集合元素的一种方式.迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不会后退,不过这也没什么,因为人们很少在迭代途中往后退.另外,迭代器的一大优点是 ...

  7. Python学习---装饰器/迭代器/生成器的学习【all】

    Python学习---装饰器的学习1210 Python学习---生成器的学习1210 Python学习---迭代器学习1210

  8. 从零开始的Python学习Episode 12——迭代器&生成器

    生成器 列表生成式 用于快速地生成一个列表 a = [x*x for x in range(1,9)] print(a) #输出[1, 4, 9, 16, 25, 36, 49, 64] 也可以用于生 ...

  9. Python四大神兽(迭代器&生成器&闭包&装饰器)

    一.迭代器 迭代是Python最强大的功能之一,是访问集合元素的一种方式.. 迭代器是一个可以记住遍历的位置的对象. 迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束.迭代器只能往前不 ...

  10. python入门之json与pickle数据序列化

    前提实例: 将一个字典存放在文件里 #存入数据info = { 'name':'chy', 'age':18 } f = open("test.txt","w" ...

随机推荐

  1. ajax的四种type类型

    1.GET请求会向数据库发索取数据的请求,从而来获取信息,该请求就像数据库的select操作一样,只是用来查询一下数据,不会修改.增加数据,不会影响资源的内容,即该请求不会产生副作用.无论进行多少次操 ...

  2. Project facet is Java version 1.7 is not spported

    在移植eclipse项目时,如果遇到 "Project facet Java version 1.7 is not supported." 项目中的jdk1.7不支持.说明项目是其 ...

  3. recompose mapProps

    mapProps介绍 mapProps函数接收一个函数参数,这个函数参数会返回一个对象用作为接下来的组件的props.组件接收到的props只能是通过mapProps函数参数返回的对象,其他的prop ...

  4. C# if判断语句执行顺序

    DataTable dt = null; )//不报错,因为先执行dt != null 成立时才执行dt.Rows.Count > 0 { } && dt != null)//报 ...

  5. Django-rest-framework源码分析----权限

    添加权限 (1)API/utils文件夹下新建premission.py文件,代码如下: message是当没有权限时,提示的信息 # utils/permission.py class SVIPPr ...

  6. appiun滑动的简单封装

    import org.testng.annotations.AfterClass; import org.testng.annotations.BeforeClass; import org.test ...

  7. 【笔记】HybridApp中使用Promise化的JS-Bridge

    背景: HybridApp,前端采用JS-bridge的方式调用Native的接口,如获取设备信息.拍照.人脸识别等 前端封装了调用库,每次调用Native接口,需要进行两步操作(1.在window下 ...

  8. 新概念英语(1-95)Tickets,please!

    Lesson 95 Tickets, please. 请把车票拿出来. Listen to the tape then answer this question. Why did George and ...

  9. Spring Security 入门(3-11)Spring Security 的登录密码验证过程 UsernamePasswordAuthenticationFilter

    认证过程如下 一.先判断请求(请求必须是post请求)地址是否为配置的 login-processing-url 值(默认/j_spring_security_check),如果不是,则放行,进入下一 ...

  10. HTML的水平居中和垂直居中解决方案

    水平居中:给div设置一个宽度,然后添加margin:0 auto属性 div{ width:200px; margin:0 auto; } 让绝对定位的div居中 div { position: a ...