第三章 - Python 内置数据结构

集set

  • 约定

    • set 翻译为集合
    • collection 翻译为集合类型,是一个大概念
  • set
    • 可变的、无序的、不重复的元素的集合

set定义 初始化

  • set() -> new empty set object
  • set(iterable) -> new set object

  s1 = set()
  s2 = set(range(5))
  s3 = set(list(range(10)))
  s4 = {} # dict
  s5 = {9,10,11} # set
  s6 = {(1,2),3,'a'}
  s7 = {[1],(1,),1} # unhashable type: 'list'

set的元素

  • set的元素要求必须可以hash(因为set就是哈希表啊)
  • 目前学过的不可hash的类型有list、set
  • 元素不可以索引,因为无序
  • set可以迭代

set增加

  • add(elem)

    • 增加一个元素到set中
    • 如果元素存在,什么都不做
  • update(*others)
    • 合并其他元素到set集合中来
    • 参数others必须是可迭代对象
    • 就地修改

set删除

  • remove(elem)

    • 从set中移除一个元素
    • 元素不存在,抛出KeyError异常。为什么是KeyError?
  • discard(elem)
    • 从set中移除一个元素
    • 元素不存在,什么都不做
  • pop() -> item
    • 移除并返回任意的元素。为什么是任意元素?
    • 空集返回KeyError异常
    • clear()
    • 移除所有元素

set修改、查询

  • 修改

    • 要么删除,要么加入新的元素
    • 为什么没有修改?
  • 查询
    • 非线性结构,无法索引
  • 遍历
    • 可以迭代所有元素
  • 成员运算符
    • in 和 not in 判断元素是否在set中
    • 效率呢?与索引访问列表的效率是差不多的,O(1)

set成员运算符的比较

  • list和set的比较
  • lst1 = list(range(100))
  • lst2 = list(range(1000000))
  • -1 in lst1、-1 in lst2 看看效率
  • set1 = set(range(100))
  • set2 = set(range(1000000))
  • -1 in set1、-1 in set2 看看效率

set成员运算符的比较

%%timeit lst1=list(range(100))
a = -1 in lst1

%%timeit lst1=list(range(1000000))
a = -1 in lst1

%%timeit set1=set(range(100))
a = -1 in set1

%%timeit set1=set(range(1000000))
a = -1 in set1

set不管元素怎么增加遍历的效率都是一样的。

set和线性结构

  • 线性结构的查询时间复杂度是O(n),即随着数据规模的增大而增加耗时
  • set、dict等结构,内部使用hash值作为key,时间复杂度可以做到O(1),查询时间和数据规模无关

  • 可hash
    • 数值型int、float、complex
    • 布尔型True、False
    • 字符串string、bytes
    • tuple
    • None
    • 以上都是不可变类型,成为可哈希类型,hashable
  • set的元素必须是可hash的

集合

  • 基本概念

    • 全集

      • 所有元素的集合。例如实数集,所有实数组成的集合就是全集
    • 子集subset和超集superset
      • 一个集合A所有元素都在另一个集合B内,A是B的子集,B是A的超集
    • 真子集和真超集
      • A是B的子集,且A不等于B,A就是B的真子集,B是A的真超集
    • 并集:多个集合合并的结果
    • 交集:多个集合的公共部分
    • 差集:集合中除去和其他集合公共部分

集合运算

  • 并集

    • 将两个集合A和B的所有的元素合并到一起,组成的集合称作集合A与集合B的并集
    • union(*others)
      • 返回和多个集合合并后的新的集合
    • | 运算符重载
      • 等同union
    • update(*others)
      • 和多个集合合并,就地修改
    • |=
      • 等同update

集合运算

  • 交集

    • 集合A和B,由所有属于A且属于B的元素组成的集合
    • intersection(*others)
      • 返回和多个集合的交集
    • &
      • 等同intersection
    • intersection_update(*others)
      • 获取和多个集合的交集,并就地修改
    • &=
      • 等同intersection_update

集合运算

  • 差集

    • 集合A和B,由所有属于A且不属于B的元素组成的集合
    • difference(*others)
      • 返回和多个集合的差集
  • -
    • 等同difference
  • difference_update(*others)
    • 获取和多个集合的差集并就地修改
  • -=
    • 等同difference_update

集合运算

  • 对称差集

    • 集合A和B,由所有不属于A和B的交集元素组成的集合,记作(A-B)∪(B-A)
    • symmetric_differece(other)
      • 返回和另一个集合的差集
    • ^
      • 等同symmetric_differece
    • symmetric_differece_update(other)
      • 获取和另一个集合的差集并就地修改
    • ^=
      • 等同symmetric_differece_update

集合运算

  • issubset(other)、<=

    • 判断当前集合是否是另一个集合的子集
  • set1 < set2
    • 判断set1是否是set2的真子集
  • issuperset(other)、>=
    • 判断当前集合是否是other的超集
  • set1 > set2
    • 判断set1是否是set的真超集
  • isdisjoint(other)
    • 当前集合和另一个集合没有交集
    • 没有交集,返回True

集合应用

  • 共同好友

    • 你的好友A、B、C,他的好友C、B、D,求共同好友
      如果是推荐好友,用差集求,不用查库,在内存中集合运算是非常快的,而且往往用到Redis的
  • 微信群提醒
    • XXX与群里其他人都不是微信朋友关系
  • 权限判断
    • 有一个API,要求权限同时具备A、B、C才能访问,用户权限是B、C、D,判断用户是否能够访问该API
    • 有一个API,要求权限具备A、B、C任意一项就可访问,用户权限是B、C、D,判断用户是否能够访问该API
  • 一个总任务列表,存储所有任务。一个完成的任务列表。找出为未完成的任务

解决的方法都不是唯一的,下面仅供参考。

集合应用

  • 共同好友

    • 你的好友A、B、C,他的好友C、B、D,求共同好友
    • 交集问题:{'A', 'B', 'C'}.intersection({'B', 'C', 'D'})
  • 微信群提醒
    • XXX与群里其他人都不是微信朋友关系
    • 并集:userid in (A | B | C | ...) == False,A、B、C等是微信好友的并集,用户ID不在这个并集中,说明他和任何人都不是朋友

集合应用

  • 权限判断

    • 有一个API,要求权限同时具备A、B、C才能访问,用户权限是B、C、D,判断用户是否能够访问该API

      • API集合A,权限集合P
      • A - P = {} ,A-P为空集,说明P包含A
      • A.issubset(P) 也行,A是P的子集也行
      • A & P = A 也行
    • 有一个API,要求权限具备A、B、C任意一项就可访问,用户权限是B、C、D,判断用户是否能够访问该API
      • API集合A,权限集合P
      • A & P != {} 就可以
      • A.isdisjoint(P) == False 表示有交集

集合应用

  • 一个总任务列表,存储所有任务。一个已完成的任务列表。找出为未完成的任务

    • 业务中,任务ID一般不可以重复
    • 所有任务ID放到一个set中,假设为ALL
    • 所有已完成的任务ID放到一个set中,假设为COMPLETED,它是ALL的子集
    • ALL - COMPLETED = UNCOMPLETED

集合练习

  • 随机产生2组各10个数字的列表,如下要求:

    • 每个数字取值范围[10,20]
    • 统计20个数字中,一共有多少个不同的数字?
    • 2组中,不重复的数字有几个?分别是什么?
    • 2组中,重复的数字有几个?分别是什么?

集合练习

  • 随机产生2组各10个数字的列表,如下要求:

    • 每个数字取值范围[10,20]
    • 统计20个数字中,一共有多少个不同的数字?
    • 2组比较,不重复的数字有几个?分别是什么?
    • 2组比较,重复的数字有几个?分别是什么?

  a = [1, 9, 7, 5, 6, 7, 8, 8, 2, 6]
  b = [1, 9, 0, 5, 6, 4, 8, 3, 2, 3]
  s1 = set(a)
  s2 = set(b)
  print(s1)
  print(s2)
  print(s1.union(s2))
  print(s1.symmetric_difference(s2))
  print(s1.intersection(s2))

最后

本文的另外链接是:https://herodanny.github.io/python-magedu-2018-notes10.html

Python全栈-magedu-2018-笔记10的更多相关文章

  1. 自学Python全栈开发第一次笔记

           我已经跟着视频自学好几天Python全栈开发了,今天决定听老师的,开始写blog,听说大神都回来写blog来记录自己的成长. 我特别认真的跟着这个视频来学习,(他们开课前的保证书,我也写 ...

  2. Python全栈之jQuery笔记

    jQuery runnoob网址: http://www.runoob.com/jquery/jquery-tutorial.html jQuery API手册: http://www.runoob. ...

  3. python全栈开发之OS模块的总结

    OS模块 1. os.name()      获取当前的系统 2.os.getcwd      #获取当前的工作目录 import os cwd=os.getcwd() # dir=os.listdi ...

  4. python全栈开发中级班全程笔记(第二模块、第四章(三、re 正则表达式))

    python全栈开发笔记第二模块   第四章 :常用模块(第三部分) 一.正则表达式的作用与方法 正则表达式是什么呢?一个问题带来正则表达式的重要性和作用      有一个需求 : 从文件中读取所有联 ...

  5. python全栈开发中级班全程笔记(第二模块、第四章)(常用模块导入)

    python全栈开发笔记第二模块 第四章 :常用模块(第二部分)     一.os 模块的 详解 1.os.getcwd()    :得到当前工作目录,即当前python解释器所在目录路径 impor ...

  6. 老男孩Python全栈第2期+课件笔记【高清完整92天整套视频教程】

    点击了解更多Python课程>>> 老男孩Python全栈第2期+课件笔记[高清完整92天整套视频教程] 课程目录 ├─day01-python 全栈开发-基础篇 │ 01 pyth ...

  7. python全栈开发中级班全程笔记(第二模块、第三章)(员工信息增删改查作业讲解)

    python全栈开发中级班全程笔记 第三章:员工信息增删改查作业代码 作业要求: 员工增删改查表用代码实现一个简单的员工信息增删改查表需求: 1.支持模糊查询,(1.find name ,age fo ...

  8. 学习笔记之Python全栈开发/人工智能公开课_腾讯课堂

    Python全栈开发/人工智能公开课_腾讯课堂 https://ke.qq.com/course/190378 https://github.com/haoran119/ke.qq.com.pytho ...

  9. 老男孩最新Python全栈开发视频教程(92天全)重点内容梳理笔记 看完就是全栈开发工程师

    为什么要写这个系列博客呢? 说来讽刺,91年生人的我,同龄人大多有一份事业,或者有一个家庭了.而我,念了次985大学,年少轻狂,在大学期间迷信创业,觉得大学里的许多课程如同吃翔一样学了几乎一辈子都用不 ...

  10. python 全栈开发之路 day1

    python 全栈开发之路 day1   本节内容 计算机发展介绍 计算机硬件组成 计算机基本原理 计算机 计算机(computer)俗称电脑,是一种用于高速计算的电子计算机器,可以进行数值计算,又可 ...

随机推荐

  1. webpack学习笔记——sourcemap(使用webpack打包的项目如何调试代码)

    [webpack]devtool里的7种SourceMap模式是什么鬼? 里面详细介绍了7种模式的区别,和建议使用. webpack sourcemap 选项多种模式的一些解释 两篇文章大同小异,第一 ...

  2. 忘记mysql的登陆密码该怎么办?

    1.如果忘记了其他用户的密码,可以使用root账户进入mysql,修改mysql.user表中的用户密码 2.如果忘记了root的mysql密码,可以使用如下方式: 确认服务器处于安全的状态,也就是没 ...

  3. OGG微服务架构入门

    数据复制任务路线图 设置数据复制必须执行许多任务. 下表列出了构建分发路径的阶段. Task Description 运行Oracle GoldenGate Configuration Assista ...

  4. Python的真和假

    python和其他编程语言一样,,,0是假,非0是真,,python 一切皆对象,真假是每个对象的属性.像数据结构,,空的数据结构是False. eg: "spam" True & ...

  5. jquery .map() 和 .each()函数结合使用

    需求:页面动态添加的html元素(如div),保存时组装div中的数据为一个json对象. 思路:遍历每个div,再遍历div中每个输入元素,把所有先把数据放到一个对象中,再添加进数组,Json.st ...

  6. 帆软报表(finereport)安装/配置

    1.首先是安装帆软报表软件 下载地址:http://www.finereport.com/product/download           激活码注册格账号就有了 2.启动软件,新建连接数据库 点 ...

  7. EHCache:Eelment刷新后,timeToLiveSeconds失效了?

    个人以为只要设定了timeToLiveSeconds,中间过程不管有没有访问,只要LiveSeconds时间到了,缓存就会失效.但是开发时发现并非如此,经过一番折腾,最终发现自己的理解是正确的,还是使 ...

  8. C语言学习及应用笔记之四:C语言volatile关键字及其使用

    在C语言中,还有一个并不经常使用但却非常有用的关键字volatile.那么使用volatile关键字究竟能干什么呢?接下来我将就此问题进行讨论. 一个使用volatile关键字定义变量,其实就是告诉编 ...

  9. Java框架中Struts框架的优缺点

    Struts 优缺点优点:1. 实现 MVC 模式,结构清晰,使开发者只关注业务逻辑的实现.2.有丰富的 tag 可以用 ,Struts 的标记库(Taglib),如能灵活动用,则能大大提高开发效率3 ...

  10. Android 杂谈---ListView 之BaseAdapter

    前言 几种适配器里面相对来说比较简单的一种适配器,在使用时需要实现几个方法,并且也需要对convertView进行优化 此篇文章以使用listView与BaseAdapter来实现表格样式的布局举例( ...