什么是集合?

集合(set)是一种可变无序不重复的序列。

集合是python的序列之一,集合没有列表(list)、元组(tuple)和字典(ditc)常见。但是有时候也有奇效。

我们先来看个集合的例子:

>>> s = {'b', 'x', 'a'}
>>> type(s)
# <class 'set'>

s = {'b', 'x', 'a'}就是一个集合(set),数据类型就是set。

我们可以仔细观察一下集合(set)的形态:

  • 以逗号分隔元素,类似列表(list)和元组(tuple);
  • 以大括号{}进行约束并且其无序的特性,类似字典(dict);
  • 无序的特性,类似字典(dict);
  • 不重复,类似字典中的键。

可以简单的理解为就是没有值(value)的字典(dict)。

当然这是我说的,不够准确,被人骂了不要来找我!

接下来我们来看下集合的基本操作。

集合的创建

我们看如何创建集合:

  1. 创建一个空的集合;

    空集合的创建不能用以下这种形式
>>> s = {}                # 这是一个空字典,不是空集合
>>> type(s)
# <class 'dict'>

那要如何创建一个空的集合呢?

>>> s = set()               # 这是一个空字典,不是空集合
>>> s
# set()
>>> type(s)
# <class 'set'>

我们可以看到要创建一个空集合,要使用s = set()这种方式。

  1. 创建非空的集合;

set()可以将任意一种序列变成集合

# 列表
>>> li = ['a', 'b', 'c']
>>> set(li)
# {'b', 'c', 'a'} # 元组
>>> t = (1,2,3)
>>> set(t)
# {1, 2, 3} # 字典
>>> d = {'x':1,'y':2}
>>> set(d)
# {'y', 'x'} # 字符串
>>> set('python')
# {'y', 'p', 'n', 'h', 't', 'o'}
  1. 利用集合的不重复状态,进行序列的去重
# 有重复元素的列表
>>> li = ['a', 'b', 'c', 'a', 'c']
>>> s = set(li)
# {'b', 'c', 'a'} # 如果想去重后依然是列表,转换一下
>>> li = list(set(li))
>>> li.sort()
>>> li
# ['a', 'b', 'c']

集合元素的添加、删除

  1. 集合元素的添加有两种常用方法,分别是add和update

add方法类似于列表(list)中的append方法,在末尾添加元素

>>> s = {'b', 'c', 'a'}
>>> s.add('abc') #这里会把'abc'当成一个字符串
>>> s
# {'b', 'c', 'abc', 'a'}

集合中的元素不能是列表(list)、字典(dict)

>>>s = {'b', 'c', 'a'}
>>> s.add([1,2])
TypeError: unhashable type: 'list' >>> s.add({'x':1,'y':2})
TypeError: unhashable type: 'dict'

update方法类似于列表相加,其中update的参数为序列。也就是把序列中的所有元素全部无序并排重后加入到集合中。

>>> s = {'b', 'c', 'a'}
>>> s.update('xyz') #这里会把'xyz'当成序列来处理,'x','y','z'分别是三个元素
>>> s
# {'y', 'c', 'z', 'b', 'x', 'a'}
  1. 集合元素的删除方法

集合删除操作方法有两种:

s.remove('e'):删除匹配的元素

s.pop():删除第一个元素,无法指定index,因为集合没有index

# remove
>>> s = {'b', 'c', 'a'}
>>> s.remove('a')
>>> s
# {'b', 'c'} # pop
>>> s = {'b', 'c', 'a'}
>>> s.pop()
# 'b'
>>> s
# {'c', 'a'}

集合的交集、合集(并集)、差集

通过集合的交集、合集(并集)、差集可以很方便的处理一些列表(list)

  1. 交集:

交集,符号“&”,表示两个集合中相同的元素部分组成新的集合

# 交集 &
>>> a = set(['a', 'b', 'c'])
>>> b = set(['b','d','e'])
>>> a & b
# {'b'}
  1. 合集(并集)

合集(并集),符号“|”,表示两个集合组合成一个不重复的新集合(也就是重复部分会进行排重)

# 合集(并集) |
>>> a = set(['a', 'b', 'c'])
>>> b = set(['b','d','e'])
>>> a | b
# {'e', 'd', 'c', 'b', 'a'}
  1. 差集、相对补集

差集、相对补集, 符号“-”,如果 a - b 表示a集合中没有在b集合中存在的元素,反之 b - a 表示b集合中没有在a集合中存在的元素。可以用于取两个集合中不相同的元素。

# 合集(并集) |
>>> a = set(['a', 'b', 'c'])
>>> b = set(['b','d','e'])
>>> a - b
# {'c', 'a'}
>>> b - a
# {'e', 'd'}
  1. 其他

除开上面集中集合外,还有类似与列表(list)中的一些操作,如in,not in,!=,==等

# 不等于 !=
>>> a != b
# True # 等于 ==
>>> a == b
# False # 包含 in
>>> a in b
# False # 不包含 not in
>>> a not in b
# True

通过集合,我们可以方便快速的处理各种序列中的一些特殊操作。

  1. 排重,如果序列中存在重合的元素,可以通过集合方便的去重;
  2. 取两个序列中相同的元素,通过将序列转换为集合后,取交集即可;
  3. 将两个序列合并,并且元素不重复,通过合集即可;
  4. 取两个序列中不相同的部分,用差集即可。

本节练习:

  1. 将列表 [5, 6, 7, 4, 5, 7] 中重复的元素去掉
  2. 求列表[2, 3, 5, 7, 9]和[2, 4, 5, 9, 8] 中的相同元素和不同元素

Python 极简教程(十)集合 set的更多相关文章

  1. Python 极简教程(八)字符串 str

    由于字符串过于重要,请认真看完并保证所有代码都至少敲过一遍. 对于字符串,前面在数据类型中已经提到过.但是由于字符串类型太过于常用,Python 中提供了非常多的关于字符串的操作.而我们在实际编码过程 ...

  2. python极简教程04:进程和线程

    测试奇谭,BUG不见. 大家好,我是谭叔. 这一场,主讲python的进程和线程. 目的:掌握初学必须的进程和线程知识. 进程和线程的区别和联系 终于开始加深难度,来到进程和线程的知识点~ 单就这两个 ...

  3. python极简教程01:基础变量

    测试奇谭,BUG不见. 其实很久之前,就有身边的同事或者网友让我分享一些关于python编程语言的教程,他们同大多数自学编程语言的人一样,无外乎遇到以下这些问题: 网络上的资料过多且良莠不全,不知道如 ...

  4. Python 极简教程(十二)逻辑控制语句 if else

    计算机软件之所以能够对不同的情况进行不同的处理,就是我们在编码的时候,通过逻辑控制语句,告诉软件在不同的情况下应该做什么处理. 比如我们在登录的时候,那么当你输入正确的账号密码和错误的账号密码,完全是 ...

  5. Python 极简教程(一)前言

    现在 Python 用处很多,学的人也很多,其流行程度自不必说.但是很多人学 Python 的时候都遇到过问题,特别对于非计算机专业毕业的人来说. 现在的教程非常多,但是绝大部分对于初学者都不够友好. ...

  6. Python 极简教程(十一)字典 dict

    字典是以大括号标识,以键值对(key:value)的形式,无序,不可重复,可变的集合类型. 字典具有非常高效的读写效率. >>> d = {} # 创建一个空字典 >>& ...

  7. Python 极简教程(三)数据类型

    每种语言都有各种数据类型.这就像在现实生活中,我们计数的时候需要用到数字,在表述金额.重量.距离等需要精确计数时用到小数,在日常交谈中要用文字,等等.在计算机语言中,为了表述不同的情况,也需要用到各种 ...

  8. Python 极简教程(二)编码工具

    Python 的编码工具很多.目前最流行的是 pycharm,关于 pycharm 的安装使用请参考 PyCharm安装使用教程. 而学习过程中,我觉得最好用的,还是 Python 自带的练习工具 I ...

  9. python极简教程05:生成器和匿名函数

    测试奇谭,BUG不见. 讲解之前,我先说说我的教程和网上其他教程的区别: 1 我分享的是我在工作中高频使用的场景,是精华内容: 2 我分享的是学习方法,亦或说,是指明你该学哪些.该重点掌握哪些内容: ...

随机推荐

  1. vue中剖析中的一些方法

    1 判断属性 71 -81 var hasOwnProperty = Object.prototype.hasOwnProperty; /** * Check whether the object h ...

  2. OpenSUSE42.3 leap 开启ssh登陆

    一.产看ssh是否安装 OpenSUSE:~ # rpm -qa | grep ssh libssh2-1-1.4.3-18.3.x86_64openssh-askpass-1.2.4.1-12.1. ...

  3. Json学习总结(1)——Java和JavaScript中使用Json方法大全

    摘要:JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.它基于ECMAScript的一个子集. JSON采用完全独立于语言的文本格式,但是也使用了类似于C语 ...

  4. Mysql学习总结(7)——MySql索引原理与使用大全

    一.索引介绍 索引是对数据库表中一列或多列的值进行排序的一种结构.在关系数据库中,索引是一种与表有关的数据库结构,它可以使对应于表的SQL语句执行得更快.索引的作用相当于图书的目录,可以根据目录中的页 ...

  5. BUFFER OVERFLOW 10 Vulnerability & Exploit Example

    SRC= http://www.tenouk.com/Bufferoverflowc/Bufferoverflow6.html THE VULNERABLE AND THE EXPLOIT     W ...

  6. Codeforces Round #262 (Div. 2) 题解

    A. Vasya and Socks time limit per test 1 second memory limit per test 256 megabytes input standard i ...

  7. 【LeetCode-面试算法经典-Java实现】【121-Best Time to Buy and Sell Stock(最佳买卖股票的时间)】

    [121-Best Time to Buy and Sell Stock(最佳买卖股票的时间)] [LeetCode-面试算法经典-Java实现][全部题目文件夹索引] 原题 Say you have ...

  8. 项目: python爬虫 福利 煎蛋网妹子图

    嘿嘿嘿! 嘿嘿嘿! 福利一波, 之前看小甲鱼的python教学视频的时候, 看到上面教的爬虫, 爬美女图片的, 心很痒痒, 但是不知道为啥, 按照视频一个字一个字敲的代码,总是报错, 有一天花了 一下 ...

  9. 【Educational Codeforces Round 36 C】 Permute Digits

    [链接] 我是链接,点我呀:) [题意] 在这里输入题意 [题解] //从大到小枚举第i(1..len1)位 //剩余的数字从小到大排序. //看看组成的数字是不是小于等于b //如果是的话. //说 ...

  10. SQL优化工具SQLAdvisor使用(转)

    一.简介 在数据库运维过程中,优化SQL是业务团队与DBA团队的日常任务.例行SQL优化,不仅可以提升程序性能,还能够降低线上故障的概率. 目前常用的SQL优化方式包括但不限于:业务层优化.SQL逻辑 ...