目录

前言

集合是一种组合型的数据类型,分为可变的set和不可变的frozenset。

软件环境

  • 系统

    • UbuntuKylin 14.04
  • 软件
    • Python 2.7.3
    • IPython 4.0.0

可变集合Set

集合set是一种无序的、唯一的的元素集,与数学中集合的概念类似,可对其进行交、并、差、补等逻辑运算。不支持索引、切片等序列操作,但仍支持成员关系运算符in-not in、推导式等操作。在特定的场合中可以体现出非常优秀的执行效率。

set()函数创建集合

set(iterable) -> new set object

其中iterable可以是List、Tuple、Dictionary。但是为dict时,只会获取提Key作为set的元素。

In [12]: s = set([1,2,3])

In [13]: s
Out[13]: {1, 2, 3} In [14]: type(s)
Out[14]: set In [141]: s2 = set('jmilk') In [142]: s2
Out[142]: {'i', 'j', 'k', 'l', 'm'}

注意:set()函数只能接受迭代器(String、Tuple、List、Dict、set)作为参数。

In [180]: s1 = set(1)
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-180-8804a520da97> in <module>()
----> 1 s1 = set(1) TypeError: 'int' object is not iterable

传递一个非迭代器参数时会报错。

创建空集合

set() -> new empty set object

通过上面的例子,可见set类型数据和dict类型一样也是使用{}来标识,但是需要注意的是:dict类型可以使用dic = {}来创建一个空字典,set类型却不能,只能通过s = set()来创建。

In [15]: s = set()

In [16]: s
Out[16]: set() In [17]: d = {} In [18]: d
Out[18]: {} In [20]: type(s),type(d)
Out[20]: (set, dict)

注意:因为set()是一个可变的集合,其元素的数量是不固定的,所以有add()、remove()方法。但也因为其可变性所以set()类型的对象没有散列值(哈希值),同时也不能作为dict对象的key和其他set对象的元素。

哈希值:将长度不一的输入数据源,通过算法转换为长度一致的数据输出,以此来提高查找速度。

MD5:对文件或者数据源(字符串、数值)进行计算后得到一个固定的值,用来验证文件或数据源是否被篡改。一般用于文件的数字签名。

集合元素的唯一性

无论是set还是frozenset中的元素都是唯一的,会自动合并重叠元素。

In [17]: li = [1,2,3,1,1,2,'a','b','a']

In [18]: s1 = set(li)

In [19]: s2 = frozenset(li)

In [20]: s1,s2
Out[20]: ({1, 2, 3, 'a', 'b'}, frozenset({1, 2, 3, 'a', 'b'}))

集合推导式

由一个迭代器推倒出一个新的集合。

In [175]: set(x**2 for x in range(1,6) if x < 4)
Out[175]: {1, 4, 9}

set类型对象的内置方法

add()增加一个元素

add(…)

Add an element to a set.

This has no effect if the element is already present.

增加一个元素到set对象中,如果这个元素已经存在,则没有效果。

In [41]: s1 = set(range(10))

In [42]: s1
Out[42]: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} In [43]: s1.add(10) In [44]: s1
Out[44]: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

remove()删除一个元素

remove(…)

Remove an element from a set; it must be a member.

If the element is not a member, raise a KeyError.

指定删除set对象中的一个元素,如果集合中没有这个元素,则返回一个错误。

In [47]: s1
Out[47]: {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} In [48]: s1.remove(0) In [49]: s1
Out[49]: {1, 2, 3, 4, 5, 6, 7, 8, 9, 10}

一次只能删除i个元素。

pop()随机删除并返回一个元素

pop(…)

Remove and return an arbitrary set element.

Raises KeyError if the set is empty.

随机删除并返回一个集合中的元素,若集合为空,则返回一个错误。

In [65]: s2 = set(['j','m','i','l','k'])

In [66]: s2.pop()
Out[66]: 'i' In [67]: s2.pop()
Out[67]: 'k'

discard()删除一个元素

discard(…)

Remove an element from a set if it is a member.

If the element is not a member, do nothing.

指定删除集合中的一个元素,若没有这个元素,则do nothing。

In [90]: s1
Out[90]: {1, 2, 3, 4, 5, 6, 7, 8, 9} In [91]: s1.discard(1) In [92]: s1
Out[92]: {2, 3, 4, 5, 6, 7, 8, 9} In [93]: s1.discard('abc') In [94]: s1
Out[94]: {2, 3, 4, 5, 6, 7, 8, 9}

clear()

clear(…)

Remove all elements from this set.

清空一个集合中的所有元素

In [94]: s1
Out[94]: {2, 3, 4, 5, 6, 7, 8, 9} In [95]: s1.clear() In [96]: s1
Out[96]: set()

注意:上面列出的函数都是可变类型set对象独有的函数,除此之外还有一些set和frozenset共有的内置函数,我们后面再介绍。

不可变集合Frozenset

frozenset冻结集合,即不可变集合。frozenset的元素是固定的,一旦创建后就无法增加、删除和修改。其最大的优点是使用hash算法实现,所以执行速度快,而且frozenset可以作为dict字典的Key,也可以成为其他集合的元素。

frozenset()创建一个frozenset集合

frozenset(object)

frozenset() -> empty frozenset object

frozenset(iterable) -> frozenset object

Build an immutable unordered collection of unique elements.

创建的固定的无序集合

In [108]: f1 = frozenset()    #空的frozenset集合

In [109]: f2 = frozenset([1,2,3,'JMilk'])

In [110]: f1,f2
Out[110]: (frozenset(), frozenset({1, 2, 3, 'JMilk'}))

set能够与frozenset作比较

In [4]: s1 = set([1,2,3])

In [5]: s2 = frozenset([1,2,3])

In [6]: s1 == s2
Out[6]: True

set和frozenset的混合运算

两种类型集合之间的混合运算会返回第一个操作元素的类型。

In [12]: s1 = set([1,2,3])

In [13]: s2 = frozenset([2,3,4])

In [14]: s3 = s1 | s2

In [15]: s3,type(s3)
Out[15]: ({1, 2, 3, 4}, set)

frozenset集合作为dic的key

In [138]: f = frozenset(['name'])

In [139]: dic = {f:'Jmilk'}

In [140]: dic
Out[140]: {frozenset({'name'}): 'Jmilk'}

set集合不可以作为Dictionary的Key:

In [144]: s1 = set(['JMilk'])

In [145]: dic = {s1:'name'}
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-145-a2aec7bb3b32> in <module>()
----> 1 dic = {s1:'name'} TypeError: unhashable type: 'set' #不具有hash

set、frozenset共有的内建函数

set与frozenset类型的集合都支持集合之间的比较、交、并、差操作,类似数据的集合关系比较。但是需要注意的是:因为frozenset是不可变集合,所以下列函数中带有’_update’关键字的函数,frozenset都不可以调用。

NOTE: 带有 _update 的函数,使用原位操作的方法实现,拥有更低的资源消耗。但是这样的话,函数是没有返回值的,即不能将结果赋值给一个新的变量。

intersection()、intersection_update()求交集

intersection(…)

Return the intersection of two or more sets as a new set.

返回一个由若干个集合经过交集运算后得到的新交集,可以传入多个迭代器类型的参数。即可以传递Tuple、List、、String、Dictionary、Set等类型参数。

集合之间求交集

In [59]: s1
Out[59]: {1, 2, 3, 'a', 'b'} In [60]: s2
Out[60]: {3, 4, 5, 'b', 'c', 'd'} In [61]: s3 = set([1,3,8,9,10,'d''e','f']) In [62]: s4 = s1.intersection(s2,s3) In [63]: s4
Out[63]: {3}

注意:也可以使用逻辑与运算符 ‘&’

In [28]: s3 = s1 & s2

In [29]: s3
Out[29]: {3, 'b'}

集合和列表求交集

In [64]: li
Out[64]: [1, 2, 3, 1, 1, 2, 'a', 'b', 'a'] In [65]: s4 = s1.intersection(li) In [66]: s4
Out[66]: {1, 2, 3, 'a', 'b'}

集合和元组求交集

In [67]: tup = (2,'a','c')

In [68]: s4 = s1.intersection(tup)

In [69]: s4
Out[69]: {2, 'a'}

集合和字符串求交集

注意:只能以String中的字符进行相交运算,不能与String的数字做运算。

In [70]: str = '123abc'

In [71]: s4 = s1.intersection(str)

In [72]: s4
Out[72]: {'a', 'b'} In [79]: s1
Out[79]: {1, 2, 3, 'a', 'b'}

集合和字典求交集

注意:只能与字典中的Key进行相交运算。

In [79]: s1
Out[79]: {1, 2, 3, 'a', 'b'} In [80]: dic = {1:'name',2:'age'} In [81]: s4 = s1.intersection(dic) In [82]: s4
Out[82]: {1, 2}

intersection()与intersection_update()的区别

intersection_update(…)

Update a set with the intersection of itself and another.

更新一个经过相交后的集合给自己。

注意:当我们希望将两个对象相交后的结果更新给其中一个操作对象时,建议使用intersection_update()函数,这个函数使用原位操作的方法实现,拥有更低的资源消耗。但是intersection_update()函数是没有返回值的,即不能将结果赋值给一个新的变量。

In [94]: s1
Out[94]: {1, 2, 3, 'a', 'b'} In [95]: s2
Out[95]: {3, 4, 5, 'b', 'c', 'd'} In [96]: s1.intersection_update(s2) In [97]: s1
Out[97]: {3, 'b'}

union()、update()求并集

与intersection()一样,可以传递不同的迭代器类型参数。

union() 返回并集

union(…)

Return the union of sets as a new set.

In [108]: s4
Out[108]: {1, 2, 3, 4, 5, 8, 9, 10, 'a', 'b', 'c', 'd', 'de', 'f'}

注意:可以使用逻辑或运算符 ‘|’

In [109]: s4 = s1 | s2 | s3

In [110]: s4
Out[110]: {1, 2, 3, 4, 5, 8, 9, 10, 'a', 'b', 'c', 'd', 'de', 'f'}

update()更新并集

update(…)

Update a set with the union of itself and others.

update()方法没有返回值。


In [111]: s1.update(s2,s3) In [112]: s1
Out[112]: {1, 2, 3, 4, 5, 8, 9, 10, 'a', 'b', 'c', 'd', 'de', 'f'}

difference()、difference_update()求差

difference()

difference(…)

Return the difference of two or more sets as a new set.

返回由一个集合中不存在于其他若干个集合的元素组成的新集合。

In [122]: s1
Out[122]: {1, 2, 3, 'a', 'b'} In [123]: s2
Out[123]: {3, 4, 5, 'b', 'c', 'd'} In [124]: s3 = s1.difference(s2) In [125]: s3
Out[125]: {1, 2, 'a'}

注意:可以使用算术运算符减 ‘-‘

In [126]: s3 = s1 - s2

In [127]: s3
Out[127]: {1, 2, 'a'}

difference_update()

difference_update(…)

Remove all elements of another set from this set.

更新原来集合。

In [130]: s1.difference_update(s2)

In [131]: s1
Out[131]: {1, 2, 'a'}

symmetric_difference()、symmetric_difference_update()求集合彼此之差的并集

symmetric_difference()

symmetric_difference(…)

Return the symmetric difference of two sets as a new set.

即返回(set1 - set2)|(set2 - set1)的结果

In [138]: s1
Out[138]: {1, 2, 3, 'a', 'b'} In [139]: s2
Out[139]: {3, 4, 5, 'b', 'c', 'd'} In [140]: s3 = s1.symmetric_difference(s2) In [141]: s3
Out[141]: {1, 2, 4, 5, 'a', 'c', 'd'}

等效于:

In [147]: s1 - s2
Out[147]: {1, 2, 'a'} In [148]: s2 - s1
Out[148]: {4, 5, 'c', 'd'} In [144]: s3 = (s1 - s2)|(s2 - s1) In [145]: s3
Out[145]: {1, 2, 4, 5, 'a', 'c', 'd'}

注意:可以使用^来代替

In [142]: s3 = s1 ^ s2

In [143]: s3
Out[143]: {1, 2, 4, 5, 'a', 'c', 'd'}

symmetric_difference_update()

symmetric_difference_update(…)

Update a set with the symmetric difference of itself and another.

In [150]: s1.symmetric_difference_update(s2)

In [151]: s1
Out[151]: {1, 2, 4, 5, 'a', 'c', 'd'}

集合间的关系

相等:只有每一个一个set都互相是另一个set的子集时,这两个set才相等。

小于(set1包含于set2):只有当第一个set1是另一个set2的子集,别且两个set不相等时,第一个set1小于第二个set2。

大于(set1包含set2):只有第一个set1是第二个set2的超集、并且两者不相等时,第一个set2大于第二个set2。

isdisjoint()两个集合不相交

isdisjoint(…)

Return True if two sets have a null intersection.

即set1 & set2 == set() 时,为True

In [155]: s1
Out[155]: {1, 2, 4, 5, 'a', 'c', 'd'} In [156]: s2
Out[156]: {3, 4, 5, 'b', 'c', 'd'} In [158]: (s1 - s2) & s2 == set()
Out[158]: True In [159]: s2.isdisjoint(s1-s2)
Out[159]: True

issuperset()一个集合包含另一个集合

issuperset(…)

Report whether this set contains another set.

In [169]: s1
Out[169]: {0, 1, 2} In [170]: s2
Out[170]: {0, 1, 2, 3, 4} In [172]: s2.issuperset(s1)
Out[172]: True

s2大于s1

issubset()一个集合包含于另一个集合

issubset(…)

Report whether another set contains this set.

In [169]: s1
Out[169]: {0, 1, 2} In [170]: s2
Out[170]: {0, 1, 2, 3, 4} In [171]: s1.issubset(s2)
Out[171]: True

s1被s2包含

集合的数据类型转换

主要转换为序列类型。

In [1]: set1 = set(range(5))

In [2]: li = list(set1)

In [3]: tup = tuple(set1)

In [4]: string = str(set1)

In [5]: li,tup,string
Out[5]: ([0, 1, 2, 3, 4], (0, 1, 2, 3, 4), 'set([0, 1, 2, 3, 4])')

最后

集合是一个非常有意思的数据结构,他或许不被经常使用,但是在比较严格的执行环境下,集合是一个非常好的选择。

Jmilk

Python基本语法_集合set/frozenset_内建方法详解的更多相关文章

  1. Python_元组、字典内建方法详解

    目录 目录 前言 软件环境 元组Tuple count 查询一个元素在Tuple中的数量 index 查询元素在Tuple中的索引号 元组的遍历 字典Dictionary 创建一个字典对象 简单的创建 ...

  2. Python内置方法详解

    1. 字符串内置方法详解 为何要有字符串?相对于元组.列表等,对于唯一类型的定义,字符串具有最简单的形式. 字符串往往以变量接收,变量名. 可以查看所有的字符串的内置方法,如: 1> count ...

  3. 序列内置方法详解(string/list/tuple)

    一.常用方法集合 1.1.string,字符串常用方法 以下举例是python2.7测试: 函数名称 作用 举例 str.capitalize() 字符串第一个字符如果是字母,则把字母替换为大写字母. ...

  4. for循环与内置方法详解

    ''' for循环与内置方法详解 ''' # 循环:重复(按照某种规律的)做一件事情 # lt = [1, 2, 3, 4] # # ind = 0 # # while True: # print(l ...

  5. python 字符串、列表、字典相关内建方法

    """字符串相关内建方法""" # a = ["qwe", "name", "sex&qu ...

  6. Python_List对象内置方法详解

    目录 目录 前言 软件环境 列表List 修改列表的元素 插入列表元素 extend 将序列中的元素迭代的附加到list中 insert 在指定的索引号中插入一个元素 删除列表元素 del 删除Lis ...

  7. Python_序列对象内置方法详解_String

    目录 目录 前言 软件环境 序列类型 序列的操作方法 索引调用 切片运算符 扩展切片运算符 序列元素的反转 连接操作符 重复运算符 成员关系符 序列内置方法 len 获取序列对象的长度 zip 混合两 ...

  8. 数字内置方法详解(int/long/float/complex)

    一.常用方法 1.1.int 以下是Python2.7的int内置函数: 序号 函数名 作用 举例 1 int.bit_length() 二进制存储这个整数至少需要多少bit(位). >> ...

  9. python语法_列表list_列表内置方法

    list 列表 a = ['kevin','alxe','gm','dql','gyx'] a[1] = 'alxe' #按照索引获取数据,索引按照0开始,第一个数据的索引为0 切片: a[1:3] ...

随机推荐

  1. vue与react对比

    相同点 1.都使用 virtual DOM 2.都是组件化开发 or 都提供了组件化的视图组件 3.数据的改变会引起视图的二次渲染 4.都只有骨架,其他的功能如路由.状态管理等是框架分离的组件. 5. ...

  2. cx_Oracle 操作oracle数据库

    cx_Oracle 操作oracle数据库 class MyOracle(): def __init__(self, host_name="ip", port=1521, sid= ...

  3. scala 从头越

    一个综合小例子, 要严格区分 函数与方法 , 与 java 不一样 /** * Scala 的值类型有 7 种 * Byte * Char * Short * Int * Long * Float * ...

  4. PC端QQ协议说明,完美搞定QQ智能助手

    一. 实验目的: 在虚拟机下NAT模式下通过Wireshark抓包,分析QQ的传输模式.了解QQ在传输信息过程中用到的协议.分析在Nat模式下,信息传输的穿透性. 二. 实验环境: Win7 专业版3 ...

  5. Gcd HDU - 6545 (基础数论)

    wls 有一个整数 n,他想将 1 − n 这 n 个数字分成两组,每一组至少有一个数,并且使得两组数字的和的最大公约数最大,请输出最大的最大公约数. Input 输入一行一个整数 n. 2 ≤ n ...

  6. Tomb Raider HihoCoder - 1829 (二进制枚举+暴力)(The 2018 ACM-ICPC Asia Beijing First Round Online Contest)

    Lara Croft, the fiercely independent daughter of a missing adventurer, must push herself beyond her ...

  7. linux之crontab定时器

    一.安装crontab yum -y install vixie-cron yum -y install crontabs 说明:vixie-cron 软件包是 cron 的主程序:crontabs ...

  8. Git之协同开发

    Github之协同开发 一.协同开发 1.引子:假如三个人共同开发同一份代码,每个人都各自安排了任务,当每个人都完成了一半的时候,提交不提交呢? 要提交,提交到dev吗,都上传了一半,这样回家拿出来的 ...

  9. 【vue-router的基础】history了解一下

    概述 window.onpopstate是popstate事件在window对象上的事件处理程序. 每当处于激活状态的历史记录条目发生变化时,popstate事件就会在对应window对象上触发. 如 ...

  10. vue3之组件

    目录 组件 根组件 局部组件 全局组件 组件的注册 组件名 组件名大小写 全局注册 局部注册 模块系统 组件注册实例: 组件化 组件间数据的传递 父组件传递数据给子组件 父组件传递数据给子组件例子 子 ...