第二篇(七):集合

 

python 集合 集合标准操作

摘要: 说明: ·类似于数学中学的集合,Python中的集合可以实现去重的功能,通过set()函数来实现: ·sets支持x in set, len(set)和 for x in set; ·作为一个无序的集合,sets 不记录元素位置或者插入点,因此,sets不支持indexing, slicing,或...

说明:

·类似于数学中学的集合,Python中的集合可以实现去重的功能,通过set()函数来实现:

·sets支持x in set, len(set)和 for x in set;

·作为一个无序的集合,sets 不记录元素位置或者插入点,因此,sets不支持indexing, slicing,或其它类序列(sequence-like)的操作;

·学习集合,主要是学习集合的一系列标准操作:集合创建、集合添加、集合删除、交并差集等;


1.创建集合:set()

1
2
3
4
5
6
7
8
9
10
11
>>> a = range(10)
>>> a
[0123456789]
>>> a.insert(3,8)
>>> a.insert(3,6)
>>> a
[012683456789]
>>> set(a)
set([0123456789])
>>> set('boy')
set(['y''b''o'])

2.集合添加:add()与update

--add()

·功能:把要添加的元素作为一个整体添加到集合中;

·演示如下:

1
2
3
4
5
6
>>> a = set('boy')
>>> a
set(['y''b''o'])
>>> a.add('xpleaf')
>>> a
set(['y''b''xpleaf''o'])

·add()的参数不能为列表和字典,但是可以为元组:

1
2
3
4
5
6
>>> b = set('Hello')
>>> b
set(['H''e''l''o'])
>>> b.add(('xpleaf','CL'))
>>> b
set(['H', ('xpleaf''CL'), 'e''l''o'])

--update()

·功能:把要添加的元素拆分(如果不是单个字符),再一个一个地添加到集合中;

·演示如下:

1
2
3
4
5
6
7
8
>>> a
set(['y''b''xpleaf''o'])
>>> a.update('Python')
>>> a
set(['b''h''xpleaf''n''P''o''y''t'])
>>> a.update([1,2,3])
>>> a
set([12'b''h''xpleaf''n''P'3'o''y''t'])

·前面讲集合是不支持indexing的,所以这里看到新添加的元素在集合中是无序排列的;


3.集合删除:remove(),discard()与pop()

--remove()

·功能:从set中删除元素,如果不存在则引发KeyError;

·演示如下:

1
2
3
4
5
6
7
8
9
>>> a
set([12'b''h''xpleaf''n''P'3'o''y''t'])
>>> a.remove('b')
>>> a
set([12'h''xpleaf''n''P'3'o''y''t'])
>>> a.remove('KeyError')
Traceback (most recent call last):
  File "<stdin>", line 1in <module>
KeyError: 'KeyError'

--discard()

·功能:如果在set中存在该元素,则删除,无论存在与否,都没有提示;

·演示如下:

1
2
3
4
5
6
7
8
9
>>> a
set([123'h''xpleaf''n''P''o''y''t'])
>>> import tab
>>> a.discard('xpleaf')
>>> a
set([123'h''n''P''o''y''t'])
>>> a.discard('CL')
>>> a
set([123'h''n''P''o''y''t'])

--pop()

·功能:删除并返回set中一个不确定的元素;

·演示如下:

1
2
3
4
5
6
7
8
9
10
>>> a.pop()
1
>>> a
set([23'h''n''P''o''y''t'])
>>> a.pop()
2
>>> a.pop()
3
>>> a
set(['h''n''P''o''y''t'])

4.集合数学操作

·进行数学操作需要了解一些集合操作符号和数学符号:

数学符号 Python符号 含义
-或\ - 差集,相对补集
& 交集
| 并集
取∩的补 ^ 对称差集
!=

不等于

= == 等于
in 属于
  not in 不属于

--差集,相对补集:-

1
2
3
4
5
6
7
8
9
10
>>> a = set(range(10))
>>> b = set(range(15))
>>> a
set([0123456789])
>>> b
set([01234567891011121314])
>>> b - a
set([1011121314])
>>> a - b
set([])

--交集:&

1
2
>>> a & b
set([0123456789])

·也可以用intersection()函数实现:

1
2
>>> a.intersection(b)
set([0123456789])

--并集:|

1
2
>>> a | b
set([01234567891011121314])

·也可以用union()函数实现:

1
2
>>> a.union(b)
set([01234567891011121314])

--对称差集:^

1
2
3
4
5
set([0123456789])
>>> b
set([01234567891011121314])
>>> a ^ b
set([1011121314])

·也可以用symmetric_difference()函数实现:

1
2
3
4
>>> a.symmetric_difference(b)
set([1011121314])
>>> b.symmetric_difference(a)
set([1011121314])

--等于与不等于:==与!=

1
2
3
4
>>> a == b
False
>>> a != b
True

--属于与不属于:in与not in

1
2
3
4
5
6
7
8
9
10
11
12
>>> a
set([0123456789])
>>> b
set([01234567891011121314])
>>> a in b
False
>>> b in a
False
>>> a not in b
True
>>> 0 in a
True

·指的是元素是否属于集合,而不是集合之间的包含;

·集合之间的包含(子集)可用:>、>=、<、<=等表示

1
2
3
4
>>> a >= b
False
>>> a <= b
True

·<=相当于函数issubset():

1
2
3
4
>>> a <= b
True
>>> a.issubset(b)    ===>a是b的子集
True

·>=相当于函数issuperset():

1
2
3
4
5
6
>>> a >= b
False
>>> a.issuperset(b)    ===>a不是b的超集,即a不包含b
False
>>> b.issuperset(a)    ===>b是a的超集,即b包含a
True

5.其它操作

--len()

·功能:测定集合的长度;

·演示如下:

1
2
3
4
>>> len(a)
10
>>> len(b)
15

--copy()

·功能:浅复制;

·前面已有提及,不再重复;

--hash()

·功能:返回参数的哈希值;

·演示如下:

1
2
3
4
5
6
7
8
>>> a
set([0123456789])
>>> b
set([01234567891011121314])
>>> hash(a)
Traceback (most recent call last):
  File "<stdin>", line 1in <module>
TypeError: unhashable type: 'set'

·可以看到普通hash()函数的参数不能为set类型(列表也不行),但可以为字符串类型:

1
2
>>> hash('CL')
8576051523077447

·只要数据量足够大,hash是有可能产生相同的hash值,更安全的为md5类型的hash值计算:

1
2
3
4
5
>>> import hashlib
>>> a = 'hello'
>>> a = hashlib.md5()
>>> a.hexdigest()
'd41d8cd98f00b204e9800998ecf8427e'

·可以看到产生的hash值中还包含有字母等字符,因此破解的难度会更大。

python-集合(第二篇(七):集合)的更多相关文章

  1. Python人工智能第二篇:人脸检测和图像识别

    Python人工智能第二篇:人脸检测和图像识别 人脸检测 详细内容请看技术文档:https://ai.baidu.com/docs#/Face-Python-SDK/top from aip impo ...

  2. Java-集合第二篇Set集合

    1.Set集合与Collection基本相同,没有提供额外的方法.实际上Set就是Collection,只是行为略有所不同(Set不允许有重复元素). Set下的HashSet.TreeSet.Enu ...

  3. Python人工智能第二篇

    Python人工智能之路 - 第二篇 : 现成的技术   预备资料: 1.FFmpeg: 链接:https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码:w ...

  4. SVN第二篇-----命令集合

    16.switch  代码库URL变更 svn switch (sw): 更新工作副本至不同的URL. 用法:  1.switch URL [PATH]         更新你的工作副本,映射到一个新 ...

  5. [Python笔记]第二篇:运算符、基本数据类型

    本篇主要内容有:运算符 基本数据类型等 一.运算符 1.算术运算 2.比较运算 3.赋值运算 4.逻辑运算 5.成员运算 6.身份运算 7.位运算 8.运算符优先级 二.基本数据类型 1.整数:int ...

  6. python初识第二篇

    python 编码: 第一次编程有时候会遇到乱码的情况,就可以通过以下的情况来解决 在Windows中默认的就是gbk编码,如果在代码头两部定义utf-8,系统还会按照系统的方式来定义. python ...

  7. Python【第二篇】运算符及优先级、数据类型及常用操作、深浅拷贝

    一.运算符及优先级 Python 运算符(算术运算.比较运算.赋值运算.逻辑运算.成员运算) 1.算数运算符 运算符 描述 实例,a=20,b=10 + 加 a+b输出结果30 - 减 a-b输出结果 ...

  8. python基础-第二篇-基本数据类型

    一.运算符 1.算数运算: 算数运算符相信大家都不陌生吧,尤其是加减乘除,好!那我就带着大家看看最后三个,这三个到底是干什么玩意的? %,取两数相除的余数,看图: **,x的多少次幂,看图: //,取 ...

  9. 图解Python 【第二篇】:Python基础2

    本节内容一览图 一.数据类型 1.数字 2 是一个整数的例子.长整数 不过是大一些的整数.3.23和52.3E-4是浮点数的例子.E标记表示10的幂.在这里,52.3E-4表示52.3 * 10-4. ...

  10. Python基础第二篇

    一.三元运算 if True: name='a' else: name='b' #上面的代码用三元运算表示: name="a" if True else "b" ...

随机推荐

  1. codeforces D. Pashmak and Parmida's problem

    http://codeforces.com/contest/459/problem/D 题意:给你n个数,然后统计多少组(i,j)使得f(1,i,ai)>f(j,n,aj); 思路:先从左往右统 ...

  2. 报错java.net.SocketException: Software caused connection abort: recv failed 怎么办

    产生这个异常的原因有多种方面,单就如 Software caused 所示, 是由于程序编写的问题,而不是网络的问题引起的. 已知会导致这种异常的一个场景如下: 客户端和服务端建立tcp的短连接,每次 ...

  3. SQL server 变量、运算符

    一.三个表的练习 表一:学生表 student学号:code int (主键)从1开始姓名:name varchar(50)性别:sex char(10)班级:banji char(10)语文教师编号 ...

  4. Git 、CVS、SVN比较

    Git .CVS.SVN比较 项目源代码的版本管理工具中,比较常用的主要有:CVS.SVN.Git 和 Mercurial  (其中,关于SVN,请参见我先前的博客:SVN常用命令 和 SVN服务器配 ...

  5. [LeetCode#187]Repeated DNA Sequences

    Problem: All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: ...

  6. 如何查看jar包的版本号?

    jar包根目录里的META-INF目录下的MANIFEST.MF文件里一般有会记录版本信息,可以到这个文件里查看   打开Java的JAR文件我们经常可以看到文件中包含着一个META-INF目录,这个 ...

  7. Spark RDD概念学习系列之rdd的依赖关系彻底解密(十九)

    本期内容: 1.RDD依赖关系的本质内幕 2.依赖关系下的数据流视图 3.经典的RDD依赖关系解析 4.RDD依赖关系源码内幕 1.RDD依赖关系的本质内幕 由于RDD是粗粒度的操作数据集,每个Tra ...

  8. Properties/Property文件读取(键值均)乱码问题!

    方法一:使用native2ascii进行转码,这个不做说明,客户不可能帮你转码的. 方法二:当键是因为时直接getProperty即可,但加载后的propertis对象里的键也是中文乱码,就无法通过g ...

  9. xCode里面设置NSZombieEnabled定位错误

    打开product ->scheme->Edit scheme

  10. spark-streaming-kafka包源码分析

    转载请注明原创地址 http://www.cnblogs.com/dongxiao-yang/p/5443789.html 最近由于使用sparkstreaming的同学需要对接到部门内部的的kafk ...