python-集合(第二篇(七):集合)
第二篇(七):集合
摘要: 说明: ·类似于数学中学的集合,Python中的集合可以实现去重的功能,通过set()函数来实现: ·sets支持x in set, len(set)和 for x in set; ·作为一个无序的集合,sets 不记录元素位置或者插入点,因此,sets不支持indexing, slicing,或...
说明:
·类似于数学中学的集合,Python中的集合可以实现去重的功能,通过set()函数来实现:
·sets支持x in set, len(set)和 for x in set;
·作为一个无序的集合,sets 不记录元素位置或者插入点,因此,sets不支持indexing, slicing,或其它类序列(sequence-like)的操作;
·学习集合,主要是学习集合的一系列标准操作:集合创建、集合添加、集合删除、交并差集等;
1.创建集合:set()
1
2
3
4
5
6
7
8
9
10
11
|
>>> a = range( 10 ) >>> a [ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ] >>> a.insert( 3 , 8 ) >>> a.insert( 3 , 6 ) >>> a [ 0 , 1 , 2 , 6 , 8 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ] >>> set (a) set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) >>> set ( 'boy' ) set ([ 'y' , 'b' , 'o' ]) |
2.集合添加:add()与update
--add()
·功能:把要添加的元素作为一个整体添加到集合中;
·演示如下:
1
2
3
4
5
6
|
>>> a = set ( 'boy' ) >>> a set ([ 'y' , 'b' , 'o' ]) >>> a.add( 'xpleaf' ) >>> a set ([ 'y' , 'b' , 'xpleaf' , 'o' ]) |
·add()的参数不能为列表和字典,但是可以为元组:
1
2
3
4
5
6
|
>>> b = set ( 'Hello' ) >>> b set ([ 'H' , 'e' , 'l' , 'o' ]) >>> b.add(( 'xpleaf' , 'CL' )) >>> b set ([ 'H' , ( 'xpleaf' , 'CL' ), 'e' , 'l' , 'o' ]) |
--update()
·功能:把要添加的元素拆分(如果不是单个字符),再一个一个地添加到集合中;
·演示如下:
1
2
3
4
5
6
7
8
|
>>> a set ([ 'y' , 'b' , 'xpleaf' , 'o' ]) >>> a.update( 'Python' ) >>> a set ([ 'b' , 'h' , 'xpleaf' , 'n' , 'P' , 'o' , 'y' , 't' ]) >>> a.update([ 1 , 2 , 3 ]) >>> a set ([ 1 , 2 , 'b' , 'h' , 'xpleaf' , 'n' , 'P' , 3 , 'o' , 'y' , 't' ]) |
·前面讲集合是不支持indexing的,所以这里看到新添加的元素在集合中是无序排列的;
3.集合删除:remove(),discard()与pop()
--remove()
·功能:从set中删除元素,如果不存在则引发KeyError;
·演示如下:
1
2
3
4
5
6
7
8
9
|
>>> a set ([ 1 , 2 , 'b' , 'h' , 'xpleaf' , 'n' , 'P' , 3 , 'o' , 'y' , 't' ]) >>> a.remove( 'b' ) >>> a set ([ 1 , 2 , 'h' , 'xpleaf' , 'n' , 'P' , 3 , 'o' , 'y' , 't' ]) >>> a.remove( 'KeyError' ) Traceback (most recent call last): File "<stdin>" , line 1 , in <module> KeyError: 'KeyError' |
--discard()
·功能:如果在set中存在该元素,则删除,无论存在与否,都没有提示;
·演示如下:
1
2
3
4
5
6
7
8
9
|
>>> a set ([ 1 , 2 , 3 , 'h' , 'xpleaf' , 'n' , 'P' , 'o' , 'y' , 't' ]) >>> import tab >>> a.discard( 'xpleaf' ) >>> a set ([ 1 , 2 , 3 , 'h' , 'n' , 'P' , 'o' , 'y' , 't' ]) >>> a.discard( 'CL' ) >>> a set ([ 1 , 2 , 3 , 'h' , 'n' , 'P' , 'o' , 'y' , 't' ]) |
--pop()
·功能:删除并返回set中一个不确定的元素;
·演示如下:
1
2
3
4
5
6
7
8
9
10
|
>>> a.pop() 1 >>> a set ([ 2 , 3 , 'h' , 'n' , 'P' , 'o' , 'y' , 't' ]) >>> a.pop() 2 >>> a.pop() 3 >>> a set ([ 'h' , 'n' , 'P' , 'o' , 'y' , 't' ]) |
4.集合数学操作
·进行数学操作需要了解一些集合操作符号和数学符号:
数学符号 | Python符号 | 含义 |
-或\ | - | 差集,相对补集 |
∩ | & | 交集 |
∪ | | | 并集 |
取∩的补 | ^ | 对称差集 |
≠ | != |
不等于 |
= | == | 等于 |
∈ | in | 属于 |
not in | 不属于 |
--差集,相对补集:-
1
2
3
4
5
6
7
8
9
10
|
>>> a = set (range( 10 )) >>> b = set (range( 15 )) >>> a set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) >>> b set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 ]) >>> b - a set ([ 10 , 11 , 12 , 13 , 14 ]) >>> a - b set ([]) |
--交集:&
1
2
|
>>> a & b set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) |
·也可以用intersection()函数实现:
1
2
|
>>> a.intersection(b) set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) |
--并集:|
1
2
|
>>> a | b set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 ]) |
·也可以用union()函数实现:
1
2
|
>>> a.union(b) set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 ]) |
--对称差集:^
1
2
3
4
5
|
set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) >>> b set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 ]) >>> a ^ b set ([ 10 , 11 , 12 , 13 , 14 ]) |
·也可以用symmetric_difference()函数实现:
1
2
3
4
|
>>> a.symmetric_difference(b) set ([ 10 , 11 , 12 , 13 , 14 ]) >>> b.symmetric_difference(a) set ([ 10 , 11 , 12 , 13 , 14 ]) |
--等于与不等于:==与!=
1
2
3
4
|
>>> a == b False >>> a != b True |
--属于与不属于:in与not in
1
2
3
4
5
6
7
8
9
10
11
12
|
>>> a set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) >>> b set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 ]) >>> a in b False >>> b in a False >>> a not in b True >>> 0 in a True |
·指的是元素是否属于集合,而不是集合之间的包含;
·集合之间的包含(子集)可用:>、>=、<、<=等表示
1
2
3
4
|
>>> a >= b False >>> a <= b True |
·<=相当于函数issubset():
1
2
3
4
|
>>> a <= b True >>> a.issubset(b) ===>a是b的子集 True |
·>=相当于函数issuperset():
1
2
3
4
5
6
|
>>> a >= b False >>> a.issuperset(b) ===>a不是b的超集,即a不包含b False >>> b.issuperset(a) ===>b是a的超集,即b包含a True |
5.其它操作
--len()
·功能:测定集合的长度;
·演示如下:
1
2
3
4
|
>>> len(a) 10 >>> len(b) 15 |
--copy()
·功能:浅复制;
·前面已有提及,不再重复;
--hash()
·功能:返回参数的哈希值;
·演示如下:
1
2
3
4
5
6
7
8
|
>>> a set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 ]) >>> b set ([ 0 , 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12 , 13 , 14 ]) >>> hash(a) Traceback (most recent call last): File "<stdin>" , line 1 , in <module> TypeError: unhashable type: 'set' |
·可以看到普通hash()函数的参数不能为set类型(列表也不行),但可以为字符串类型:
1
2
|
>>> hash( 'CL' ) 8576051523077447 |
·只要数据量足够大,hash是有可能产生相同的hash值,更安全的为md5类型的hash值计算:
1
2
3
4
5
|
>>> import hashlib >>> a = 'hello' >>> a = hashlib.md5() >>> a.hexdigest() 'd41d8cd98f00b204e9800998ecf8427e' |
·可以看到产生的hash值中还包含有字母等字符,因此破解的难度会更大。
python-集合(第二篇(七):集合)的更多相关文章
- Python人工智能第二篇:人脸检测和图像识别
Python人工智能第二篇:人脸检测和图像识别 人脸检测 详细内容请看技术文档:https://ai.baidu.com/docs#/Face-Python-SDK/top from aip impo ...
- Java-集合第二篇Set集合
1.Set集合与Collection基本相同,没有提供额外的方法.实际上Set就是Collection,只是行为略有所不同(Set不允许有重复元素). Set下的HashSet.TreeSet.Enu ...
- Python人工智能第二篇
Python人工智能之路 - 第二篇 : 现成的技术 预备资料: 1.FFmpeg: 链接:https://pan.baidu.com/s/1jonSAa_TG2XuaJEy3iTmHg 密码:w ...
- SVN第二篇-----命令集合
16.switch 代码库URL变更 svn switch (sw): 更新工作副本至不同的URL. 用法: 1.switch URL [PATH] 更新你的工作副本,映射到一个新 ...
- [Python笔记]第二篇:运算符、基本数据类型
本篇主要内容有:运算符 基本数据类型等 一.运算符 1.算术运算 2.比较运算 3.赋值运算 4.逻辑运算 5.成员运算 6.身份运算 7.位运算 8.运算符优先级 二.基本数据类型 1.整数:int ...
- python初识第二篇
python 编码: 第一次编程有时候会遇到乱码的情况,就可以通过以下的情况来解决 在Windows中默认的就是gbk编码,如果在代码头两部定义utf-8,系统还会按照系统的方式来定义. python ...
- Python【第二篇】运算符及优先级、数据类型及常用操作、深浅拷贝
一.运算符及优先级 Python 运算符(算术运算.比较运算.赋值运算.逻辑运算.成员运算) 1.算数运算符 运算符 描述 实例,a=20,b=10 + 加 a+b输出结果30 - 减 a-b输出结果 ...
- python基础-第二篇-基本数据类型
一.运算符 1.算数运算: 算数运算符相信大家都不陌生吧,尤其是加减乘除,好!那我就带着大家看看最后三个,这三个到底是干什么玩意的? %,取两数相除的余数,看图: **,x的多少次幂,看图: //,取 ...
- 图解Python 【第二篇】:Python基础2
本节内容一览图 一.数据类型 1.数字 2 是一个整数的例子.长整数 不过是大一些的整数.3.23和52.3E-4是浮点数的例子.E标记表示10的幂.在这里,52.3E-4表示52.3 * 10-4. ...
- Python基础第二篇
一.三元运算 if True: name='a' else: name='b' #上面的代码用三元运算表示: name="a" if True else "b" ...
随机推荐
- codeforces D. Pashmak and Parmida's problem
http://codeforces.com/contest/459/problem/D 题意:给你n个数,然后统计多少组(i,j)使得f(1,i,ai)>f(j,n,aj); 思路:先从左往右统 ...
- 报错java.net.SocketException: Software caused connection abort: recv failed 怎么办
产生这个异常的原因有多种方面,单就如 Software caused 所示, 是由于程序编写的问题,而不是网络的问题引起的. 已知会导致这种异常的一个场景如下: 客户端和服务端建立tcp的短连接,每次 ...
- SQL server 变量、运算符
一.三个表的练习 表一:学生表 student学号:code int (主键)从1开始姓名:name varchar(50)性别:sex char(10)班级:banji char(10)语文教师编号 ...
- Git 、CVS、SVN比较
Git .CVS.SVN比较 项目源代码的版本管理工具中,比较常用的主要有:CVS.SVN.Git 和 Mercurial (其中,关于SVN,请参见我先前的博客:SVN常用命令 和 SVN服务器配 ...
- [LeetCode#187]Repeated DNA Sequences
Problem: All DNA is composed of a series of nucleotides abbreviated as A, C, G, and T, for example: ...
- 如何查看jar包的版本号?
jar包根目录里的META-INF目录下的MANIFEST.MF文件里一般有会记录版本信息,可以到这个文件里查看 打开Java的JAR文件我们经常可以看到文件中包含着一个META-INF目录,这个 ...
- Spark RDD概念学习系列之rdd的依赖关系彻底解密(十九)
本期内容: 1.RDD依赖关系的本质内幕 2.依赖关系下的数据流视图 3.经典的RDD依赖关系解析 4.RDD依赖关系源码内幕 1.RDD依赖关系的本质内幕 由于RDD是粗粒度的操作数据集,每个Tra ...
- Properties/Property文件读取(键值均)乱码问题!
方法一:使用native2ascii进行转码,这个不做说明,客户不可能帮你转码的. 方法二:当键是因为时直接getProperty即可,但加载后的propertis对象里的键也是中文乱码,就无法通过g ...
- xCode里面设置NSZombieEnabled定位错误
打开product ->scheme->Edit scheme
- spark-streaming-kafka包源码分析
转载请注明原创地址 http://www.cnblogs.com/dongxiao-yang/p/5443789.html 最近由于使用sparkstreaming的同学需要对接到部门内部的的kafk ...