day05 Python中的set集合】的更多相关文章

集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的.以下是集合最重要的两点: 1.去重,把一个列表变成集合,就自动去重了. 2.关系测试,测试两组数据之前的交集.差集.并集等关系 1.集合的创建 # set集合用{}表示,有两种创建方法 set1 = set({1, 2, 'barry'}) # 使用set()方法创建集合 set2 = {1, 2, 'barry'} # 直接赋值创建集合 print(set1, set2)…
Python中字典和集合 映射类型: 表示一个任意对象的集合,且可以通过另一个几乎是任意键值的集合进行索引 与序列不同,映射是无序的,通过键进行索引 任何不可变对象都可用作字典的键,如字符串.数字.元组等 包含可变对象的列表.字典和元组不能用作键 引用不存在的键会引发KeyError异常 1)字典 dict { } 空字典 { key1:value1,key2:value2,... } 字典在其它编程语言中又称作关联数组或散列表: 通过键实现元素存取:无序集合:可变类型容器,长度可变,异构,嵌套…
python中,集合(set)是一个无序排列,可哈希, 支持集合关系测试,不支持索引和切片操作,没有特定语法格式, 只能通过工厂函数创建.集合里不会出现两个相同的元素, 所以集合常用来对字符串或元组或列表中的元素进行去重操作. 生成一个集合可以使用如下语法: 生成集合语法1: >>> l1=[1,2,3,4,5,6] >>> s1=set(l1) >>> print(s1) {1, 2, 3, 4, 5, 6} 在这里,使用工厂函数set创建集合,se…
本人开始学习python 希望能够慢慢的记录下去 写下来只是为了害怕自己忘记. python中的字典和其他语言一样 也是key-value的形式  利用空间换时间 可以进行快速的查找 key 是唯一的 不可变的类型 比如 str int 等  不能是list之类的可变类型 1.定义 定义一个字典 格式{key:value,key:value} a = {'a':80,'b':90,1:'a',2:[1,2]} print(a) 如果是定义如下 a = {'a':90,[1,2,3]:10} 则会…
python的set和其他语言类似, 是一个无序不重复元素集, 基本功能包括关系测试和消除重复元素. 集合对象还支持union(联合), intersection(交), difference(差)和sysmmetric difference(对称差集)等数学运算.sets 支持 x in set, len(set), 和 for x in set.作为一个无序的集合,sets 不记录元素位置或者插入点.因此,sets 不支持 indexing, slicing, 或其它类序列(sequence…
1.集合(set)里面的元素是不可以重复的    s={1,2,3,3,4,3,4}      ## 输出之后,没有重复的 2.定义一个空集合 s = set([]) print s,type(s)3.结合的应用:对列表去重复   li = [1,2,3,1,2,3]   print list(set(li))4.集合的特性:不支持索引,切片,连接,重复:支持成员操作赋.for循环5.集合常用的方法   s = {6, 3, 2, 3, 5, 7} s.add("dd")       …
一.基础数据类型的补充 1.str中的join算法,将列表转换成字符串,并用'_'(或其他) li=['李嘉诚','马化腾','刘嘉玲','黄海峰',] s='_'.join(li) print(s) #李嘉诚_马化腾_刘嘉玲_黄海峰 2.循环删除列表中的每个元素 li=['李嘉诚','马化腾','刘嘉玲','黄海峰',] for el in li: li.remove(el) print(li) #['马化腾', '黄海峰'] 原因分析:for循环在运行过程中会有一个指针记录当前循环的元素是哪…
## 字典的所有方法- 内置方法 - 1 cmp(dict1, dict2) 比较两个字典元素. - 2 len(dict) 计算字典元素个数,即键的总数. - 3 str(dict) 输出字典可打印的字符串表示. - 4 type(variable) 返回输入的变量类型,如果变量是字典就返回字典类型.- 1 dict.clear() 删除字典内所有元素- 2 dict.copy() 返回一个字典的浅复制- 3 dict.fromkeys(seq[, val]) 创建一个新字典,以序列 seq…
一.字符串和列表的相互转化 之前写到想把xx类型的数据转化成yy类型的数据,直接yy(xx)就可以了,但是字符串和列表的转化比较特殊,相互之间的转化要通过join()和split()来实现. 例如: 列表转化成字符串: lst = ['高新华','刘清扬','翠云彰'] s = '**'.join(lst) print(s) #高新华**刘清扬**翠云彰 字符串转化成列表: ss = '高新华**刘清扬**崔元章' s =ss.split('**') print(s) #['高新华', '刘清扬…
当使用爬虫URL保存时,一般会选择set来保存urls,set是集合,集合中的元素不能重复,其次还有交集,并集等集合的功能, 爬虫每次获取的网页中提取网页中的urls,并保存,这就需要利用urls = set() 下面展示一下HTML解析器代码 #coding:utf-8 import re import urlparse from bs4 import BeautifulSoup class HtmlParser(object): def parser(self,page_url,html_c…