python基础三（数据类型）

一引子

1 什么是数据？

　　x=10，10是我们要存储的数据

2 为何数据要分不同的类型

　　数据是用来表示状态的，不同的状态就应该用不同的类型的数据去表示

3 数据类型

　　数字（整形，长整形，浮点型，复数）

　　字符串

　　字节串：在介绍字符编码时介绍字节bytes类型

　　列表

　　元组

　　字典

　　集合

4 按照以下几个点展开数据类型的学习

#======================================基本使用======================================

#1、用途

#2、定义方式

#3、常用操作+内置的方法

#======================================该类型总结====================================

#存一个值or存多个值

#有序or无序

#可变or不可变（1、可变：值变，id不变。可变==不可hash 2、不可变：值变，id就变。不可变==可hash）

二数字

整型与浮点型

#整型int

　　作用：年纪，等级，身份证号，qq号等整型数字相关

　　定义：

　　　　age=10 #本质age=int(10)

#浮点型float

　　作用：薪资，身高，体重，体质参数等浮点数相关

    salary=3000.3 #本质salary=float(3000.3)

#二进制，十进制，八进制，十六进制

其他数字类型（了解）

#长整形（了解）

    在python2中（python3中没有长整形的概念）：　　　　　　

    >>> num=2L

    >>> type(num)

    <type 'long'>

#复数（了解，推荐视频：https://www.bilibili.com/video/av26786159）　　

    >>> x=1-2j

    >>> x.real

    1.0

    >>> x.imag

    -2.0

三字符串

#作用：名字，性别，国籍，地址等描述信息

#定义：在单引号\双引号\三引号内，由一串字符组成

name='egon'

#优先掌握的操作：

#1、按索引取值(正向取+反向取) ：只能取

#2、切片(顾头不顾尾，步长)

#3、长度len

#4、成员运算in和not in

#5、移除空白strip

#6、切分split

#7、循环

需要掌握的操作

#1、strip,lstrip,rstrip

#2、lower,upper

#3、startswith,endswith

#4、format的三种玩法

#5、split,rsplit

#6、join

#7、replace

#8、isdigit

# strip 默认移除空格

name = '*egon**'

print(name.strip('*'))    # 移除字符串两边的*     egon

print(name.lstrip('*'))   # 移除字符串左边的*     egon**

print(name.rstrip('*'))   # 移除字符串右边的*     *egon

# lower,upper 字母小写和大写

name = 'egon'

print(name.lower())  # 字符串字母小写 egon

print(name.upper())  # 字符串字母大写 EGON

# startswith,endswith   字符串判断是否以什么开头和结尾，返回结果布尔类型

name = 'alex_SB'

print(name.endswith('SB'))  # True

print(name.startswith('alex'))  # True

# format的三种玩法

res = '{} {} {}'.format('egon', 18, 'male')

res1 = '{1} {0} {1}'.format('egon', 18, 'male')

res2 = '{name} {age} {sex}'.format(sex='male', name='egon', age=18)

print(res)

print(res1)

print(res2)

# split     以什么为切片，返回结果列表

name = 'root:x:0:0::/root:/bin/bash'

print(name.split(':'))  # 默认分隔符为空格 ['root', 'x', '0', '0', '', '/root', '/bin/bash']

name = 'C:/a/b/c/d.txt'  # 只想拿到顶级目录

print(name.split('/', 1))  # ['C:', 'a/b/c/d.txt']

print(name.split('/', 2))  # ['C:', 'a', 'b/c/d.txt']

name = 'a|b|c'

print(name.rsplit('|', 1))  # 从右开始切分 ['a|b', 'c']

# join

tag = ' '

print(tag.join(['egon', 'say', 'hello', 'world']))  # 可迭代对象必须都是字符串 egon say hello world

# replace 替代

name = 'alex say :i have one tesla,my name is alex'

print(name.replace('alex', 'SB', 1))    # SB say :i have one tesla,my name is alex

print(name.replace('alex', 'SB', 3))    # SB say :i have one tesla,my name is SB

# isdigit：可以判断bytes和unicode类型,是最常用的用于于判断字符是否为"数字"的方法

age = input('>>: ')

print(age.isdigit())

其他操作（了解即可）

#1、find,rfind,index,rindex,count

#2、center,ljust,rjust,zfill

#3、expandtabs

#4、captalize,swapcase,title

#5、is数字系列

#6、is其他

# find,rfind,index,rindex,count

name = 'egon say hello'

print(name.find('o', 1, 3))  # 顾头不顾尾,找不到则返回-1不会报错,找到了则显示索引

# print(name.index('e',2,4)) #同上,但是找不到会报错

print(name.count('e', 1, 3))  # 顾头不顾尾,如果不指定范围则查找所有

# center,ljust,rjust,zfill

name = 'egon'

print(name.center(30, '-')) # -------------egon-------------

print(name.ljust(30, '*'))  # egon**************************

print(name.rjust(30, '*'))  # **************************egon

print(name.zfill(50))  # 用0填充   # 0000000000000000000000000000000000000000000000egon

# expandtabs

name = 'egon\thello'

print(name)  # egon    hello

print(name.expandtabs(1))  # egon hello

# captalize,swapcase,title

name = 'egon'

print(name.capitalize())  # 首字母大写 Egon

print(name.swapcase())  # 大小写翻转 EGON

msg = 'egon say hi'

print(msg.title())  # 每个单词的首字母大写 Egon Say Hi

# is数字系列

# 在python3中

num1 = b'4'  # bytes

num2 = u'4'  # unicode,python3中无需加u就是unicode

num3 = '四'  # 中文数字

num4 = 'Ⅳ'  # 罗马数字

# isdigt:bytes,unicode

print(num1.isdigit())  # True

print(num2.isdigit())  # True

print(num3.isdigit())  # False

print(num4.isdigit())  # False

# isdecimal:uncicode

# bytes类型无isdecimal方法

print(num2.isdecimal())  # True

print(num3.isdecimal())  # False

print(num4.isdecimal())  # False

# isnumberic:unicode,中文数字,罗马数字

# bytes类型无isnumberic方法

print(num2.isnumeric())  # True

print(num3.isnumeric())  # True

print(num4.isnumeric())  # True

# 三者不能判断浮点数

num5 = '4.3'

print(num5.isdigit())  # False

print(num5.isdecimal())  # False

print(num5.isnumeric())  # False

'''

总结:

    最常用的是isdigit,可以判断bytes和unicode类型,这也是最常见的数字应用场景

    如果要判断中文数字或罗马数字,则需要用到isnumeric

'''

# is其他

print('===>')

name = 'egon123'

print(name.isalnum())  # 字符串由字母或数字组成 True

print(name.isalpha())  # 字符串只由字母组成 False

print(name.isidentifier())  # True

print(name.islower())  # True

print(name.isupper())  # False

print(name.isspace())  # False

print(name.istitle())  # False

练习

name = " aleX"

# 1)    移除 name 变量对应的值两边的空格,并输出处理结果

print(name.strip())

# 2)    判断 name 变量对应的值是否以 "al" 开头,并输出结果 

print(name.startswith('al'))

# 3)    判断 name 变量对应的值是否以 "X" 结尾,并输出结果 

print(name.endswith('X'))

# 4)    将 name 变量对应的值中的 “l” 替换为 “p”,并输出结果

print(name.replace('l', 'p'))

# 5)    将 name 变量对应的值根据 “l” 分割,并输出结果。

print(name.split('l'))

# 6)    将 name 变量对应的值变大写,并输出结果 

print(name.upper())

# 7)    将 name 变量对应的值变小写,并输出结果 

print(name.lower())

# 8)    请输出 name 变量对应的值的第 2 个字符?

print(name[1])

# 9)    请输出 name 变量对应的值的前 3 个字符?

print(name[:3])

# 10)    请输出 name 变量对应的值的后 2 个字符? 

print(name[-2:])

# 11)    请输出 name 变量对应的值中 “e” 所在索引位置? 

print(name.find('e'))

# 12)    获取子序列,去掉最后一个字符。如: oldboy 则获取 oldbo。

a=name[:-1]

print(a)

四列表

# 基本数据类型
# list
1、作用：按位置存放多个值
2、定义：在[]内,用逗号分隔开多个任意数据类型的值
# l1 = [1,'a',[1,2]]  # 本质:l1 = list([1,'a',[1,2]])

3、类型转换

# 但凡能被for循环遍历的数据类型都可以传给list()转换成列表类型，list()会跟for循环一样遍历出数据类型中包含的每一个元素然后放到列表中

# >>> list('wdad') # 结果：['w', 'd', 'a', 'd']

# >>> list([1,2,3]) # 结果：[1, 2, 3]

# >>> list({"name":"jason","age":18}) #结果：['name', 'age']

# >>> list((1,2,3)) # 结果：[1, 2, 3]

# >>> list({1,2,3,4}) # 结果：[1, 2, 3, 4]

4、内置方法

# 1.按索引存取值(正向存取+反向存取)：即可存也可以取

# 1.1 正向取(从左往右)

>>> my_friends=['tony','jason','tom',4,5]

>>> my_friends[0]

tony

# 1.2 反向取(负号表示从右往左)

>>> my_friends[-1]

5

# 1.3 对于list来说，既可以按照索引取值，又可以按照索引修改指定位置的值，但如果索引不存在则报错

>>> my_friends = ['tony','jack','jason',4,5]

>>> my_friends[1] = 'martthow'

>>> my_friends

['tony', 'martthow', 'jason', 4, 5]

# 2.切片(顾头不顾尾，步长)

# 2.1 顾头不顾尾：取出索引为0到3的元素

>>> my_friends[0:4]

['tony', 'jason', 'tom', 4]

# 2.2 步长：0:4:2,第三个参数2代表步长，会从0开始，每次累加一个2即可，所以会取出索引0、2的元素

>>> my_friends[0:4:2]

['tony', 'tom']

# 2.3 my_friends[:] #切片等同于拷贝行为，而且相当于浅拷贝。

# 2.4 my_friends[::-1]  #整个列表取反，倒过来。

# 3.长度

>>> len(my_friends)

5

# 4.成员运算in和not in

>>> 'tony' in my_friends

True

>>> 'xxx' not in my_friends

True

# 5.添加

# 5.1 append()列表尾部追加元素

>>> l1 = ['a','b.txt','c']

>>> l1.append('d')

>>> l1

['a', 'b.txt', 'c', 'd']

# 5.2 extend()一次性在列表尾部添加多个元素(拼接作用）

>>> l1.extend(['a','b.txt','c'])

>>> l1

['a', 'b.txt', 'c', 'd', 'a', 'b.txt', 'c']

# 5.3 insert()在指定位置插入元素

>>> l1.insert(0,"first")  # 0表示按索引位置插值

>>> l1

['first', 'a', 'b.txt', 'c', 'alisa', 'a', 'b.txt', 'c']

# 6.删除

# 6.1 del :通用的删除方法，只是单纯的删除、没有返回值。

>>> l = [11,22,33,44]

>>> del l[2]  # 删除索引为2的元素,不支持赋值语法

>>> l

[11,22,44]

# 6.2 pop()默认删除列表最后一个元素，并将删除的值返回，括号内可以通过加索引值来指定删除元素

>>> l = [11,22,33,22,44]

>>> res=l.pop()

>>> res

44

>>> res=l.pop(1)

>>> res

22

# 6.3 remove()括号内指名道姓表示要删除哪个元素，返回None

>>> l = [11,22,33,22,44]

>>> res=l.remove(22) # 从左往右查找第一个括号内需要删除的元素

>>> print(res)

None

# 7.循环

# 循环遍历my_friends列表里面的值

for line in my_friends:

    print(line)

'tony'

'jack'

'jason'

4

# 8.reverse()颠倒列表内元素顺序，不是排序，列表倒过来。

>>> l = [11,22,33,44]

>>> l.reverse()

>>> l

[44,33,22,11]

# 8.sort()给列表内所有元素排序

# 8.1 排序时列表元素之间必须是相同数据类型，不可混搭，否则报错

>>> l = [11,22,3,42,7,55]

>>> l.sort()

>>> l

[3, 7, 11, 22, 42, 55]  # 默认从小到大排序

>>> l = [11,22,3,42,7,55]

>>> l.sort(reverse=True)  # reverse用来指定是否跌倒排序，默认为False

>>> l

[55, 42, 22, 11, 7, 3]

# 8.2 了解知识：

# 我们常用的数字类型直接比较大小，但其实，字符串、列表等都可以比较大小，

  原理相同：都是依次比较对应位置的元素的大小，如果分出大小，则无需比较下一个元素，比如

>>> l1=[1,2,3]

>>> l2=[2,]

>>> l2 > l1

True

# 字符之间的大小取决于它们在ASCII表中的先后顺序，越往后越大

>>> s1='abc'

>>> s2='az'

>>> s2 > s1 # s1与s2的第一个字符没有分出胜负，但第二个字符'z'>'b.txt',所以s2>s1成立

True

了解：列表也可以比大小，原理同字符串一样，必须同种类型

# 所以我们也可以对下面这个列表排序

>>> l = ['A','z','adjk','hello','hea']

>>> l.sort()

>>> l

['A', 'adjk', 'hea', 'hello','z']

# 9、count index clear

# l = [1, 1, 22, 1, 24]

# # res1 = l.count(1)    # 1有几个  3 [1, 1, 22, 1, 24]

# # res2 = l.index(22)  # 找索引,找不到报错 2 [1, 1, 22, 1, 24]

# res3 = l.clear()  # 清除列表，返回一个None  None []

# # print(res1,l)

# # print(res2,l)

# print(res3,l)

# 补充

# 1、队列：FIFO，先进先出（商场自动扶梯，先站上去的人，先出去）

l=[]

# 入队操作

l.append('first')

l.append('second')

l.append('third')

print(l)

# 出队操作

print(l.pop(0))

print(l.pop(0))

print(l.pop(0))

# 2、堆栈：LIFO,后进后出（向衣柜里叠衣服，后叠进去的，先拿出来）

l = []

# 入栈操作

l.append('first')

l.append('second')

l.append('third')

print(l)

# 出栈操作

print(l.pop())

print(l.pop())

print(l.pop())

练习

# 1. 有列表data=['alex',49,[1900,3,18]]，分别取出列表中的名字，年龄，出生的年，月，日赋值给不同的变量

data = ['alex', 49, [1900, 3, 18]]

name = data[0]

age = data[1]

year = data[2][0]

month = data[2][1]

day = data[2][2]

# 2. 用列表模拟队列

l = []

l.append('a')

l.append('b')

l.append('c')

l.pop(0)

l.pop(0)

l.pop(0)

# 3. 用列表模拟堆栈

l1 = []

l1.append('a')

l1.append('b')

l1.append('c')

l1.pop()

l1.pop()

l1.pop()

# 4. 有如下列表，请按照年龄排序（涉及到匿名函数）

l2 = [

    {'name': 'alex', 'age': 84},

    {'name': 'oldboy', 'age': 73},

    {'name': 'egon', 'age': 18},

]

l2.sort(key=lambda item: item['age'])

print(l2)

五元组

1、元组与列表类似("一个不可变的列表”），也是可以存多个任意类型的元素，不同之处在于元组的元素不能修改。
#  即元组相当于不可变的列表，用于记录多个固定不允许修改的值，单纯用于取，只用于读不用于改
2、定义：
在()内用逗号分隔开多个任意类型的值
# >>> countries = ("中国"，"美国"，"英国")  # 本质:countries = tuple("中国"，"美国"，"英国")
强调：如果元组内只有一个值，则必须加一个逗号，否则()就只是包含的意思而非定义元组
# >>> countries = ("中国"，)  # 本质:countries = tuple("中国")
强调，元组不能改，是指元组对应内存地址不能改，元组里含有列表等可变类型数据，在列表内的内容可以改变

3、类型转换

# 但凡能被for循环的遍历的数据类型都可以传给tuple()转换成元组类型

>>> tuple('wdad') # 结果：('w', 'd', 'a', 'd')

>>> tuple([1,2,3]) # 结果：(1, 2, 3)

>>> tuple({"name":"jason","age":18}) # 结果：('name', 'age')

>>> tuple((1,2,3)) # 结果：(1, 2, 3)

>>> tuple({1,2,3,4}) # 结果：(1, 2, 3, 4)

# tuple()会跟for循环一样遍历出数据类型中包含的每一个元素然后放到元组中

4、使用

>>> tuple1 = (1, 'hhaha', 15000.00, 11, 22, 33)

4.1 按索引取值(正向取+反向取)：只能取，不能改否则报错！

>>> tuple1[0]

1

>>> tuple1[-2]

22

>>> tuple1[0] = 'hehe'  # 报错：TypeError:

4.2 切片(顾头不顾尾，步长)

>>> tuple1[0:6:2]

(1, 15000.0, 22)

4.3 长度

>>> len(tuple1)

6

4.4 成员运算 in 和 not in

>>> 'hhaha' in tuple1

True

>>> 'hhaha' not in tuple1

False

5、循环

>>> for line in tuple1:

...     print(line)

1

hhaha

15000.0

11

22

33

6、内置方法(两种）

t = (1, 2, 34, 5)

t1 = t.count(1)

t2 = t.index(34)

print(t1, type(t1))

print(t2, type(t2))

练习

# 简单购物车,要求如下：

# 实现打印商品详细信息，用户输入商品名和购买个数，则将商品名，价格，购买个数加入购物列表，如果输入为空或其他非法输入则要求用户重新输入　　

msg_dic = {

    'apple': 10,

    'tesla': 100000,

    'mac': 3000,

    'lenovo': 30000,

    'chicken': 10,

}

l = []

while True:

    for key, item in msg_dic.items():

        print('商品名：{}, 价格：{}元！'.format(key, item))

    product_name = input('请输入商品名：').strip()

    if not product_name or product_name not in msg_dic:continue

    count = input('购买个数：').strip()

    if not count.isdigit():continue

    l.append((product_name, msg_dic[product_name], count))

    print(l)

六字典

1、作用
2、定义：在{}内用逗号分隔开多元素，每一个元素都是key:value的形式，其中value可以是任意类型
#   而key则必须是不可变类型，key不重复，详见第八小节，通常key应该是str类型，因为str类型会对value有描述性的功能

info={'name':'tony','age':18,'sex':'male'} #本质info=dict({....})

# 也可以这么定义字典

info=dict(name='tony',age=18,sex='male') # info={'age': 18, 'sex': 'male', 'name': 'tony'}

d={}    #默认定义出来的是空字典

d1=dict()   #也定义空字典

print(d,d1)

3、数据类型转换

转换1：
info = [['name', 'tony'], ('age', 18), ['sex', 'male']]

d = {}

for item in info:

    d[item[0]] = item[1]

print(d)    # {'name': 'tony', 'age': 18, 'sex': 'male'}

res = dict(info)

print(res)  # {'name': 'tony', 'age': 18, 'sex': 'male'}

转换2：fromkeys会从元组中取出每个值当做key，然后与None组成key:value放到字典中

>>> {}.fromkeys(('name','age','sex'),None)

{'age': None, 'sex': None, 'name': None}

4、内置方法

# 1.1 取

>>> dic = {

...     'name': 'xxx',

...     'age': 18,

...     'hobbies': ['play game', 'basketball']

... }

>>> dic['name']

'xxx'

>>> dic['hobbies'][1]

'basketball'

# 1.2 对于赋值操作，如果key原先不存在于字典，则会新增key:value

>>> dic['gender'] = 'male'  #列表对没有的索引赋值，会报错；类似与列表的append,insert

>>> dic

{'name': 'tony', 'age': 18, 'hobbies': ['play game', 'basketball'],'gender':'male'}

# 1.3 对于赋值操作，如果key原先存在于字典，则会修改对应value的值

>>> dic['name'] = 'tony'

>>> dic

{'name': 'tony', 'age': 18, 'hobbies': ['play game', 'basketball']}

# 2、长度len

>>> len(dic)

3

# 3、成员运算in和not in

>>> 'name' in dic  # 判断某个值是否是字典的key

True

# 4、删除

# 4.1 通用删除

dic={'name':'tony','age':18,'sex':'male'}

del dic['name']

print(dic）

# 4.2

>>>  res=dic.pop('name')  # 通过指定字典的key来删除字典的键值对，返回删除key对应的那个Value。

>>> dic

{'age': 18, 'hobbies': ['play game', 'basketball']}

>>> res

'tony'

# 4.3 popitem删除：随机删除，返回元组（删除的Key,删除Value)

res = dic.popitem()

print(res)  # ('sex', 'male')

# 5、键keys()，值values()，键值对items()    --》在python3中得到的是老母鸡,跟range一样的道理，节约内存

>>> dic = {'age': 18, 'hobbies': ['play game', 'basketball'], 'name': 'xxx'}

# 获取字典所有的key

>>> dic.keys()  #python2中输出是--》['name', 'age', 'hobbies']

dict_keys(['name', 'age', 'hobbies'])

# 获取字典所有的value

>>> dic.values()

dict_values(['xxx', 18, ['play game', 'basketball']])

# 获取字典所有的键值对

>>> dic.items()

dict_items([('name', 'xxx'), ('age', 18), ('hobbies', ['play game', 'basketball'])])

需要掌握得

1.get()

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}   #根据key取值，容错性好

>>> dic.get('k1')

'jason'  # key存在，则获取key对应的value值

>>> res=dic.get('xxx') # key不存在，不会报错而是默认返回None

>>> print(res)

None

>>> res=dic.get('xxx',666) # key不存在时，可以设置默认返回的值

>>> print(res)

666

ps:字典取值建议使用get方法

# 2.update()

# 用新字典更新旧字典，有则修改，无则添加

>>> dic= {'k1':'jason','k2':'Tony','k3':'JY'}

>>> dic.update({'k1':'JN','k4':'xxx'})

>>> dic

{'k1': 'JN', 'k3': 'JY', 'k2': 'Tony', 'k4': 'xxx'}

# 3.setdefault()

# key不存在则新增键值对，并将新增的value返回

>>> dic={'k1':111,'k2':222}

>>> res=dic.setdefault('k3',333)

>>> res

333

>>> dic # 字典中新增了键值对

{'k1': 111, 'k3': 333, 'k2': 222}

# key存在则不做任何修改，并返回已存在key对应的value值

>>> dic={'k1':111,'k2':222}

>>> res=dic.setdefault('k1',666)

>>> res

111

>>> dic # 字典不变

{'k1': 111, 'k2': 222}

练习

# 1 有如下值集合 [11,22,33,44,55,66,77,88,99,90]，将所有大于 66 的值保存至字典的第一个key中，将小于 66 的值保存至第二个key的值中

# 即： {'k1': 大于66的所有值, 'k2': 小于66的所有值}

l = [11, 22, 33, 44, 55, 66, 77, 88, 99, 90]

l1 = []

l2 = []

for i in l:

    if i > 60:

        l1.append(i)

    if i < 60:

        l2.append(i)

dic = {}

dic['k1'] = l1

dic['k2'] = l2

print(dic)

# 2 统计s='hello alex alex say hello sb sb'中每个单词的个数

# 结果如：{'hello': 2, 'alex': 2, 'say': 1, 'sb': 2}

s = 'hello alex alex say hello sb sb'

l3 = s.split(' ')

print(l3)

dic = {}

for i in l3:

    dic[i] = l3.count(i)  # 字典给键赋值，就是给字典增加键值对

print(dic)

七集合

1、作用
 集合、list、tuple、dict一样都可以存放多个值，但是集合主要用于：去重、关系运算

2、定义

定义：在{}内用逗号分隔开多个元素，集合具备以下三个特点：

     1：每个元素必须是不可变类型
     2：集合内没有重复的元素
     3：集合内元素无序

s = {1,2,3,4}  # 本质 s = set({1,2,3,4})

# 注意1：列表类型是索引对应值，字典是key对应值，均可以取得单个指定的值，
        而集合类型既没有索引也没有key与值对应，所以无法取得单个的值，而且对于集合来说，主要用于去重与关系运算，
        根本没有取出单个指定值这种需求。
# 注意2:{}既可以用于定义dict，也可以用于定义集合，但是字典内的元素必须是key:value的格式，
       现在我们想定义一个空字典和空集合，该如何准确去定义两者?
d = {} # 默认是空字典
s = set() # 这才是定义空集合

3、类型转换
# 但凡能被for循环的遍历的数据类型（强调：遍历出的每一个值都必须为不可变类型）都可以传给set()转换成集合类型
# >>> s = set([1,2,3,4])
# >>> s1 = set((1,2,3,4))
# >>> s2 = set({'name':'jason',})
# >>> s3 = set('egon')
# >>> s,s1,s2,s3
{1, 2, 3, 4} {1, 2, 3, 4} {'name'} {'e', 'o', 'g', 'n'}

4、使用
关系运算(类似于数学集合运算）
我们定义两个集合friends与friends2来分别存放两个人的好友名字，然后以这两个集合为例讲解集合的关系运算
friends1 = {"zero", "kevin", "jason", "egon"}   # 用户1的好友们
friends2 = {"Jy", "ricky", "jason", "egon"}     # 用户2的好友们
 1）合集/并集(|)：求两个用户所有的好友（重复好友只留一个）
# print(friends1|friends2)    #无序得
# print(friends1.union(friends2))
 2）交集(&)：求两个用户的共同好友
print(friends1&friends2)
print(friends1.intersection(friends2))  #等价
 3）差集(-)：
# print(friends1 - friends2)  # 求用户1独有的好友
# print(friends1.difference(friends2))
# print(friends2 - friends1)  # 求用户2独有的好友
# print(friends2.difference(friends1))
 4）对称差集(^) # 求两个用户独有的好友们（即去掉共有的好友）
print(friends1 ^ friends2)
 5）值是否相等(==)
# >>> friends1 == friends2
# False

 6）父集：一个集合是否包含另外一个集合
 6.1 包含则返回True
>>> {1,2,3} > {1,2}
True
print({1,2,3}.issuperset({1,2})
print({1,2}.issubset({1,2,3})
>>> {1,2,3} >= {1,2}
True
 6.2 不存在包含关系，则返回False
>>> {1,2,3} > {1,3,4,5}
False
>>> {1,2,3} >= {1,3,4,5}
False

 7）子集
>>> {1,2} < {1,2,3}
True
>>> {1,2} <= {1,2,3}
True
 8）长度
>>> s={'a','b.txt','c'}
>>> len(s)
3

 9）成员运算
>>> 'c' in s
True

 10）循环
>>> for item in s:
...     print(item)
... 
c
a
b.txt

5 去重（局限性）
# 1. 只能针对不可变类型
# 2. 集合本身是无序的，去重之后无法保留原来的顺序
>>> l=['a','b.txt',1,'a','a']
>>> s=set(l)
>>> s   # 将列表转成了集合
{'b.txt', 'a', 1}
>>> l_new=list(s) # 再将集合转回列表
>>> l_new
['b.txt', 'a', 1] # 去除了重复，但是打乱了顺序

# 针对不可变类型，并且保证顺序则需要我们自己写代码实现，例如
l=[
    {'name':'lili','age':18,'sex':'male'},
    {'name':'jack','age':73,'sex':'male'},
    {'name':'tom','age':20,'sex':'female'},
    {'name':'lili','age':18,'sex':'male'},
    {'name':'lili','age':18,'sex':'male'},
]

new_l=[]

for dic in l:
    if dic not in new_l:
        new_l.append(dic)

print(new_l)
# 结果：既去除了重复，又保证了顺序，而且是针对不可变类型的去重
[
    {'age': 18, 'sex': 'male', 'name': 'lili'}, 
    {'age': 73, 'sex': 'male', 'name': 'jack'}, 
    {'age': 20, 'sex': 'female', 'name': 'tom'}
]

6 其他内置方法
# s={1,2,3}
1）discard
# s.discard(4)    #删除元素不存在do nothing
# print(s)
# s.remove(4)     #删除元素不存在则报错

2）update
# s.update({1,3,5})
# print(s)

3）pop
# res=s.pop()
# print(res)
# print(s)

4）add
# s.add(4)
# print(s)

练习

一.关系运算

　　有如下两个集合，pythons是报名python课程的学员名字集合，linuxs是报名linux课程的学员名字集合

　　pythons={'alex','egon','yuanhao','wupeiqi','gangdan','biubiu'}

　　linuxs={'wupeiqi','oldboy','gangdan'}

　　1. 求出即报名python又报名linux课程的学员名字集合

　　2. 求出所有报名的学生名字集合

　　3. 求出只报名python课程的学员名字

　　4. 求出没有同时这两门课程的学员名字集合

# 有如下两个集合，pythons是报名python课程的学员名字集合，linuxs是报名linux课程的学员名字集合

pythons={'alex','egon','yuanhao','wupeiqi','gangdan','biubiu'}

linuxs={'wupeiqi','oldboy','gangdan'}

# 求出即报名python又报名linux课程的学员名字集合

print(pythons & linuxs)

# 求出所有报名的学生名字集合

print(pythons | linuxs)

# 求出只报名python课程的学员名字

print(pythons - linuxs)

# 求出没有同时这两门课程的学员名字集合

print(pythons ^ linuxs)

二.去重

　　 1. 有列表l=['a','b',1,'a','a']，列表元素均为可hash类型，去重，得到新列表,且新列表无需保持列表原来的顺序

　　 2.在上题的基础上，保存列表原来的顺序

　　 3.去除文件中重复的行，肯定要保持文件内容的顺序不变

　　 4.有如下列表，列表元素为不可hash类型，去重，得到新列表，且新列表一定要保持列表原来的顺序

l=[

    {'name':'egon','age':18,'sex':'male'},

    {'name':'alex','age':73,'sex':'male'},

    {'name':'egon','age':20,'sex':'female'},

    {'name':'egon','age':18,'sex':'male'},

    {'name':'egon','age':18,'sex':'male'},

]

#去重,无需保持原来的顺序

l=['a','b',1,'a','a']

print(set(l))

#去重,并保持原来的顺序

#方法一:不用集合

l=[1,'a','b',1,'a']

l1=[]

for i in l:

    if i not in l1:

        l1.append(i)

print(l1)


#方法二:借助集合

l1=[]

s=set()

for i in l:

    if i not in s:

        s.add(i)

        l1.append(i)

print(l1)

# 同上方法二,去除文件中重复的行

import os

with open('db.txt','r',encoding='utf-8') as read_f,\

        open('.db.txt.swap','w',encoding='utf-8') as write_f:

    s=set()

    for line in read_f:

        if line not in s:

            s.add(line)

            write_f.write(line)

os.remove('db.txt')

os.rename('.db.txt.swap','db.txt')

# 列表中元素为可变类型时,去重,并且保持原来顺序

l=[

    {'name':'egon','age':18,'sex':'male'},

    {'name':'alex','age':73,'sex':'male'},

    {'name':'egon','age':20,'sex':'female'},

    {'name':'egon','age':18,'sex':'male'},

    {'name':'egon','age':18,'sex':'male'},

]

# print(set(l)) #报错:unhashable type: 'dict'

s=set()

l1=[]

for item in l:

    val=(item['name'],item['age'],item['sex'])

    if val not in s:

        s.add(val)

        l1.append(item)

print(l1)

# 定义函数,既可以针对可以hash类型又可以针对不可hash类型

def func(items,key=None):

    s=set()

    for item in items:

        val=item if key is None else key(item)

        if val not in s:

            s.add(val)

            yield item

print(list(func(l,key=lambda dic:(dic['name'],dic['age'],dic['sex']))))

八数据类型总结

按存储空间的占用分（从低到高）

数字

字符串

集合：无序，即无序存索引相关信息

元组：有序，需要存索引相关信息，不可变

列表：有序，需要存索引相关信息，可变，需要处理数据的增删改

字典：无序，需要存key与value映射的相关信息，可变，需要处理数据的增删改

按存值个数区分

标量／原子类型	数字，字符串
容器类型	列表，元组，字典

 按可变不可变区分

可变	列表，字典
不可变	数字，字符串，元组

按访问顺序区分

直接访问	数字
顺序访问（序列类型）	字符串，列表，元组
key值访问（映射类型）	字典

九、作业

#作业一: 三级菜单

#要求:

打印省、市、县三级菜单

可返回上一级

可随时退出程序

menu = {

    '北京':{

        '海淀':{

            '五道口':{

                'soho':{},

                '网易':{},

                'google':{}

            },

            '中关村':{

                '爱奇艺':{},

                '汽车之家':{},

                'youku':{},

            },

            '上地':{

                '百度':{},

            },

        },

        '昌平':{

            '沙河':{

                '老男孩':{},

                '北航':{},

            },

            '天通苑':{},

            '回龙观':{},

        },

        '朝阳':{},

        '东城':{},

    },

    '上海':{

        '闵行':{

            "人民广场":{

                '炸鸡店':{}

            }

        },

        '闸北':{

            '火车战':{

                '携程':{}

            }

        },

        '浦东':{},

    },

    '山东':{},

}

# 方法一

tag=True

while tag:

    menu1=menu

    for key in menu1: # 打印第一层

        print(key)

    choice1=input('第一层>>: ').strip() # 选择第一层

    if choice1 == 'b': # 输入b，则返回上一级

        break

    if choice1 == 'q': # 输入q，则退出整体

        tag=False

        continue

    if choice1 not in menu1: # 输入内容不在menu1内，则继续输入

        continue

    while tag:

        menu_2=menu1[choice1] # 拿到choice1对应的一层字典

        for key in menu_2:

            print(key)

        choice2 = input('第二层>>: ').strip()

        if choice2 == 'b':

            break

        if choice2 == 'q':

            tag = False

            continue

        if choice2 not in menu_2:

            continue

        while tag:

            menu_3=menu_2[choice2]

            for key in menu_3:

                print(key)

            choice3 = input('第三层>>: ').strip()

            if choice3 == 'b':

                break

            if choice3 == 'q':

                tag = False

                continue

            if choice3 not in menu_3:

                continue

            while tag:

                menu_4=menu_3[choice3]

                for key in menu_4:

                    print(key)

                choice4 = input('第四层>>: ').strip()

                if choice4 == 'b':

                    break

                if choice4 == 'q':

                    tag = False

                    continue

                if choice4 not in menu_4:

                    continue

                # 第四层内没数据了，无需进入下一层

# 方法二

#part1（初步实现）：能够一层一层进入

layers = [menu, ]

while True:

    current_layer = layers[-1]

    for key in current_layer:

        print(key)

    choice = input('>>: ').strip()

    if choice not in current_layer: continue

    layers.append(current_layer[choice])

#part2（改进）：加上退出机制

layers=[menu,]

while True:

    if len(layers) == 0: break

    current_layer=layers[-1]

    for key in current_layer:

        print(key)

    choice=input('>>: ').strip()

    if choice == 'b':

        layers.pop(-1)

        continue

    if choice == 'q':break

    if choice not in current_layer:continue

    layers.append(current_layer[choice])

python基础三（数据类型）的更多相关文章

Python基础(三) 数据类型
我们首先要看的是几乎任何语言都具有的数据类型,包括字符串.整型.浮点型以及布尔类型.这些基本数据类型组成了基本控制块,从而创建的Python应用程序. 一.基本结构 1.数值: Python支持不同的 ...
Python基础之数据类型
Python基础之数据类型变量赋值 Python中的变量不需要声明,变量的赋值操作既是变量声明和定义的过程. 每个变量在内存中创建,都包括变量的标识,名称和数据这些信息. 每个变量在使用前都必须赋值 ...
第二章：python基础，数据类型
"""第二章:python基础,数据类型2.1 变量及身份运算补充2.2 二进制数2.3 字符编码每8位所占的空间位一个比特,这是计算机中最小的表示单位.每8个比特组成一 ...
python基础一数据类型之字典
摘要: python基础一数据类型之一字典,这篇主要讲字典. 1,定义字典 2,字典的基础知识 3,字典的方法 1,定义字典 1,定义1个空字典 dict1 = {} 2,定义字典 dict1 = d ...
Python 基础三反射
Python 基础三反射今天我们先介绍一下反射这个概念,啥是反射?反射就是自己检测自己.在我们Python的面向对象中的反射是啥意思呢?就是通过字符串的形式操作对象相关的属性.python中的一 ...
第三篇：python基础之数据类型与变量
阅读目录一.变量二.数据类型 2.1 什么是数据类型及数据类型分类 2.2 标准数据类型: 2.2.1 数字 2.2.1.1 整型: 2.2.1.2 长整型long: 2.2.1.3 布尔bool ...
进击的Python【第三章】：Python基础(三)
Python基础(三) 本章内容集合的概念与操作文件的操作函数的特点与用法参数与局部变量 return返回值的概念递归的基本含义函数式编程介绍高阶函数的概念一.集合的概念与操作集合( ...
第一节 Python基础之数据类型(整型，布尔值，字符串)
数据类型是每一种语言的基础,就比如说一支笔,它的墨有可能是红色,有可能是黑色,也有可能是黄色等等,这不同的颜色就会被人用在不同的场景.Python中的数据类型也是一样,比如说我们要描述一个人的年龄:小 ...
python基础(二)----数据类型
Python基础第二章二进制字符编码基本数据类型-数字基本数据类型-字符串基本数据类型-列表基本数据类型-元组可变.不可变数据类型和hash 基本数据类型-字典基本数据类型-集合二进 ...
Python学习day04 - Python基础(2)数据类型基础
<!doctype html>day04 - 博客 figure:last-child { margin-bottom: 0.5rem; } #write ol, #write ul { ...

随机推荐

electron nodejs idea 的 Terminal 默认是操作系统的 cmd.exe，他默认是GBK
问题1:idea 的 Terminal 默认是操作系统的 cmd.exe,他默认是GBK,尽量不要通过手段更改了,没意义.若要在控制台输出中文,最简单的方法是运行:chcp 65001 &&a ...
[数据库] 数据库中的DDL、DML、DQL、DCL
SQL 程序语言有四种类型,对数据库的基本操作都属于这四种类,也就是标题上显示的 DDL.DML.DQL.DCL. 1. DDL DDL(Data Definition Language 数据定义语言 ...
C语言程序设计之循环控制2020-10-20
2020-10-20 整理: 第一题: 2011年开始实行新个人所得税法,要求输入月薪salary,输出应交的个人所得税 tax (保留两位小数). 新税法方案如下: tax=rate*(salary ...
山东职业竞赛wp2023（arm、cpython）
pwn2 return2libc,白给 from evilblade import * context(os='linux', arch='amd64') context(os='linux', ar ...
NC24953 [USACO 2008 Jan G]Cell Phone Network
题目链接题目题目描述 Farmer John has decided to give each of his cows a cell phone in hopes to encourage the ...
Linux 中iostat 命令详解
iostat命令详解 iostat 主要是统计磁盘活动情况. iostat有以下缺陷: iostat的输出结果大多数是一段时间内的平均值,因此难以反映峰值情况iostat仅能对系统整体情况进行分析汇 ...
wxPython 笔记
安装 Win7 / Win10 直接通过 pip install wxpython 安装 Ubuntu18.04 / Ubuntu 20.04 在Linux下的安装会稍微麻烦, 可以参考官网上的说明 ...
Map与WeakMap
Map与WeakMap Map对象用来保存键值对,并且能够记住键的原始插入顺序,任何对象或者原始值都可以作为键或者是值. WeakMap对象同样用来保存键值对,对于键是弱引用的而且必须为一个对象,而值 ...
idea自定义代码片段live template
1.介绍有时在idea编辑器经常会写同一个代码块,那么这个代码块就可以利用live template功能把它定义成可根据关键字触发的代码片段,效果如下图: 2.操作步骤此处我们就以springbo ...
阿里面试：Java开发中，应如何避免OOM
Java内存管理:避免OOM的10个实用小技巧引言在Java开发中,OutOfMemoryError(OOM)错误一直是令开发者头疼的问题,也是Java面试中出现核心频率很高的问题. 那么我们究竟 ...

python基础三（数据类型）

一 引子

二 数字

三 字符串

四 列表

五 元组

六 字典

七 集合

八 数据类型总结

九、 作业

python基础三（数据类型）的更多相关文章

随机推荐

热门专题

一引子

二数字

三字符串

四列表

五元组

六字典

七集合

八数据类型总结

九、作业