菜鸟学IT之python3关于列表,元组,字典,集合浅认识!
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753
一.列表,元组,字典,集合分别如何增删改查及遍历。
- 列表
# 列表的增加
ls =['Hello','Word','JS','OK','Good']
print("原始数据:",ls)
ls.append(12) # 在数组列表后面增加字符串“12”
print("增加后的数组为:",ls) # 列表的删除
del ls[1] # 删除数组的第二个元素,即下标为1的字符串
# ls.pop() # 删除列表最后一个元素
print("删除数组第二个元素后数组为:",ls) # 列表的修改
ls[1] = "修改" # 删除数组的第二个元素,即下标为1的字符串
print("修改数组第二个元素后数组为:",ls) # 列表的查询
ls.index('OK') # 查找“OK”字符串
print("打印字符串“OK”的下标:",ls.index('OK')) # 遍历列表
print("遍历列表:")
for i in ls:
print(i)
结果:

- 元组
# 元组
YZ = ('元','组','的','元','素','不','修','改')
YZ1 = ('的','!')
YZ2 = YZ + YZ1
del YZ # 删除元组
print("元组的遍历:")
for i in YZ2:
print("\t\t",i)
结果:

- 字典
# 字典
D = {'这':1,'是':2,'字':3,'典':4,'!':5}
D['这']=11 # 修改键“这”的值
del D['是'] # 删除键“是”
a = D['这'] # 查看键a的值
print("字典\n查看“这”的下标:",a)
# D.clear() # 删除字典中的所有条目
# 遍历输出列表
str(D) # 打印字典
for key in D:
print(key)
结果:

- 集合
# 集合
aa = {1, 2, 3}
aa.add(4) # 增加
print(aa) aa.remove(2) # 删除
print(aa)
# 遍历打印
for i in aa:
print("\t\t",i)
结果:

二、总结列表,元组,字典,集合的联系与区别。参考以下几个方面:
- 括号
- 有序无序
- 可变不可变
- 重复不可重复
- 存储与查找方式
|
列表 |
元组 |
字典 |
集合 |
|
|
名称 |
list |
tuple |
dict |
set |
|
初始化 |
[‘0’,’0’,’1’] |
(‘0’,’0’,’1’) |
{‘0’:1,’0’:2,’1’:3} |
{1,2}或set([2,3]) |
|
是否有序 |
有序 |
有序 |
无序,自动正序 |
无序 |
|
可否重复 |
是 |
是 |
是 |
否 |
|
读写性 |
读写 |
只读 |
读写 |
读写 |
|
存储方式 |
值 |
值 |
键值对(键不可重复) |
键(不可重复) |
|
添加 |
append |
只读 |
add |
d[‘key’]=’value’ |
三、词频统计
1.下载一长篇小说,存成utf-8编码的文本文件 file
2.通过文件读取字符串 str
3.对文本进行预处理
4.分解提取单词 list
5.单词计数字典 set , dict
6.按词频排序 list.sort(key=lambda),turple
7.排除语法型词汇,代词、冠词、连词等无语义词
- 自定义停用词表
- 或用stops.txt
8.输出TOP(20)
9.可视化:词云
排序好的单词列表word保存成csv文件
import pandas as pd
# 打开小说
f = open(r'..\Lin\file_text\Sophies World.txt', 'r', encoding='utf8')
book = f.read()
f.close() book_symbol = ['\n', '\t', '?', '?', '!', "!"," '", "'", ' "', '"', '""', ',', ',', '.', '。','“','”',','] # 删除标点符号
for i in book_symbol:
book = book.replace(i, '') # 把所有的小写 以空格分隔开
book = book.lower().split() # 打开停用词
f = open(r'..\Lin\file_text\stops.txt', 'r', encoding='utf8')
stops = f.read()
f.close()
# 删除多余符号
stop_symbol = [" '", "'", ' "', '"', '\n']
for i in stop_symbol:
stops = stops.replace(i, '')
# 以逗号分隔
stops = stops.split(',')
word_dict = {} # 创建词典 # 去掉停用词
word_set = set(book) - set(stops) # 遍历计算词频
for i in word_set:
word_dict[i] = book.count(i) word_count = list(word_dict.items())
word_count.sort(key = lambda x:x[1], reverse = True)
pd.DataFrame(data=word_count[0:20]).to_csv('Sophies World.csv', encoding='utf-8')
结果:

菜鸟学IT之python3关于列表,元组,字典,集合浅认识!的更多相关文章
- python3笔记十八:python列表元组字典集合文件操作
一:学习内容 列表元组字典集合文件操作 二:列表元组字典集合文件操作 代码: import pickle #数据持久性模块 #封装的方法def OptionData(data,path): # ...
- python中列表 元组 字典 集合的区别
列表 元组 字典 集合的区别是python面试中最常见的一个问题.这个问题虽然很基础,但确实能反映出面试者的基础水平. (1)列表 什么是列表呢?我觉得列表就是我们日常生活中经常见到的清单.比如,统计 ...
- **python中列表 元组 字典 集合
列表 元组 字典 集合的区别是python面试中最常见的一个问题.这个问题虽然很基础,但确实能反映出面试者的基础水平. 1.列表 列表是以方括号“[]”包围的数据集合,不同成员以“,”分隔. 列表的特 ...
- python_列表——元组——字典——集合
列表——元组——字典——集合: 列表: # 一:基本使用# 1.用途:存放多个值 # 定义方式:[]内以逗号为分隔多个元素,列表内元素无类型限制# l=['a','b','c'] #l=list([' ...
- Python列表,元组,字典,集合详细操作
菜鸟学Python第五天 数据类型常用操作及内置方法 列表(list) ======================================基本使用====================== ...
- python 中列表 元组 字典 集合的区别
先看图片解释 (1)列表 什么是列表呢?我觉得列表就是我们日常生活中经常见到的清单.比如,统计过去一周我们买过的东西,把这些东西列出来,就是清单.由于我们买一种东西可能不止一次,所以清单中是允许有重复 ...
- python的学习笔记01_4基础数据类型列表 元组 字典 集合 其他其他(for,enumerate,range)
列表 定义:[]内以逗号分隔,按照索引,存放各种数据类型,每个位置代表一个元素 特性: 1.可存放多个值 2.可修改指定索引位置对应的值,可变 3.按照从左到右的顺序定义列表元素,下标从0开始顺序访问 ...
- Day 07 数据类型的内置方法[列表,元组,字典,集合]
数据类型的内置方法 一:列表类型[list] 1.用途:多个爱好,多个名字,多个装备等等 2.定义:[]内以逗号分隔多个元素,可以是任意类型的值 3.存在一个值/多个值:多个值 4.有序or无序:有序 ...
- Python数据类型-布尔/数字/字符串/列表/元组/字典/集合
代码 bol = True # 布尔 num = 100000000; # 数字 str = "fangbei"; # 字符串 str_cn = u"你好,方倍" ...
随机推荐
- Docker & ASP.NET Core (5):Docker Compose
第一篇:把代码连接到容器 第二篇:定制Docker镜像 第三篇:发布镜像 第四篇:容器间的连接 Docker Compose简介 Compose是一个用来定义和运行多容器Docker应用的工具.使用C ...
- Android中EditText显示明文与密文的两种方式
版权声明:本文为HaiyuKing原创文章,转载请注明出处! 前言 记录输入框显示.隐藏密码的简单布局以及实现方式. 效果图 代码分析 方式一 /**方式一:*/ private void sh ...
- 【Python3爬虫】自动查询天气并实现语音播报
一.写在前面 之前写过一篇用Python发送天气预报邮件的博客,但是因为要手动输入城市名称,还要打开邮箱才能知道天气情况,这也太麻烦了.于是乎,有了这一篇博客,这次我要做的就是用Python获取本机I ...
- h2engine游戏服务器设计之聊天室示例
游戏服务器设计之聊天室示例 简介 h2engine引擎建群以后,有热心网友向我反馈,想尝试h2engine但是没有服务器开发经验觉得无从入手,希望我能提供一个简单明了的示例.由于前一段时间工作实在忙碌 ...
- Flink的分布式缓存
分布式缓存 Flink提供了一个分布式缓存,类似于hadoop,可以使用户在并行函数中很方便的读取本地文件,并把它放在taskmanager节点中,防止task重复拉取.此缓存的工作机制如下:程序注册 ...
- 制造业物料清单BOM、智能文档阅读、科学文献影响因子、"Celebrated Italian mathematician ZepartzatT Gozinto" 与 高津托图
意大利数学家Z.高津托 意大利伟大数学家Sire Zepartzatt Gozinto的生卒年代是一个谜[1],但是他发明的 “高筋图” 在 制造资源管理.物料清单(BOM)管理.智能阅读.科学文献影 ...
- python学习第五讲,python基础语法之函数语法,与Import导入模块.
目录 python学习第五讲,python基础语法之函数语法,与Import导入模块. 一丶函数简介 1.函数语法定义 2.函数的调用 3.函数的文档注释 4.函数的参数 5.函数的形参跟实参 6.函 ...
- Java中1.0 / 0.0 会输出什么?
蓝桥杯失利后发现算法与数据结构的重要性,开始学习算法,刚刚在看<算法4>,看到了这么个东西,让我对java中的size运算有了新的感悟. 在java中输出1/0会发生什么,毫无疑问会报异常 ...
- python的学习笔记__初识函数
函数定义与调用 #函数定义 def mylen(): """计算s1的长度""" s1 = "hello world" ...
- 升鲜宝V2.0_生鲜配送行业,对生鲜配送系统开发与实施的深度对比与思考_升鲜宝生鲜配送系统_15382353715_余东升
升鲜宝V2.0_生鲜配送行业,对生鲜配送系统开发与实施的深度对比与思考_升鲜宝生鲜配送系统_15382353715_余东升 笔者从事生鲜配送软件开发接近10年,前前后后研究了很多 ...