数字、字符串、列表、字典,jieba库,wordcloud词云
一、基本数据类型
什么是数据类型
变量:描述世间万物的事物的属性状态
为了描述世间万物的状态,所以有了数据类型,对数据分类
为什么要对数据分类
针对不同的状态需要不同的数据类型标识
数据类型的分类
二、数字类型
整型(int)
作用
表示人的年龄 / 身份证号
定义
age = 21
pringt(age, type(age))
# 打印结果:21 <class 'int'>
# 或者:
age = int(21)
print(age, type(age))
# 打印结果:21 <class 'int'>
使用方法
x = 1
y = 2
print(x + y) # 加
print(x - y) # 减
print(x * y) # 乘
print(x / y) # 除
print(x % y) # 取余
print(x // y) # 取整
print(x ** y) # 幂
浮点型(float)
作用
用来描述(身高/体重/薪资)
定义
salary = 3.1
print(salary) # 3.1
salary1 = float(3) # 强制类型转换(动态语言),静态语言不能改变
print(salary1) # 3.0
height = int(180.5)
print(height) # 180
使用方法
与整形类似
+ - * / % // **
三、字符串类型
作用
字符串:字符用引号串起来
描述姓名/性别
定义方式
name = 'setcreed'
name2 = "setcreed"
gender = 'male'
height1 = 'setcreed"s height' # 读取第一个单引号的时候,字符串开始;第二引号结束
height2 = "setcreed's height" # 读取第一个双引号的时候,字符串开始;第二引号结束
用三单引号/三双引号
poem = '''孩儿立志出湘关,学不成名誓不还;
埋骨何须桑梓地,人生无处不青山。'''
使用方法
内置方法
- startswith() 以。。。开始
s = 'hello world'
print(s.startswith('hello')) # 打印True
- endswith() 以。。。结束
s = 'hello world'
print(s.startswith('d')) # 打印True
索引取值
poem1 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem1[0]) # 孩
print(poem1[-1]) # 。
索引切片
poem2 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem2[0:7]) # 取0-6个 孩儿立志出湘关
步长
poem3 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''
print(poem3[0:7:3]) # 孩志关
四、列表
作用
列表可以存储多个值,如存放 爱好
定义方式
用[]存储,用逗号隔开多个元素(可以是任意数据类型)
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
使用方法
- 索引取值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[6][0])
# 打印结果:
666
- 切片
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[:5]) # 前面默认为0
print(my_list[:]) # 没写,默认全部
- 索引修改值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list[0] = 'hello'
print(my_list)
# 打印结果:
['hello', 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
- 内置方法
append方法: 追加
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list.append('999999999')
print(my_list)
# 打进结果:
[1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9, '999999999']
split 方法
s = 'a+b+c+d'
print(s.split('+')) # 按照+把字符串切开,然后把切开的元素放入列表内
# 打印结果:
['a', 'b', 'c', 'd']
join 方法
lis = ['a','b','c','d']
res = ' '.join(lis) # 按照字符串把列表里的每一个元素取出来拼接
print(res)
# 打印结果:
a b c d
五、字典
作用
用来存取多个值,按照key: value键值对的方式存值,取的时候可以通过key而非索引去取值,key对value具有描述性的作用。存放数据的种类各种各样并且数据较多的时候可以使用字典。
定义方式
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
使用方法
- 取值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
print(my_info_dict['name'])
# 打印结果:
setcreed
- del删除值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
del my_info_dict['height']
print(my_info_dict)
# 打印结果:
{'name': 'setcreed', 'age': 20, 'weight': 150}
六、jieba库
jieba库一般用于分词
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家') # 精确模式,返回一个列表类型的分词结果
print(res)
# 打印结果:
['中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut_for_search('中华人民共和国是一个伟大的国家') # 搜索引擎模式,返回一个列表类型的分词结果,存在冗余
print(res)
# 打印结果:
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba
res = jieba.lcut('中华人民共和国是一个伟大的国家',cut_all=True) # 把所有的可能全部切出来
print(res)
# 打印结果:
['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '一个', '伟大', '的', '国家']
七、wordcloud词云
import wordcloud
import jieba
from imageio import imread
mk = imread('test.png') # 把图片读入内存
s = '''当其他人盲目的追寻真相和真实的时候,记住。万物皆虚。
当其他人受到法律和道德的束缚的时候,记住。万事皆允。
我们服侍光明却耕耘于黑暗。
真正睿智的人不会向你指明真相,而是教导你去发现真相。
世界上明明有一万种宗教,人们却用一种方式祈祷。这里没有上帝,只有属于我们自己的信条。
我们在黑暗中工作,为光明服务,我们,是刺客。'''
s_list = jieba.lcut(s) # 把字符串切成列表
s = ' '.join(s_list) # 把列表拼接成字符串
w = wordcloud.WordCloud(font_path='C:\Windows\Fonts\simkai.ttf', background_color='white', mask=mk)
w.generate(s)
w.to_file('set.png')
数字、字符串、列表、字典,jieba库,wordcloud词云的更多相关文章
- jieba分词wordcloud词云
1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...
- jieba库与词云的使用——以孙子兵法为例
1.打开cmd安装jieba库和 matplotlib. 2.打开python,输入代码.代码如下: from wordcloud import WordCloud import matplotlib ...
- 利用jieba库画词云
from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba # 生成词云 def create_word_ ...
- python爬虫——京东评论、jieba分词、wordcloud词云统计
接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...
- python字符串/列表/字典互相转换
python字符串/列表/字典互相转换 目录 字符串与列表 字符串与字典 列表与字典 字符串与列表 字符串转列表 1.整体转换 str1 = 'hello world' print(str1.spli ...
- wordcloud词云模块
wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...
- python3 wordcloud词云
wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...
- python 基于 wordcloud + jieba + matplotlib 生成词云
词云 词云是啥?词云突出一个数据可视化,酷炫.以前以为很复杂,不想python已经有成熟的工具来做词云.而我们要做的就是准备关键词数据,挑一款字体,挑一张模板图片,非常非常无脑.准备好了吗,快跟我一起 ...
- 初识python 字符串 列表 字典相关操作
python基础(一): 运算符: 算术运算: 除了基本的+ - * / 以外,还需要知道 : // 为取整除 返回的市商的整数部分 例如: 9 // 2 ---> 4 , 9.0 // ...
随机推荐
- nginx 文件服务器配置,模板配置文件,有注释
# For more information on configuration, see: # * Official English Documentation: http://nginx.org/e ...
- android 电容屏(四):驱动调试之驱动程序分析篇 -- FocalTech
本人用的触摸屏IC是FocalTech公司的ft5306,是一款i2c的电容屏多点触控芯片.对于它的整体驱动官方已经给了,我们就触摸屏和按键部分的代码做相关说明.说明其中应该注意的地方. 对于所有的i ...
- WindowsServer2003中IIS支持php的配置
1.安装MySQL(没有特殊说明的就按照默认安装)选择 Custom 自定义安装点击"Change"更改 MySQL 安装目录(自定义)其他按照默认的下一步就可以 安装完成后会自动 ...
- 解决N个人过桥时间最短问题(Java版本)
[问题描述] n个人要晚上过桥,在任何时候最多两个人一组过桥,每组要有一只手电筒.在这n个人中只有一个手电筒能用,因此要安排以某种往返的方式来返还手电筒,使更多的人可以过桥. 注意:每个人的过桥速 ...
- 面向对象程序设计(JAVA) 第8周学习指导及要求
2019面向对象程序设计(Java)第8周学习指导及要求 (2019.10.18-2019.10.21) 学习目标 掌握接口定义方法: 掌握实现接口类的定义要求: 掌握实现了接口类的使用要求: 理解 ...
- 【树状数组】2019徐州网络赛 query
(2)首先成倍数对的数量是nlogn级别的,考虑每一对[xL,xR](下标的位置,xL < xR)会对那些询问做出贡献,如果qL <= xL && qR >= xR, ...
- CentOs篇
Advanced-高级配置.Security-安全.Boot-启动引导: 1.Removable Devices-移动设备 2.Hard Drive-本地硬盘 3.CD-ROM- Drive-光盘 4 ...
- Python爬虫:
python中selenium操作下拉滚动条方法汇总 UI自动化中经常会遇到元素识别不到,找不到的问题,原因有很多,比如不在iframe里,xpath或id写错了等等:但有一种是在当前显示的页面元 ...
- 20191028 牛客网CSP-S Round2019-1
花了 \(30min\) 打了 \(180\) 分的暴力... 仓鼠的石子游戏 问题描述 链接:https://ac.nowcoder.com/acm/contest/1100/A 仓鼠和兔子被禁止玩 ...
- strcspn()函数
函数描述: 检索字符串 str1 开头连续有几个字符都不含字符串 str2 中的字符. 函数声明: #include<string.h> size_t strcspn(const char ...