一、基本数据类型

什么是数据类型

变量:描述世间万物的事物的属性状态

为了描述世间万物的状态,所以有了数据类型,对数据分类

为什么要对数据分类

针对不同的状态需要不同的数据类型标识

数据类型的分类

二、数字类型

整型(int)

作用

表示人的年龄 / 身份证号

定义

age = 21
pringt(age, type(age))
# 打印结果:21 <class 'int'> # 或者:
age = int(21)
print(age, type(age))
# 打印结果:21 <class 'int'>

使用方法

x = 1
y = 2
print(x + y) # 加
print(x - y) # 减
print(x * y) # 乘
print(x / y) # 除
print(x % y) # 取余
print(x // y) # 取整
print(x ** y) # 幂

浮点型(float)

作用

用来描述(身高/体重/薪资)

定义

salary = 3.1
print(salary) # 3.1 salary1 = float(3) # 强制类型转换(动态语言),静态语言不能改变
print(salary1) # 3.0 height = int(180.5)
print(height) # 180

使用方法

与整形类似

+  -  *  /   % //  **

三、字符串类型

作用

字符串:字符用引号串起来

描述姓名/性别

定义方式

name = 'setcreed'
name2 = "setcreed" gender = 'male'
height1 = 'setcreed"s height'   # 读取第一个单引号的时候,字符串开始;第二引号结束
height2 = "setcreed's height" # 读取第一个双引号的时候,字符串开始;第二引号结束

用三单引号/三双引号

poem = '''孩儿立志出湘关,学不成名誓不还;
埋骨何须桑梓地,人生无处不青山。'''

使用方法

内置方法

  • startswith() 以。。。开始
s = 'hello world'
print(s.startswith('hello')) # 打印True
  • endswith() 以。。。结束
s = 'hello world'
print(s.startswith('d')) # 打印True

索引取值

poem1 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''

print(poem1[0])  # 孩
print(poem1[-1]) # 。

索引切片

poem2 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''

print(poem2[0:7])  # 取0-6个  孩儿立志出湘关

步长

poem3 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''

print(poem3[0:7:3])  # 孩志关

四、列表

作用

列表可以存储多个值,如存放 爱好

定义方式

用[]存储,用逗号隔开多个元素(可以是任意数据类型)

my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]

使用方法

  • 索引取值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[6][0]) # 打印结果:
666
  • 切片
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[:5]) # 前面默认为0
print(my_list[:]) # 没写,默认全部
  • 索引修改值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list[0] = 'hello'
print(my_list) # 打印结果:
['hello', 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
  • 内置方法

append方法: 追加

my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list.append('999999999')
print(my_list) # 打进结果:
[1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9, '999999999']

split 方法

s = 'a+b+c+d'
print(s.split('+')) # 按照+把字符串切开,然后把切开的元素放入列表内 # 打印结果:
['a', 'b', 'c', 'd']

join 方法

lis = ['a','b','c','d']
res = ' '.join(lis) # 按照字符串把列表里的每一个元素取出来拼接
print(res) # 打印结果:
a b c d

五、字典

作用

用来存取多个值,按照key: value键值对的方式存值,取的时候可以通过key而非索引去取值,key对value具有描述性的作用。存放数据的种类各种各样并且数据较多的时候可以使用字典。

定义方式

my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}

使用方法

  • 取值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
print(my_info_dict['name']) # 打印结果:
setcreed
  • del删除值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
del my_info_dict['height']
print(my_info_dict) # 打印结果:
{'name': 'setcreed', 'age': 20, 'weight': 150}

六、jieba库

jieba库一般用于分词

import jieba

res = jieba.lcut('中华人民共和国是一个伟大的国家')   # 精确模式,返回一个列表类型的分词结果
print(res) # 打印结果:
['中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba

res = jieba.lcut_for_search('中华人民共和国是一个伟大的国家')  # 搜索引擎模式,返回一个列表类型的分词结果,存在冗余
print(res) # 打印结果:
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba

res = jieba.lcut('中华人民共和国是一个伟大的国家',cut_all=True) # 把所有的可能全部切出来
print(res) # 打印结果:
['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '一个', '伟大', '的', '国家']

七、wordcloud词云

import wordcloud
import jieba
from imageio import imread mk = imread('test.png') # 把图片读入内存
s = '''当其他人盲目的追寻真相和真实的时候,记住。万物皆虚。
当其他人受到法律和道德的束缚的时候,记住。万事皆允。
我们服侍光明却耕耘于黑暗。
真正睿智的人不会向你指明真相,而是教导你去发现真相。
世界上明明有一万种宗教,人们却用一种方式祈祷。这里没有上帝,只有属于我们自己的信条。
我们在黑暗中工作,为光明服务,我们,是刺客。''' s_list = jieba.lcut(s) # 把字符串切成列表
s = ' '.join(s_list) # 把列表拼接成字符串
w = wordcloud.WordCloud(font_path='C:\Windows\Fonts\simkai.ttf', background_color='white', mask=mk)
w.generate(s)
w.to_file('set.png')

数字、字符串、列表、字典,jieba库,wordcloud词云的更多相关文章

  1. jieba分词wordcloud词云

    1.jieba库的基本介绍 (1).jieba是优秀的中文分词第三方库 中文文本需要通过分词获得单个的词语 jieba是优秀的中文分词第三方库,需要额外安装 jieba库提供三种分词模式,最简单只需掌 ...

  2. jieba库与词云的使用——以孙子兵法为例

    1.打开cmd安装jieba库和 matplotlib. 2.打开python,输入代码.代码如下: from wordcloud import WordCloud import matplotlib ...

  3. 利用jieba库画词云

    from wordcloud import WordCloud import matplotlib.pyplot as plt import jieba # 生成词云 def create_word_ ...

  4. python爬虫——京东评论、jieba分词、wordcloud词云统计

    接上一章,动态页面抓取——抓取京东评论区内容. url=‘https://club.jd.com/comment/productPageComments.action?callback=fetchJS ...

  5. python字符串/列表/字典互相转换

    python字符串/列表/字典互相转换 目录 字符串与列表 字符串与字典 列表与字典 字符串与列表 字符串转列表 1.整体转换 str1 = 'hello world' print(str1.spli ...

  6. wordcloud词云模块

    wordcloud词云模块 下载 pip install wordcloud 使用 import wordcloud##调用整个模块 form wordcloud import WordCloud## ...

  7. python3 wordcloud词云

    wordclou:根据文本生成词云 一.词云设置 wc=WordCloud(width=400, height=200, #画布长.宽,默认(400,200)像素 margin=1, #字与字之间的距 ...

  8. python 基于 wordcloud + jieba + matplotlib 生成词云

    词云 词云是啥?词云突出一个数据可视化,酷炫.以前以为很复杂,不想python已经有成熟的工具来做词云.而我们要做的就是准备关键词数据,挑一款字体,挑一张模板图片,非常非常无脑.准备好了吗,快跟我一起 ...

  9. 初识python 字符串 列表 字典相关操作

    python基础(一): 运算符: 算术运算: 除了基本的+ - * / 以外,还需要知道 :  // 为取整除 返回的市商的整数部分 例如: 9 // 2  ---> 4  , 9.0 //  ...

随机推荐

  1. nginx 文件服务器配置,模板配置文件,有注释

    # For more information on configuration, see: # * Official English Documentation: http://nginx.org/e ...

  2. android 电容屏(四):驱动调试之驱动程序分析篇 -- FocalTech

    本人用的触摸屏IC是FocalTech公司的ft5306,是一款i2c的电容屏多点触控芯片.对于它的整体驱动官方已经给了,我们就触摸屏和按键部分的代码做相关说明.说明其中应该注意的地方. 对于所有的i ...

  3. WindowsServer2003中IIS支持php的配置

    1.安装MySQL(没有特殊说明的就按照默认安装)选择 Custom 自定义安装点击"Change"更改 MySQL 安装目录(自定义)其他按照默认的下一步就可以 安装完成后会自动 ...

  4. 解决N个人过桥时间最短问题(Java版本)

    [问题描述] n个人要晚上过桥,在任何时候最多两个人一组过桥,每组要有一只手电筒.在这n个人中只有一个手电筒能用,因此要安排以某种往返的方式来返还手电筒,使更多的人可以过桥.   注意:每个人的过桥速 ...

  5. 面向对象程序设计(JAVA) 第8周学习指导及要求

    2019面向对象程序设计(Java)第8周学习指导及要求 (2019.10.18-2019.10.21)  学习目标 掌握接口定义方法: 掌握实现接口类的定义要求: 掌握实现了接口类的使用要求: 理解 ...

  6. 【树状数组】2019徐州网络赛 query

    (2)首先成倍数对的数量是nlogn级别的,考虑每一对[xL,xR](下标的位置,xL < xR)会对那些询问做出贡献,如果qL <= xL && qR >= xR, ...

  7. CentOs篇

    Advanced-高级配置.Security-安全.Boot-启动引导: 1.Removable Devices-移动设备 2.Hard Drive-本地硬盘 3.CD-ROM- Drive-光盘 4 ...

  8. Python爬虫:

    python中selenium操作下拉滚动条方法汇总   UI自动化中经常会遇到元素识别不到,找不到的问题,原因有很多,比如不在iframe里,xpath或id写错了等等:但有一种是在当前显示的页面元 ...

  9. 20191028 牛客网CSP-S Round2019-1

    花了 \(30min\) 打了 \(180\) 分的暴力... 仓鼠的石子游戏 问题描述 链接:https://ac.nowcoder.com/acm/contest/1100/A 仓鼠和兔子被禁止玩 ...

  10. strcspn()函数

    函数描述: 检索字符串 str1 开头连续有几个字符都不含字符串 str2 中的字符. 函数声明: #include<string.h> size_t strcspn(const char ...