前言

最近工作和研究涉及到数据挖掘和机器学习,出于归纳和总结知识的目的写下这一系列的文章,这一系列文章将会包括Python的基本数据类型和数据结构,函数和面向对象相关的知识,然后会介绍数据挖掘和机器学习经常用到的Numpy,Pandas。也希望这一系列文章能够帮助刚刚接触Python或者数据挖掘和机器学习的人。

基本数据类型

数字

Python中将带小数点的数都当作浮点数处理,对于加减乘除的基本操作与其他语言没有什么差别。

字符串

与绝大多数语言相同,Python也是通过“”来声明字符串。

poet = "We are all in the gutter, but some of us are looking for stars"
print(poet);
复制代码

字符串对空格敏感,不会主动去除空格,我们可以通过lstrip和strip来去除字符串左边和两端的字符串。

name = " Python"
name1 = " Python " print(name.lstrip())
print(name1.strip())
复制代码

Python也是通过+来连接字符串

name = "hello"+" Python"
print(name.lstrip())
复制代码

需要注意的是Python与其他语言如Java不同的地方在于在拼接字符串时python不会主动将其他类型转化为字符串类型,需要自己手动转换,否则会报错如下

age = 23
message = "Happy" + age + "rd Birthday"
print(message.lstrip()) # 报错
TypeError: can only concatenate str (not "int") to str
Traceback (most recent call last):
File "D:/Program Files/project/hello.py", line 3, in <module>
message = "Happy" + 23 + "rd Birthday"
TypeError: can only concatenate str (not "int") to str 复制代码

必须改为

age = 23
message = "Happy" + str(age) + "rd Birthday"
print(message.lstrip())
复制代码

列表

列表基础

列表是由一系列按特定顺序排列的元素组成,可以由[]来声明一个列表。

names = ["Python", 'Java', 'C++']
复制代码

Python列表访问元素和修改元素与一些语言中的数据相类似,通过下标来访问和修改元素且下标从0开始。

names[0] = 'go'
复制代码

可以通过append来在列表尾添加元素

names.append('C')
复制代码

通过insert来在特定位置插入元素

names.insert(0, 'Ruby')
复制代码

list删除元素有很多种方法,可以使用del来删除元素。

del names[0]
复制代码

也可以使用pop来删除元素

names.pop(0)
复制代码

前面两种都是根据位置来删除元素,可以用remove根据值来删除元素,需要注意的是,remove只会删除一个值,如果列表中有多个相同值则需要调用多次。

names.remove('Java')
复制代码

列表的排序:可以用sort使列表永久排序,可以通过传递参数reverse = True来倒着排序。

nums = [1, 9, 7, 5, 4, 3, 2]
nums.sort(reverse=True)
复制代码

sort会永久改变列表,如果只是想临时排序可以使用sorted。

nums = [1, 9, 7, 5, 4, 3, 2]
print(sorted(nums))
复制代码

可以使用reverse来使列表倒转

nums = [1, 9, 7, 5, 4, 3, 2]
nums.reverse()
print(nums)
复制代码

可以用len来获取列表的长度

len(nums)
复制代码

为了避免在访问列表时越界,Python以-1来表示最后一个元素,-2为倒数第2个,以此类推

nums[-1]
复制代码

列表操作

我们可以使用for in语句来遍历列表,需要注意在Python中使用:和缩进来代替其他语言中常用的{}来表示语句块,这也是Pyhthon的一个特色。

names = ["Python", 'Java', 'C++', 'go', 'Ruby']
for item in names:
print(item)
复制代码

我们还可以使用range函数来生成一组数字,range(1, 5)会返回1, 2, 3, 4,同时range还可以设置步长,range(1, 5, 2)会返回1, 3。

for i in range(1, 5, 2):
print(i)
复制代码

可以利用list加range构造一个数字列表,可以使用min,max,sum求数字列表的最小值,最大值和和。

nums = list(range(1, 5))
print(max(nums))
print(min(nums))
print(sum(nums))
复制代码

我们还可以通过列表解析来创建列表,如下,Python中**表示乘方运算。

squares = [value**2 for value in range(1, 5)]
复制代码

等价于

squares = []
for value in range(1, 5):
squares.append(value**2)
复制代码

Python可以通过切片来获取列表的一部分。

names = ["Python", 'Java', 'C++', 'go', 'Ruby']
print(names[1:3])
# 返回['Java', 'C++']
复制代码

[1:3]有点像以前数学的区间,右边是开区间,[1:3]就是【1,3)就是1,2。

元组

元组就是一种特殊的列表,声明之后就无法更改,可以通过()声明。

names=('java', 'python')
复制代码

字典

列表是有序的,通过位置来访问元素,而字典是无序,通过键值对来存储和访问元素,可以通过{}来声明字典。

D = {}
D = {'egg': 1, 'ham': 2}
复制代码

字典是可以嵌套的

D ={'food': {'egg': 1, 'ham': 2}}
复制代码

字典可以通过keys,values和items来获取键,值和键+值。

D = {'egg': 1, 'ham': 2}
print(D.keys())
print(D.values())
print(D.items())
复制代码

通过get来根据键来获取键对应的值。

D = {'egg': 1, 'ham': 2}
print(D.get('egg'))
复制代码

通过键来新增或更改字典

D = {'egg': 1, 'ham': 2}
D['egg'] = 2
print(D)
复制代码

通过del和pop来删除元素

D = {'egg': 1, 'ham': 2}
del D['egg']
D.pop('ham')
复制代码

通过update来合并两个字典

D1 = {'bread': 3}
D = {'egg': 1, 'ham': 2}
D.update(D1)
print(D)
复制代码

通过len来获取字典长度

D = {'egg': 1, 'ham': 2}
print(len(D))
复制代码

最后

简单介绍了Python的数据结构,内容很简单,不过最好还是自己动手敲一遍,纸上得来终觉浅。

作者:月下西楼
链接:https://juejin.im/post/6892383755341758477
来源:掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Python基本数据类型与数据结构(数据挖掘学习)的更多相关文章

  1. Python的数据类型与数据结构

    Python的数据类型与数据结构 数据类型分为: 整数型 :数字的整数 浮点型: 数字带小数 字符串: 用 ‘’ 或者 “” 引用的任意文本 布尔型:只有 True 和 False 数据结构分为: 列 ...

  2. 闲聊之Python的数据类型 - 零基础入门学习Python005

    闲聊之Python的数据类型 让编程改变世界 Change the world by program Python的数据类型 闲聊之Python的数据类型所谓闲聊,goosip,就是屁大点事可以咱聊上 ...

  3. python组合数据类型和数据结构

    //2019.12-071.pyhton里面组合数据类型主要有三种:集合(set).序列(字符串str.列表list and 元组tuple)和映射(字典dic)2.集合类型一般使用大括号{}来进行表 ...

  4. 第二章 python中重要的数据结构(下)

    二.元组(tuple):不可变序列 跟list一样,也是一种序列,唯一不同的是,元组元素不能被修改,通常用(, ,)表示元组,也可以不加括号. #创建元组 >>> 1,2,3 (1, ...

  5. Python中的数据类型和数据结构

    一.数据类型 Python中有六个标准数据类型: Number(数字) String(字符串) List(列表) Tuple(元组) Sets(集合) Dictionary(字典) 其中,除列表Lis ...

  6. [python学习手册-笔记]002.python核心数据类型

    python核心数据类型 ❝ 本系列文章是我个人学习<python学习手册(第五版)>的学习笔记,其中大部分内容为该书的总结和个人理解,小部分内容为相关知识点的扩展. 非商业用途转载请注明 ...

  7. 图解python | 基础数据类型

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/56 本文地址:http://www.showmeai.tech/article-det ...

  8. Python 之路 Day5 - 常用模块学习

    本节大纲: 模块介绍 time &datetime模块 random os sys shutil json & picle shelve xml处理 yaml处理 configpars ...

  9. python 基本数据类型分析

    在python中,一切都是对象!对象由类创建而来,对象所拥有的功能都来自于类.在本节中,我们了解一下python基本数据类型对象具有哪些功能,我们平常是怎么使用的. 对于python,一切事物都是对象 ...

随机推荐

  1. 洛谷P1450 [HAOI2008]硬币购物 背包+容斥

    无限背包+容斥? 观察数据范围,可重背包无法通过,假设没有数量限制,利用用无限背包 进行预处理,因为实际硬币数有限,考虑减掉多加的部分 如何减?利用容斥原理,减掉不符合第一枚硬币数的,第二枚,依次类推 ...

  2. lua 源码阅读 5.3.5 笔记

    记录下吧,断断续续读了几周,收益还是很多的. 推荐阅读顺序: 1) 基础数据类型 lstring.c ltable.c lobject.c lfunc.c lstate.c 2)  标准库(这个相对简 ...

  3. 多测师讲解jmeter _安装和配置环境(00)_高级讲师肖sir

    1.下载jmeter包,我们已经下载了有现成的: 2.安装jjdk默认安装或自定义安装 默认安装的路径: 如下图 3.第三步:安装完成后配置JDK的环境变量  位置:计算机→属性→高级系统设置→高级→ ...

  4. 从源码的角度解析Mybatis的会话机制

    坐在我旁边的钟同学听说我精通Mybatis源码(我就想不通,是谁透漏了风声),就顺带问了我一个问题:在同一个方法中,Mybatis多次请求数据库,是否要创建多个SqlSession会话? 可能最近撸多 ...

  5. xshell多窗口同时执行输入命令

  6. es7.8启动报错 说是主节点没找到

    p.p1 { margin: 0; font: 11px Menlo; color: rgba(0, 0, 0, 1); background-color: rgba(255, 255, 255, 1 ...

  7. spring boot:shardingsphere+druid多数据源整合seata分布式事务(spring boot 2.3.3)

    一,为什么要给shardingsphere配置多数据源? 1,shardingjdbc默认接管了所有的数据源, 如果我们有多个非分表的库时,则最多只能设置一个为默认数据库, 其他的非分表数据库不能访问 ...

  8. 这份算法攻略,我拿到了5个大厂的offer

    每个时代,都不会亏待会学习的人. 大家好,我是 yes. 我持续在 LeetCode 刷算法题将近有一年半的时间了,这一年半以来我对算法的看法改变了很多,但是实话实说支持我前进的还是面试. 在之前的文 ...

  9. 如何理解码分复用中的码分多址CDMA?

    如何理解CDMA? 推荐参考大神文章 https://blog.csdn.net/dog250/article/details/6420427 (码分多址(CDMA)的本质-正交之美) 首先我们先看& ...

  10. 趣谈多线程(Python版)

    温馨提示:本文篇幅较长,建议读者耐心阅读,本文中的代码经过笔者精心构思,可以复制过去运行一下,观察输出结果,所有代码在python3.5.0中测试通过. 文章目录 What is 多线程? Why w ...