import numpy as np import pandas as pd Pandas will be a major tool of interest throughout(贯穿) much of the rest of the book. It contains data structures and manipulation tools designed to make data cleaning(数据清洗) and analysis fast and easy in Python.…
DataFrame 类型类似于数据库表结构的数据结构,其含有行索引和列索引,可以将DataFrame 想成是由相同索引的Series组成的Dict类型.在其底层是通过二维以及一维的数据块实现. 1.  DataFrame 对象的构建 1.1 用包含等长的列表或者是NumPy数组的字典创建DataFrame对象 In [68]: import pandas as pd In [69]: from pandas import Series,DataFrame # 建立包含等长列表的字典类型 In […
Dataframe DataFrame是一个[表格型]的数据结构,可以看做是[由Series组成的字典](多个series共用同一个索引).DataFrame由按一定顺序排列的多列数据组成.设计初衷是将Series的使用场景从一维拓展到多维.DataFrame既有行索引,也有列索引. 行索引:index 列索引:columns 值:values(numpy的二维数组) dataframe的创建 最常用的方法是传递一个字典或者二维数组的方法创建 DataFrame(data=data,index=…
Series是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,python对象) index查看series索引,values查看series值 series相比于ndarray,是一个自带索引index的数组--> 一维数组 + 对应索引 series和dict相比,series更像是一个有顺序的字典 创建方法 1.由字典创建,字典的key就是index,values就是values dic = {'a':1 ,'b':2 , 'c':3, '4':4, '5':5} s =…
Series:"一维数组" 1. 和一维数组的区别 # Series 数据结构 # Series 是带有标签的一维数组,可以保存任何数据类型(整数,字符串,浮点数,Python对象等),轴标签统称为索引 s = pd.Series(np.random.rand(5)) print(s) #从输出可见区别于数组,有了标签.Series = 一维数组+标签组成 print(type(s)) # 查看数据.数据类型 print(s.index,type(s.index)) print(s.v…
这一次我的学习笔记就不直接用官方文档的形式来写了了,而是写成类似于“知识图谱”的形式,以供日后参考. 下面是所谓“知识图谱”,有什么用呢? 1.知道有什么操作(英文可以不看) 2.展示本篇笔记的结构 3.以后忘记某个函数某个参数时,方便查询   原来写的地方是,那儿的代码看起来会舒服很多: https://www.yuque.com/u86460/dgt6mu/tlywuc      创建 df.Dataframe(data,index) 1.data类型是字典 字典由series构成 >>&…
DataFrame输出的为表的形式,由于要把输出的表格贴上来比较麻烦,在此就不在贴出相关输出结果,代码在jupyter notebook可以顺利运行代码中有相关解释用来加深理解方便记忆 import numpy as np import pandas as pd d = {'one':pd.Series([1,2,3],index=['a','b','c']), 'two':pd.Series([1,2,3,4],index=['a','b','c','d'])} df = pd.DataFra…
range() pytho range() 函数可创建一个整数列表,一般用在 for 循环中. 语法: range(start, stop[, step]) start: 计数从 start 开始.默认是从 0 开始.例如range(5)等价于range(0, 5); end: 计数到 end 结束,但不包括 end.例如:range(0, 5) 是[0, 1, 2, 3, 4]没有5 step:步长,默认为1.例如:range(0, 5) 等价于 range(0, 5, 1) 实例: >>&…
Series是一种类似于一维数组的对象,又一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即是索引)组成. 可以将Series看成是一个定长的有序字段,因为它是索引值到数据值的一个映射. import pandas as pd >>>obj=pd.Series([4,5,6,7])#仅由一组数据(列表,元组)即可产生最简单的Series,索引自动生成,从0开始,可以通过values和index属性获取其数组的表示形式和索引对象 >>> obj 0    4…
03. Pandas数据结构 Series DataFrame 从DataFrame中查询出Series 1. Series Series是一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成. 1.1 仅有数据列表即可产生最简单的Series 1.2 创建一个具有标签索引的Series 1.3 使用Python字典创建Series 1.4 根据标签索引查询数据 类似Python的字典dict 2. DataFrame DataFrame是一个表格型的数…