pandas数据结构之DataFrame笔记】的更多相关文章

DataFrame输出的为表的形式,由于要把输出的表格贴上来比较麻烦,在此就不在贴出相关输出结果,代码在jupyter notebook可以顺利运行代码中有相关解释用来加深理解方便记忆 import numpy as np import pandas as pd d = {'one':pd.Series([1,2,3],index=['a','b','c']), 'two':pd.Series([1,2,3,4],index=['a','b','c','d'])} df = pd.DataFra…
DataFrame 类型类似于数据库表结构的数据结构,其含有行索引和列索引,可以将DataFrame 想成是由相同索引的Series组成的Dict类型.在其底层是通过二维以及一维的数据块实现. 1.  DataFrame 对象的构建 1.1 用包含等长的列表或者是NumPy数组的字典创建DataFrame对象 In [68]: import pandas as pd In [69]: from pandas import Series,DataFrame # 建立包含等长列表的字典类型 In […
这一次我的学习笔记就不直接用官方文档的形式来写了了,而是写成类似于“知识图谱”的形式,以供日后参考. 下面是所谓“知识图谱”,有什么用呢? 1.知道有什么操作(英文可以不看) 2.展示本篇笔记的结构 3.以后忘记某个函数某个参数时,方便查询   原来写的地方是,那儿的代码看起来会舒服很多: https://www.yuque.com/u86460/dgt6mu/tlywuc      创建 df.Dataframe(data,index) 1.data类型是字典 字典由series构成 >>&…
Dataframe DataFrame是一个[表格型]的数据结构,可以看做是[由Series组成的字典](多个series共用同一个索引).DataFrame由按一定顺序排列的多列数据组成.设计初衷是将Series的使用场景从一维拓展到多维.DataFrame既有行索引,也有列索引. 行索引:index 列索引:columns 值:values(numpy的二维数组) dataframe的创建 最常用的方法是传递一个字典或者二维数组的方法创建 DataFrame(data=data,index=…
Panel创建的是三维的表 items:坐标轴0,索引对应的元素是一个DataFrame major_axis:坐标轴1,DataFrame里的行标签 minor_axis:坐标轴2,DataFrame里的列标签 下面看一下一些代码演练 import numpy as np import pandas as pd data = {'Item1':pd.DataFrame(np.random.randn(4,3)), 'Item2':pd.DataFrame(np.random.randn(4,2…
对Series的理解也源于对其相关的代码操作,本次仅贴一些代码来加深理解以及记忆 import pandas as pd import numpy as np s = pd.Series(np.random.randn(5),index=['a','b','c','d','e']) # index添加行索引 s # 输出 a 1.752127 b 0.127374 c 0.581114 d 0.466064 e -1.493042 dtype: float64 s.index # 输出 Inde…
03. Pandas数据结构 Series DataFrame 从DataFrame中查询出Series 1. Series Series是一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成. 1.1 仅有数据列表即可产生最简单的Series 1.2 创建一个具有标签索引的Series 1.3 使用Python字典创建Series 1.4 根据标签索引查询数据 类似Python的字典dict 2. DataFrame DataFrame是一个表格型的数…
1. Series Series 是一个类数组的数据结构,同时带有标签(lable)或者说索引(index). 1.1 下边生成一个最简单的Series对象,因为没有给Series指定索引,所以此时会使用默认索引(从0到N-1). # 引入Series和DataFrameIn [16]: from pandas import Series,DataFrame In [17]: import pandas as pd In [18]: ser1 = Series([1,2,3,4]) In [19…
"二维数组"Dataframe:是一个表格型的数据结构,包含一组有序的列,其列的值类型可以是数值.字符串.布尔值等. Dataframe中的数据以一个或多个二维块存放,不是列表.字典或一维数组结构. 1. Dataframe的数据结构 # Dataframe 数据结构 # Dataframe是一个表格型的数据结构,“带有标签的二维数组”. # Dataframe带有index(行标签)和columns(列标签) data = {'name':['Jack','Tom','Mary'],…
pandas数据结构 pandas处理3种数据结构,它们建立在numpy数组之上,所以运行速度很快: 1.系列(Series) 2.数据帧(DataFrame) 3.面板(Panel) 关系: 数据结构 维数 描述 系列 1 1D标记均匀数组,大小不变. 数据帧 2 一般2D标记,大小可变的表结构与潜在的异质类型的列. 面板 3 一般3D标记,大小可变数组. 可以理解为高维数据结构是低维数据结构的容器.   所有数据结构的值都是可变的,系列大小不可变,其他数据结构大小可变.…