【转载】pandas常用函数】的更多相关文章

原文链接:https://www.cnblogs.com/rexyan/p/7975707.html 一.import语句 import pandas as pd import numpy as np import matplotlib.pyplot as plt import datetime import re 二.文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名,0,1,2,3... names=['A', 'B', '…
shift函数是对数据进行移动的操作,假如现在有一个DataFrame数据df,如下所示: index value1 A 0 B 1 C 2 D 3 那么如果执行以下代码: df.shift() 就会变成如下: index value1 A NaN B 0 C 1 D 2 看一下函数原型: DataFrame.shift(periods=1, freq=None, axis=0) 参数: periods:类型为int,表示移动的幅度,可以是正数,也可以是负数,默认值是1,1就表示移动一次,注意这…
diff函数是用来将数据进行某种移动之后与原数据进行比较得出的差异数据,举个例子,现在有一个DataFrame类型的数据df,如下: index value1 A 0 B 1 C 2 D 3 如果执行: df.diff() 则会得到: index value1 A NaN B 1 C 1 D 1 怎么得到的呢,其实是经过了两个步骤,首先会执行: df.shift() 然后再将该数据与原数据做差,即: df.shift()-df 函数原型: DataFrame.diff(periods=1, ax…
pandas常用函数整理,作为个人笔记. 仅标记函数大概用途做索引用,具体使用方式请参照pandas官方技术文档. 约定 from pandas import Series, DataFrame import pandas as pd import numpy as np 带.的为Series或者DataFrame对象的方法,只列举了部分关键字参数. 1.基础 .values 获取值,返回array对象 .index 获取(行)索引,返回索引对象 Series( index=) 创建Series…
一.Pandas Python Data Analysis Library或Pandas是基于NumPy的一种工具,该工具是为了解决数据分析任务而创建的.Pandas纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具.Pandas提供了大量能使我们快速便捷地处理数据的函数和方法. 二.Series Series是一维数组,与Numpy中的一维array类似.二者与Python基本的数据结构List也很相近,其区别是List中的元素可以是不同的数据类型,而Array和Serie…
1. df.head(n): 显示数据前n行,不指定n,df.head则会显示所有的行 2. df.columns.values获取所有列索引的名称 3. df.column_name: 直接获取列column_name的数据 4. pd.unique(Series)获取Series中元素的唯一值(即去掉重复的) 注意和nunique的区别,nunique只作用于Series,用法是Series.nunique() 可以看得出,nuinque()是查看该序列(axis=0/1对应着列或行)的不同…
1. df.head(n): 显示数据前n行,不指定n,df.head则会显示所有的行 2. df.columns.values获取所有列索引的名称 3. df.column_name: 直接获取列column_name的数据 4. pd.unique(Series)获取Series中元素的唯一值(即去掉重复的) 注意和nunique的区别,nunique只作用于Series,用法是Series.nunique() 可以看得出,nuinque()是查看该序列(axis=0/1对应着列或行)的不同…
文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名,0,1,2,3... names=['A', 'B', 'C'...] 自定义列名 index_col='A'|['A', 'B'...] 给索引列指定名称,如果是多重索引,可以传list skiprows=[0,1,2] 需要跳过的行号,从文件头0开始,skip_footer从文件尾开始 nrows=N 需要读取的行数,前N行 chunksize=M 返回迭代类型TextFi…
一.rename,更改df的列名和行索引 df=pd.DataFrame(np.arange(,).reshape(,)) print(df) print(type(df)) 结果为: <class 'pandas.core.frame.DataFrame'> my_col=dict(zip(range(),['A','B','C'])) df.rename(columns=my_col,inplace=True) print(df) print(type(df)) 结果为: A B C &l…