算术运算和数据对齐 Series和DataFrame中行运算和列运算有种特征叫做广播 在将对象相加时,如果存在不同的索引对,则结果的索引就是该索引对的并集.自动的数据对齐操作在不重叠的索引处引入了NA值,NA值在算术运算中过程中传播. import pandas as pd from pandas import Series import numpy as np s1 = Series([7.3,-2.5,3.4,1.5],index=['a','c','d','e']) s2 = Series…
http://blog.csdn.net/pipisorry/article/details/53486777 pandas高级功能:面板数据.字符串方法.分类.可视化. 面板数据 {pandas数据结构有一维Series,二维DataFrame,这是三维Panel}pandas有一个Panel数据结构,可以将其看做一个三维版的,可以用一个由DataFrame对象组成的字典或一个三维ndarray来创建Panel对象:import pandas.io.data as webpdata = pd.…
Pandas之Dataframe索引,排序,统计,重新设置索引 一:叠加 import pandas as pd a_list = [df1,df2,df3] add_data = pd.concat(a_list,ignore_index = True) 其中的ignore_index参数代表是否重新建立索引. 如果df比较多,可以采用如下方法建立a_list a_list = [] for i in range(len(df)): a_list.append(df[i]) 二:排序 df.s…
Pandas基本功能详解 Pandas  Pandas基本功能详解 |轻松玩转Pandas(2) 参考:Pandas基本功能详解 |轻松玩转Pandas(2)…
根据条件对数据集排序(sorting)也是一种重要的内置运算.要对行或列索引进行排序(按字典顺序), 可使用sort_index 方法, 它将返回一个已排序的新对象: 而DataFrame, 则可以根据任意一个轴上的索引进行排序: 降序 数据默认是按照升序排序的, 但也可以安装降序排序 按值排序 如果有缺失值呢 求唯一值排序和频率排序 Dataframe指定某列的值进行排序,by选项 那么如果多个呢? 排名 排名(ranking ) 跟排序关系密切, 且它会增设一个排名值(从1开始, 一直到数组…
1.读取.csv文件 df2 = pd.read_csv('beijingsale.csv', encoding='gb2312',index_col='id',sep='\t',header=None) 参数解析见:https://www.cnblogs.com/datablog/p/6127000.html index_col用于指定用作行索引的列编号或者列名,sep用于指定文件的分隔符(默认是以,作为分隔符),header=None 不用文件的的第一行作为列索引 文件读取之后生成的是一个D…
层次化索引 层次化也就是在一个轴上拥有多个索引级别 Series的层次化索引 data=Series(np.random.randn(10),index=[ ['a','a','a','b','b','b','c','c','d','d'], [1,2,3,1,2,3,1,2,2,3] ]) data a 1 0.965999 2 -0.271733 3 0.133910 b 1 -0.806885 2 -0.622905 3 -0.355330 c 1 -0.659194 2 -1.08287…
重新索引 reindex重置索引,如果索引值不存在,就引入缺失值 参数介绍 参数 说明 index 用作索引的新序列 method 插值 fill_vlaue 引入缺失值时的替代NaN limit 最大填充量 level 指定级别上匹配简单索引,否则选取子集 copy 默认为True 实例: import pandas as pd import numpy as np from pandas import Series obj = Series([4.5,7.2,-5.3,3.6],index=…
用Python做数据分析,涉及到的函数实在是太多了,容易忘记,去网上查中文基本上差不到,英文有时候描述不清楚问题. 这里搞个针对个人习惯的函数汇总速查手册,下次需要用一个什么功能,就在这里面查到对应的函数名字,然后取搜索具体用法.随时更新. Numpy 创建: 创建一个随机数组x*y: np.empty(x,y) 产生随机数组,产生指定大小随机数组,指定范围随机数组,均匀分布,数组元素在0到1之间 np.random.uniform(0,100,size=5) -----------Pandas…
在日常工作中,使用Python时经常要引入一些集成好的第三方功能模块,如读写excel的xlrd和xlwt模块,以及数据分析常用的pandas模块等. 原生的python并不含这些模块,在使用这些功能之前必须要先安装这些功能模块. 一.安装python环境 官网下载地址:https://www.python.org/downloads/.windows环境下直接下载exe的可执行文件,按步骤进行安装即可.安装完成后,将安装目录的路径配置到环境变量中的path内容中即可. 二.安装easyinst…