一、调整索引、修改列标签

1、调整索引的两种情况:

  • 重新索引
  • 设置新的索引

(1)重新索引

  在Pandas对象中,其实索引也是一个对象,所以可对其进行修改。

    例如:df.index=['a','b','c']

>>> df = {'one':pd.Series(np.random.randn(3)),'two':pd.Series(np.random.randn(3)),
'three':pd.Series(np.random.rand(3))}
>>> df = pd.DataFrame(df)
>>> df
one two three
0 -0.996986 0.190981 0.482912
1 -0.233812 -0.140953 0.052706
2 0.470900 0.590664 0.486823 #设置索引
>>> df.index=['a','b','c']
>>> df
one two three
a -0.996986 0.190981 0.482912
b -0.233812 -0.140953 0.052706
c 0.470900 0.590664 0.486823

(2)设置新的索引

  reindex():重新索引并得到一个新的Pandas对象。

  且reindex()方法不仅可以重新索引DataFrame,也可以同时实现过滤功能。

>>> new = df.reindex(['b','c','e'])
>>> new
one two three
b -0.233812 -0.140953 0.052706
c 0.470900 0.590664 0.486823
e NaN NaN NaN

  reindex()也可以用来调整列的顺序,这时需要设定axis参数为'columns'或1;

>>> df.reindex(['three','two','one'],axis='columns')
three two one
a 0.766450 0.452801 1.286715
b 0.342262 1.523188 0.620788
c 0.867786 0.758714 -2.343242

(3)使用set_index()可以指定某一列为索引,这在对日期型数据或者是以名称进行区分的数据非常有用,后期会以实例描述的更为详细。

>>> df.set_index('one')
two three
one
-0.996986 0.190981 0.482912
-0.233812 -0.140953 0.052706
0.470900 0.590664 0.486823

  上述的方法在将某一列设置为索引后,特征不会将该列进行保存,若需要将设置为索引的列保留在数据中,则需要将参数drop设置为False:

  >>> df.set_index('one',drop=False)

                one       two     three
one
1.286715 1.286715 0.452801 0.766450
0.620788 0.620788 1.523188 0.342262
-2.343242 -2.343242 0.758714 0.867786

  若是希望在原来索引的基础之上添加新的变量构成层次化索引,则设置append参数为True;  

  >>>df.set_index('one',append=True)

>>> df
one two three
a 1.286715 0.452801 0.766450
b 0.620788 1.523188 0.342262
c -2.343242 0.758714 0.867786
>>> df.set_index('one',append=True)
two three
one
a 1.286715 0.452801 0.766450
b 0.620788 1.523188 0.342262
c -2.343242 0.758714 0.867786
>>>

2、修改标签

  修改索引和列名的标签可以使用rename()方法结合字典、Series或者一个原函数将标签映射为一个新的标签。

  (1)关于结合字典可以参照3-Pandas之Series和DataFrame区别的第六部分

  (2)使用函数映射的方式

  例:将字符串的大写转换函数传入,对列标签进行修改

>>> df.rename(columns=str.upper)
ONE TWO THREE
a -0.996986 0.190981 0.482912
b -0.233812 -0.140953 0.052706
c 0.470900 0.590664 0.486823

  例:结合lambda:将所有的列的前2个字符大写,其余小写

>>> df.rename(columns=lambda x:x[:2].upper()+x[2:].lower())
ONe TWo THree
a -0.996986 0.190981 0.482912
b -0.233812 -0.140953 0.052706
c 0.470900 0.590664 0.486823

二、创建层次化索引

  层次化索引可以基于Series和DataFrame创建更加高维的数据。

  也就是说,若有一个DataFrame是一个堆积式的(在一个轴上需要创建不止一个索引),那么此时就需要用到层次化索引,这和Panel有些类似。但是在实际中并不是很常用!

创建一个层次化索引:

>>> data=pd.Series(np.random.randn(5),index=[['a','a','b','b','b'],['a1','a2','b1','b2','b3']])
>>> data
a a1 0.792324
a2 -0.650764
b b1 -0.282874
b2 -1.402477
b3 -3.551578
dtype: float64 #查看索引
>>> data.index
MultiIndex(levels=[['a', 'b'], ['a1', 'a2', 'b1', 'b2', 'b3']],
codes=[[0, 0, 1, 1, 1], [0, 1, 2, 3, 4]])
#levels包含了每个级别索引的标签,labels是对每个数据在对应不同levels的位置进行了标记

每个index均有一个属性(名称names),可通过.index.names对索引列的列名进行创建于修改

>>> data.index.names=['first','second']
>>> data
first second
a a1 0.792324
a2 -0.650764
b b1 -0.282874
b2 -1.402477
b3 -3.551578
dtype: float64

三、重排级别顺序

重排级别顺序是基于有索引个数>=1的DataFrame。

(1)swaplevel():将columns轴上的索引级别进行互换。

  >>>df.swaplevel(0,1,axis=1)

(2)reorder_levels():指定多个级别的顺序

(3)提取数据还是可以使用iloc()与loc()

(4)unstack():若index轴上有多个级别索引的DataFrame,使用该方法将指定级别(level参数)安排在columns上形成一个新的DataFrame

7-Pandas之索引调整方法的更多相关文章

  1. pandas重置索引的几种方法探究

    pandas重置索引的几种方法探究 reset_index() reindex() set_index() 函数名字看起来非常有趣吧! 不仅如此. 需要探究. http://nbviewer.jupy ...

  2. Pandas 常见的基本方法

    说明:文章所有内容均截选自实验楼教程[Pandas 使用教程],想要查看教程完整内容,点击教程即可~ 前言: Pandas 是非常著名的开源数据处理工具,我们可以通过它对数据集进行快速读取.转换.过滤 ...

  3. pandas DataFrame的修改方法

    pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...

  4. pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)

    pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...

  5. pandas DataFrame的创建方法

    pandas DataFrame的增删查改总结系列文章: pandas DaFrame的创建方法 pandas DataFrame的查询方法 pandas DataFrame行或列的删除方法 pand ...

  6. pandas.DataFrame的groupby()方法的基本使用

    pandas.DataFrame的groupby()方法是一个特别常用和有用的方法.让我们快速掌握groupby()方法的基础使用,从此数据分析又多一法宝. 首先导入package: import p ...

  7. Pandas | 13 索引和选择数据

    Pandas现在支持三种类型的多轴索引; 编号 索引 描述 1 .loc() 基于标签 2 .iloc() 基于整数 3 .ix() 基于标签和整数 .loc() Pandas提供了各种方法来完成基于 ...

  8. SQL索引优化方法

    SQL索引优化方法 以下是代码片段: ROW_NUMBER() OVER(ORDER BY ResumeCreateTime DESC) as [RowID] ,[TopDegree] ,[Degre ...

  9. (三)pandas 层次化索引

    pandas层次化索引 1. 创建多层行索引 1) 隐式构造 最常见的方法是给DataFrame构造函数的index参数传递两个或更多的数组 Series也可以创建多层索引 import numpy ...

随机推荐

  1. Raft论文《 In Search of an Understandable Consensus Algorithm (Extended Version) 》研读

    Raft 论文研读 说明:本文为论文 < In Search of an Understandable Consensus Algorithm (Extended Version) > 的 ...

  2. css3常见好看的投影效果_css3阴影box-shadow高大上用法

    在设计图会经常使用到的阴影效果,如何用css3来实现呢?这篇文章主要整理box-shadow的一些好看常用的投影效果. 1.曲面/椭圆投影效果: 代码如下: <style> .shadow ...

  3. CSS3样式_实现字体发光效果

    text-shadow 属性仅仅是用来设置文本阴影的,似乎并不能实现字体发光效果.其实不然,这正是 text-shadow 属性的精妙之处.当阴影的水平偏移量和垂直偏移量都为0时,阴影就和文本重合了. ...

  4. windows dos 批量重命名文件

    描述 在工作中经常出现 在同一目录下有一些 很多相同扩展名的文件但是名字看起来很乱各不同,我们想将它们统一重命名一下统一的格式,如果一个个去改名字太麻烦了. 这里我门就可以使用windows下 dos ...

  5. scrapy 基础组件专题(十四):scrapy CookiesMiddleware源码

    一 Scrapy框架--cookie的获取/传递/本地保存 1. 完成模拟登陆2. 登陆成功后提取出cookie,然后保存到本地cookie.txt文件中3. 再次使用时从本地的cookie.txt中 ...

  6. web 部署专题(三):压力测试(一)工具 siege

    1.介绍 Siege是一个压力测试和评测工具,设计用于WEB开发这评估应用在压力下的承受能力:可以根据配置对一个WEB站点进行多用户的并发访问,记录每个用户所有请求过程的相应时间,并在一定数量的并发访 ...

  7. Odoo13之在tree视图左上角添加自定义按钮

    前言 首先展示效果图,如下图所示,在资产设备模块tree视图的左上角添加了一个同步资产的按钮. 要完成按钮的添加,分为四步,分别是: 1.编写xml文件,找到相关模型tree视图,并给模型tree视图 ...

  8. Shaderlab-10chapter-立方体纹理、玻璃效果

    10.1.1天空盒子 window - Lighting - skyMaterial 创建mat,shader选自带的6 side shader 确保相机选skybox 如果某个相机需要覆盖,添加sk ...

  9. Java常用API(Scanner类)

    Java常用API( Scanner类)1 1.Scanner类 首先给大家介绍一下什么是JavaAPI API(Application Programming Interface),应用程序编程接口 ...

  10. 用maven打包java项目的pom文件配置

    <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/20 ...