在对Series对象和DataFrame对象进行索引的时候要明确这么一个概念:是使用下标进行索引,还是使用关键字进行索引。比如list进行索引的时候使用的是下标,而dict索引的时候使用的是关键字。

使用下标索引的时候下标总是从0开始的,而且索引值总是数字。而使用关键字进行索引,关键字是key里面的值,既可以是数字,也可以是字符串等。

Series对象介绍:

Series对象是由索引index和值values组成的,一个index对应一个value。其中index是pandas中的Index对象。values是numpy中的数组对象。

  1. import pandas as pd
  2. s1 = pd.Series([2,3,4,5], index=['a', 'b', 'c', 'd'])
  3. print(s1)
  4. 结果:
  5. a 2
  6. b 3
  7. c 4
  8. d 5
  9. dtype: int64
  10.  
  11. print(s1.index)
  12. 结果:
  13. Index(['a', 'b', 'c', 'd'], dtype='object')
  14.  
  15. print(s1.values)
  16. 结果:
  17. [2 3 4 5]

如何对Series对象进行索引?

1:使用index中的值进行索引

  1. print(s1['a'])
  2. 结果:
  3. 2
  4.  
  5. print(s1[['a','d']])
  6. 结果:
  7. a 2
  8. d 5
  9. dtype: int64
  10.  
  11. print(s1['b':'d'])
  12. 结果(注意,切片索引保存最后一个值):
  13. b 3
  14. c 4
  15. d 5
  16. dtype: int64

2:使用下标进行索引

  1. print(s1[0])
  2. 结果:
  3. 2
  4.  
  5. print(s1[[0,3]])
  6. 结果:
  7. a 2
  8. d 5
  9. dtype: int64
  10.  
  11. print(s1[1:3])
  12. 结果(注意:这里和上面不同的是不保存最后一个值,与正常索引相同):
  13. b 3
  14. c 4
  15. dtype: int64

3:特殊情况:

上面的index为字符串,假如index为数字,这个时候进行索引是按照index值进行还是按照下标进行?

  1. s1 = pd.Series([2,3,4,5], index=[1,2,3,4])
  2. print(s1[2])
  3. 结果:
  4. 3
  5. print(s1[0]) 会报错
  6.  
  7. print(s1[[2,4]])
  8. 结果:
  9. 2 3
  10. 4 5
  11. dtype: int64
  12.  
  13. print(s1[1:3])
  14. 结果:
  15. 2 3
  16. 3 4
  17. dtype: int64

可以看出来,当index为整数的时候,那么前两种选择是使用index的值进行索引, 而后一种切片选择使用的是下标进行索引。

4:使用布尔Series进行索引

使用布尔Series进行索引的时候,其实是要求布尔Series和我们的索引对象有相同的index。

  1. s1 = pd.Series([2,3,4,5], index=['a', 'b', 'c', 'd']
  1. print(s1 > 3)
  2. 结果(这是一个bool Series):
  3. a False
  4. b False
  5. c True
  6. d True
  7. dtype: bool
  8.  
  9. print(s1[s1 > 3])
  10. 结果(只需要把bool Series 传入Series就可以实现索引):
  11. c 4
  12. d 5
  13. dtype: int64

5:使用Index对象来进行索引

使用Index对象进行索引的时候,和使用值索引没有本质的区别。因为Index里面也存入了很多值,可以把Index看做一个list。

DataFrame对象介绍:

DataFrame对象是一个由行列组成的表。DataFrame中行由columns组成,列由index组成,它们都是Index对象。它的值还是numpy数组。

  1. data = {'name':['ming', 'hong', 'gang', 'tian'], 'age':[12, 13, 14, 20], 'score':[80.3, 88.2, 90, 99.9]}
  2. df1 = pd.DataFrame(data)
  3.  
  4. print(df1.index)
  5. 结果:
  6. RangeIndex(start=0, stop=4, step=1)
  7.  
  8. print(df1.columns)
  9. 结果:
  10. Index(['age', 'name', 'score'], dtype='object')
  11.  
  12. print(df1.values)
  13. 结果:
  14. [[12 'ming' 80.3]
  15. [13 'hong' 88.2]
  16. [14 'gang' 90.0]
  17. [20 'tian' 99.9]]

如何对DataFrame对象进行索引

1:使用columns的值对列进行索引

直接使用columns中的值进行索引,得到的是一列或者是多列的值

  1. print(df1['name'])
  2. 结果:
  3. 0 ming
  4. 1 hong
  5. 2 gang
  6. 3 tian
  7. Name: name, dtype: object
  8.  
  9. print(df1[['name','age']])
  10. 结果:
  11. name age
  12. 0 ming 12
  13. 1 hong 13
  14. 2 gang 14
  15. 3 tian 20
  1.  
  1. 注意:不可以直接使用下标对列进行索引,除非该columns当中包含该值。如下面的操作是错误的
  1. print(df1[0])
  1. 结果: 错误
  1.  

2:切片或者布尔Series对行进行索引

使用切片索引,或者布尔类型Series进行索引:

  1. print(df1[0:3])
  2. 使用切片进行选择,结果:
  3. age name score
  4. 0 12 ming 80.3
  5. 1 13 hong 88.2
  6. 2 14 gang 90.0
  7.  
  8. print(df1[ df1['age'] > 13 ])
  9. 使用布尔类型Series进行索引,其实还是要求布尔SeriesDataFrame有相同的index,结果:
  10. age name score
  11. 2 14 gang 90.0
  12. 3 20 tian 99.9
  1.  

3:使用loc和iloc进行索引

本质上loc是用index和columns当中的值进行索引,而iloc是不理会index和columns当中的值的,永远都是用从0开始的下标进行索引。所以当你搞懂这句话的时候,下面的索引就会变得非常简单:

  1. print(df1.loc[3])
  2. 结果:
  3. name hong
  4. score 88.2
  5. Name: 3, dtype: object
  6.  
  7. print(df1.loc[:,'age'])
  8. 结果:
  9. 1 12
  10. 3 13
  11. 4 14
  12. 5 20
  13. Name: age, dtype: int64
  14.  
  15. print(df1.iloc[3])
  16. 结果:
  17. age 20
  18. name tian
  19. score 99.9
  20. Name: 5, dtype: object
  21.  
  22. print(df1.iloc[:,1])
  23. 结果:
  24. 1 ming
  25. 3 hong
  26. 4 gang
  27. 5 tian
  28. Name: name, dtype: object

Pandas中Series和DataFrame的索引的更多相关文章

  1. Python之Pandas中Series、DataFrame

    Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...

  2. Python之Pandas中Series、DataFrame实践

    Python之Pandas中Series.DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一 ...

  3. [Python] Pandas 中 Series 和 DataFrame 的用法笔记

    目录 1. Series对象 自定义元素的行标签 使用Series对象定义基于字典创建数据结构 2. DataFrame对象 自定义行标签和列标签 使用DataFrame对象可以基于字典创建数据结构 ...

  4. pandas中series和dataframe之间的区别

    series结构有索引,和列名组成,如果没有,那么程序会自动赋名为None series的索引名具有唯一性,索引可以数字和字符,系统会自动将他们转化为一个类型object. dataframe由索引和 ...

  5. Pandas中Series与Dataframe的区别

    1. Series Series通俗来讲就是一维数组,索引(index)为每个元素的下标,值(value)为下标对应的值 例如: arr = ['Tom', 'Nancy', 'Jack', 'Ton ...

  6. Pandas中Series与Dataframe的初始化

    (一)Series初始化 1.通过列表,index自动生成 se = pd.Series(['Tom', 'Nancy', 'Jack', 'Tony']) print(se) 2.通过列表,指定in ...

  7. pandas学习series和dataframe基础

    PANDAS 的使用 一.什么是pandas? 1.python Data Analysis Library 或pandas 是基于numpy的一种工具,该工具是为了解决数据分析人物而创建的. 2.p ...

  8. 利用Python进行数据分析(7) pandas基础: Series和DataFrame的简单介绍

    一.pandas 是什么 pandas 是基于 NumPy 的一个 Python 数据分析包,主要目的是为了数据分析.它提供了大量高级的数据结构和对数据处理的方法. pandas 有两个主要的数据结构 ...

  9. pandas中的数据结构-DataFrame

    pandas中的数据结构-DataFrame DataFrame是什么? 表格型的数据结构 DataFrame 是一个表格型的数据类型,每列值类型可以不同 DataFrame 既有行索引.也有列索引 ...

随机推荐

  1. OGG相关操作

    参数文件详解: 1)truncate ogg 进程: Manager进程:manager进程是配置在源端和目标端 Extract(抽取)进程:部署在源端,用于捕获数据表或者日志中的数据文件: Pump ...

  2. 70.如何在xilinx SDK中显示行号

    Window→preferences→editor→test editor 对ecilpse的通用方法 打开Eclipse软件,在菜单中选择窗口——首选项,打开新的窗口. 在新的窗口中依次选择常规—— ...

  3. spring web 生命周期理解

    spring web /bean 生命周期 反射注解 aop代理类生成 init servlet  初始化 load spring-context.xml load XmlParser 类解析对象   ...

  4. ssh修改端口号并进行远程访问

    ssh的访问如果都利用22端口,则会容易被攻击,修改一个端口号可增强一定的安全性 1. 修改配置文件sshd_config里端口号 [root@test ~]# vi /etc/ssh/sshd_co ...

  5. ubuntu16.04 安装 python3.6, 并创建虚拟环境(使用python3.6)

    ubuntu16.04 安装 python3.6, 并创建虚拟环境(使用python3.6) ubuntu16.04中默认安装了 python2.7 python3 python3.5.2 (注意 : ...

  6. 20180830 安装git时报错,

    安装:https://blog.csdn.net/u013256816/article/details/54743470 解决问题:https://blog.csdn.net/daojibruce/a ...

  7. mysql触发器(Trigger)简明总结和使用实例

    一,什么触发器 1,个人理解触发器,从字面来理解,一触即发的一个器,简称触发器(哈哈,个人理解),举个例子吧,好比天黑了,你开灯了,你看到东西了.你放炮仗,点燃了,一会就炸了.2,官方定义触发器(tr ...

  8. 关于JavaScript中实现继承,及prototype属性

    感谢Mozilla 让我弄懂继承. JavaScript有八种基本类型,函数属于object.所以所有函数都继承自object.//扩展:对象,基本上 JavaScript 里的任何东西都是对象,而且 ...

  9. golang-goroutine和channel

    goroutine 在go语言中,每一个并发的执行单元叫做一个goroutine 这里说到并发,所以先解释一下并发和并行的概念: 并发:逻辑上具备同时处理多个任务的能力 并行:物理上在同一时刻执行多个 ...

  10. c#元组举例

    元组的概要: 数组合并了相同类型的对象,而元组合并了不同类型的对象.元组起源于函数编程语言(如F#) ,在 这些语言中频繁使用元组.在N盯4中,元组可通过.NET Fmmework用于所有的NET语言 ...