pandas之数据选择

pandas中有三种索引方法：.loc，.iloc和[]，注意：.ix的用法在0.20.0中已经不建议使用了

import pandas as pd

import numpy as np

In [5]:

dates = pd.date_range("20170101",periods=6)

df1 = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=["A","B","C","D"])

df1

Out[5]:

	A	B	C	D
2017-01-01	0	1	2	3
2017-01-02	4	5	6	7
2017-01-03	8	9	10	11
2017-01-04	12	13	14	15
2017-01-05	16	17	18	19
2017-01-06	20	21	22	23

In [6]:

将dataframe的列获取为一个series

df1["A"]#将dataframe的列获取为一个series

Out[6]:

2017-01-01     0

2017-01-02     4

2017-01-03     8

2017-01-04    12

2017-01-05    16

2017-01-06    20

Freq: D, Name: A, dtype: int32

In [7]:

df1.A#另一种获取

Out[7]:

2017-01-01     0

2017-01-02     4

2017-01-03     8

2017-01-04    12

2017-01-05    16

2017-01-06    20

Freq: D, Name: A, dtype: int32

In [8]:

切片，获取前2行

df1[0:2]#切片，获取前2行

Out[8]:

	A	B	C	D
2017-01-01	0	1	2	3
2017-01-02	4	5	6	7

In [9]:

通过索引获取指定行

df1["20170102":"20170104"]#通过索引获取指定行

Out[9]:

	A	B	C	D
2017-01-02	4	5	6	7
2017-01-03	8	9	10	11
2017-01-04	12	13	14	15

In [11]:

通过标签选择数据

#通过标签选择数据

df1.loc["20170102"]

Out[11]:

A    4

B    5

C    6

D    7

Name: 2017-01-02 00:00:00, dtype: int32

In [12]:

提取某个行的指定列

df1.loc["20170102",["A","C"]]#提取某个行的指定列

Out[12]:

A    4

C    6

Name: 2017-01-02 00:00:00, dtype: int32

In [13]:

df1.loc[:,["A","B"]]

Out[13]:

	A	B
2017-01-01	0	1
2017-01-02	4	5
2017-01-03	8	9
2017-01-04	12	13
2017-01-05	16	17
2017-01-06	20	21

In [14]:

通过位置选择数据

#通过位置选择数据

df1.iloc[2]#提取第二行

Out[14]:

A     8

B     9

C    10

D    11

Name: 2017-01-03 00:00:00, dtype: int32

In [15]:

df1.iloc[1:3,2:4]

Out[15]:

	C	D
2017-01-02	6	7
2017-01-03	10	11

In [18]:

提取不连续的行和列

#提取不连续的行和列

df1.iloc[[1,2,4],[1,3]]

Out[18]:

	B	D
2017-01-02	5	7
2017-01-03	9	11
2017-01-05	17	19

In [20]:

#混合标签位置选择

df1.ix[2:4,["A","C"]]

c:\users\wuzs\appdata\local\programs\python\python36-32\lib\site-packages\ipykernel_launcher.py:2: FutureWarning:

.ix is deprecated. Please use

.loc for label based indexing or

.iloc for positional indexing

See the documentation here:

http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#ix-indexer-is-deprecated

c:\users\wuzs\appdata\local\programs\python\python36-32\lib\site-packages\pandas\core\indexing.py:808: FutureWarning:

.ix is deprecated. Please use

.loc for label based indexing or

.iloc for positional indexing

See the documentation here:

http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#ix-indexer-is-deprecated

  retval = getattr(retval, self.name)._getitem_axis(key, axis=i)

Out[20]:

	A	C
2017-01-03	8	10
2017-01-04	12	14

In [23]:

df1.ix["20170102":"20170104",2:4]

c:\users\wuzs\appdata\local\programs\python\python36-32\lib\site-packages\ipykernel_launcher.py:1: FutureWarning:

.ix is deprecated. Please use

.loc for label based indexing or

.iloc for positional indexing

See the documentation here:

http://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#ix-indexer-is-deprecated

  """Entry point for launching an IPython kernel.

Out[23]:

	C	D
2017-01-02	6	7
2017-01-03	10	11
2017-01-04	14	15

In [24]:

判断某一行的值大小

#判断某一行的值大小

df1.A >6

Out[24]:

2017-01-01    False

2017-01-02    False

2017-01-03     True

2017-01-04     True

2017-01-05     True

2017-01-06     True

Freq: D, Name: A, dtype: bool

In [25]:

df1[df1.A>6]#根据判断组成新的DataFrame

Out[25]:

	A	B	C	D
2017-01-03	8	9	10	11
2017-01-04	12	13	14	15
2017-01-05	16	17	18	19
2017-01-06	20	21	22	23

In [ ]:

pandas之数据选择的更多相关文章

Pandas:DataFrame数据选择方法（索引）
#首先创建我们的Series对象,然后合并到dataframe对象里面去 import pandas as pd import numpy as np area=pd.Series({,,,}) po ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...
【转载】使用Pandas创建数据透视表
使用Pandas创建数据透视表本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas创建数据透视表目录 pandas.pivot_table() 创建简单的数据透视表增加一个行维度(inde ...
基于pandas进行数据预处理
很久没用pandas,有些有点忘了,转载一个比较完整的利用pandas进行数据预处理的博文:https://blog.csdn.net/u014400239/article/details/70846 ...
pandas 新增数据列（直接赋值、apply，assign、分条件赋值）
# pandas新增数据列(直接赋值.apply.assign.分条件赋值) # pandas在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析 # 1 直接赋值 # 2 df. ...
python-数据描述与分析2（利用Pandas处理数据缺失值的处理数据库的使用）
2.利用Pandas处理数据2.1 汇总计算当我们知道如何加载数据后,接下来就是如何处理数据,虽然之前的赋值计算也是一种计算,但是如果Pandas的作用就停留在此,那我们也许只是看到了它的冰山一角,它 ...
利用Python进行数据分析(12) pandas基础: 数据合并
pandas 提供了三种主要方法可以对数据进行合并: pandas.merge()方法:数据库风格的合并: pandas.concat()方法:轴向连接,即沿着一条轴将多个对象堆叠到一起: 实例方法c ...
【转载】使用Pandas进行数据提取
使用Pandas进行数据提取本文转载自:蓝鲸的网站分析笔记原文链接:使用python进行数据提取目录 set_index() ix 按行提取信息按列提取信息按行与列提取信息提取特定日期的信 ...
【转载】使用Pandas进行数据匹配
使用Pandas进行数据匹配本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas进行数据匹配目录 merge()介绍 inner模式匹配 lefg模式匹配 right模式匹配 outer模式 ...

随机推荐

网络基础篇之NAT（原理）
一.NAT的产生由于网络的飞速发展和网络应用的极速增多,致使IPv4可用地址空间逐渐枯竭.尽管IPv6可以在根本上解决地址枯竭问题,但IPv4发展到IPv6还需要一个过渡,而这便产生了NAT. 二. ...
[转] - Linux中使用alternatives切换Jdk版本
1. 准备JDK包,分别是1.7和1.8,jdk-7u79-linux-x64.tar.gz和jdk-8u161-linux-x64.gz: 2. 解压,解压后的目录结构如图所示: JDK1.7: J ...
EEPROM原理详解
EEPROM(Electrically Erasable Programmable read only memory)即电可擦可编程只读存储器,是一种掉电后数据不丢失(不挥发)存储芯片. EERPOM ...
eclipse集成springboot 插件（离线安装，含解决Cannot complete the install because one or more required items could）
版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/li18310727696/article/details/81071002首先,确认eclipse的 ...
7.JVM技术_java监控工具使用
1.java监控工具使用 2.jconsole jconsole是一种集成了上面所有命令功能的可视化工具,可以分析jvm的内存使用情况和线程等信息 2.1.启动jconsole 通过JDK/bin目录 ...
MyBatis-01-简介
基础知识: JDBC Mysql Java基础 Maven Junit 框架:是有配置文件的.最好的方式:看官网文档 1.简介 1.1.什么是MyBatis 简介什么是 MyBatis? MyBat ...
nginx第七天
nginx的proxy_buffering和proxy_cache 两个都是nginx代理中内存设置相关的参数. proxy_buffering设置 proxy_buffering主要是实现被代理服务 ...
TXNLP 01-09
一般涉及生成文本都是比较难的.
【备忘录】ORACLE数据库每日计划EXPDP备份
1.OracleBackup_expdp版本|oracle.bat文件还需手动更改的内容如下: 调用格式需改成call %~dp0\OracleBackup 数据库用户名密码文件夹名称 ...
BSGS 扩展大步小步法解决离散对数问题 (BZOJ 3239: Discrete Logging// 2480: Spoj3105 Mod)
我先转为敬? orz% miskcoo 贴板子 BZOJ 3239: Discrete Logging//2480: Spoj3105 Mod(两道题输入不同,我这里只贴了3239的代码) CODE ...