Pandas排序

Pandas有两种排序方式，它们分别是 -

按标签
按实际值

下面来看看一个输出的例子。

import pandas as pd

import numpy as np

unsorted_df=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],colu

mns=['col2','col1'])

print (unsorted_df)

Python

执行上面示例代码，得到以下结果 -

       col2      col1

1  1.069838  0.096230

4 -0.542406 -0.219829

6 -0.071661  0.392091

2  1.399976 -0.472169

3  0.428372 -0.624630

5  0.471875  0.966560

9 -0.131851 -1.254495

8  1.180651  0.199548

0  0.906202  0.418524

7  0.124800  2.011962

Shell

在unsorted_df数据值中，标签和值未排序。下面来看看如何按标签来排序。

按标签排序

使用sort_index()方法，通过传递axis参数和排序顺序，可以对DataFrame进行排序。默认情况下，按照升序对行标签进行排序。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=unsorted_df.sort_index()

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

       col2      col1

0  0.431384 -0.401538

1  0.111887 -0.222582

2 -0.166893 -0.237506

3  0.476472  0.508397

4  0.670838  0.406476

5  2.065969 -0.324510

6 -0.441630  1.060425

7  0.735145  0.972447

8 -0.051904 -1.112292

9  0.134108  0.759698

Shell

排序顺序

通过将布尔值传递给升序参数，可以控制排序顺序。来看看下面的例子来理解一下。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df = unsorted_df.sort_index(ascending=False)

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

       col2      col1

9  0.750452  1.754815

8  0.945238  2.079394

7  0.345238 -0.162737

6 -0.512060  0.887094

5  1.163144  0.595402

4 -0.063584 -0.185536

3 -0.275438 -2.286831

2 -1.504792 -1.222394

1  1.031234 -1.848174

0 -0.615083  0.784086

Shell

按列排列

通过传递axis参数值为0或1，可以对列标签进行排序。默认情况下，axis = 0，逐行排列。来看看下面的例子来理解这个概念。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=unsorted_df.sort_index(axis=1)

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

       col1      col2

1 -0.997962  0.736707

4  1.196464  0.703710

6 -0.387800  1.207803

2  1.614043  0.356389

3 -0.057181 -0.551742

5  1.034451 -0.731490

9 -0.564355  0.892203

8 -0.763526  0.684207

0 -1.213615  1.268649

7  0.316543 -1.450784

Shell

按值排序

像索引排序一样，sort_values()是按值排序的方法。它接受一个by参数，它将使用要与其排序值的DataFrame的列名称。

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = unsorted_df.sort_values(by='col1')

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

Shell

注意：观察上面的输出结果，col1值被排序，相应的col2值和行索引将随col1一起改变。因此，它们看起来没有排序。

通过by参数指定需要列值，参考以下示例代码 -

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = unsorted_df.sort_values(by=['col1','col2'])

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

   col1  col2

2     1     2

1     1     3

3     1     4

0     2     1

Shell

排序算法

sort_values()提供了从mergeesort，heapsort和quicksort中选择算法的一个配置。Mergesort是唯一稳定的算法。参考以下示例代码 -

import pandas as pd

import numpy as np

unsorted_df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = unsorted_df.sort_values(by='col1' ,kind='mergesort')

print (sorted_df)

Python

执行上面示例代码，得到以下结果 -

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

Pandas排序的更多相关文章

第七节：pandas排序
pandas具有两种排序方式:sort_index()和sort_values().
pandas 排序之 sort_values，reindex，reset_index， sort_index
如果想按照自己的方式排序ind = 行索引data= data[ind] ind = data.sum(axis=1).sort_values(ascending=False).index data ...
pandas 按照某一列进行排序
pandas排序的方法有很多,sort_values表示根据某一列排序 pd.sort_values("xxx",inplace=True) 表示pd按照xxx这个字段排序,inp ...
Pandas学习笔记（三）
(1)系列对象( Series)基本功能编号属性或方法描述 1 axes 返回行轴标签列表. 2 dtype 返回对象的数据类型(dtype). 3 empty 如果系列为空,则返回True. ...
媲美pandas的数据分析工具包Datatable
1 前言 data.table 是 R 中一个非常通用和高性能的包,使用简单.方便而且速度快,在 R 语言社区非常受欢迎,每个月的下载量超过 40 万,有近 650 个 CRAN 和 Biocondu ...
pandas的用法
1.a = pandas.read_csv(filepath):读取.csv格式的文件到列表a中,文件在路径filepath中 pandas.core.frame.DataFrame是pandas的核 ...
送你一个Python 数据排序的好方法
摘要:学习 Pandas排序方法是开始或练习使用 Python进行基本数据分析的好方法.最常见的数据分析是使用电子表格.SQL或pandas 完成的.使用 Pandas 的一大优点是它可以处理大量数据 ...
Python人工智能学习笔记
Python教程 Python 教程 Python 简介 Python 环境搭建 Python 中文编码 Python 基础语法 Python 变量类型 Python 运算符 Python 条件语句 ...
【转载】使用Pandas对数据进行筛选和排序
使用Pandas对数据进行筛选和排序本文转载自:蓝鲸的网站分析笔记原文链接:使用Pandas对数据进行筛选和排序目录: sort() 对单列数据进行排序对多列数据进行排序获取金额最小前10项 ...

随机推荐

CodeForces 663A Rebus
A. Rebus time limit per test 1 second memory limit per test 256 megabytes input standard input outpu ...
Avalondock 第四步边缘停靠
前一章介绍了分组功能,这一章主要介绍细节信息,LayoutRoot的side属性 LayoutRoot包含四个属性,LeftSide,RightSide,TopSide,BottomSide,分别用于 ...
Collections工具类的使用
创建实体类 public class News implements Comparable { private int id; //新闻编号 private String title; //新闻标题 ...
Milking Time---poj3616(简单dp)
题目链接:http://poj.org/problem?id=3616 题意:人从奶牛身上挤奶有m个时间段(1----n),每个时间段包含 s e f 表示从 s 到 e 的这段时间可以获得 f 单位 ...
Python 一键同步windows和linux数据(基于pscp.exe)
outline 项目中需要把 windows server 上的数据同步到 linux server,方法很多,这里记录下自己采用的一种比较简单的方法. 准备工作首先确保你 windows serv ...
hadoop开发MapReduce程序
准备工作: 1.设置HADOOP_HOME,指向hadoop安装目录 2.在window下,需要把hadoop/bin那个目录替换下,在网上搜一个对应版本的 3.如果还报org.apache.hado ...
path的join和resolve的使用区别
文章目录 1.连接路径:path.join([path1][, path2][, ...]) 2.路径解析:path.resolve([from ...], to) 3.对比 1.连接路径:pat ...
阿里、腾讯、京东、微软，各家算法&数据挖掘岗位面经大起底!
阿里.腾讯.京东.微软,各家算法&数据挖掘岗位面经大起底! 2016-02-24 36大数据 36大数据作者: 江少华摘要: 从2015年8月到2015年10月,花了3个月时间找工作,先后 ...
python之路堡垒机paramiko
paramiko 1.安装 pip3 install paramiko 二.使用 SSHClient 用于连接远程服务器并执行基本命令基于用户名密码连接: import paramiko # 创建S ...
杭电1023Train Problem II
地址:http://acm.hdu.edu.cn/showproblem.php?pid=1023 题目: Train Problem II Time Limit: 2000/1000 MS (Jav ...

Pandas排序

按标签排序

排序顺序

按列排列

按值排序

排序算法

Pandas排序的更多相关文章

随机推荐

热门专题