Pandas | 10 排序

Pandas有两种排序方式，它们分别是 -

按标签
按实际值

import pandas as pd

import numpy as np

df=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns=['col2','col1'])

print (df)

输出结果：

       col2      col1

  1.069838  0.096230

 -0.542406 -0.219829

 -0.071661  0.392091

  1.399976 -0.472169

  0.428372 -0.624630

  0.471875  0.966560

 -0.131851 -1.254495

  1.180651  0.199548

  0.906202  0.418524

  0.124800  2.011962

在df数据值中，标签和值未排序。下面来看看如何按标签来排序。

按标签排序

使用sort_index()方法，通过传递axis参数和排序顺序，可以对DataFrame进行排序。 默认情况下，按照升序对行标签进行排序。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=df.sort_index()

print (sorted_df)

输出结果：

       col2      col1

0  0.431384 -0.401538

1  0.111887 -0.222582

2 -0.166893 -0.237506

3  0.476472  0.508397

4  0.670838  0.406476

5  2.065969 -0.324510

6 -0.441630  1.060425

7  0.735145  0.972447

8 -0.051904 -1.112292

9  0.134108  0.759698

排序顺序

　　通过将布尔值传递给升序参数，可以控制排序顺序。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df = df.sort_index(ascending=False)

print (sorted_df)

输出结果：

       col2      col1

9  0.750452  1.754815

8  0.945238  2.079394

7  0.345238 -0.162737

6 -0.512060  0.887094

5  1.163144  0.595402

4 -0.063584 -0.185536

3 -0.275438 -2.286831

2 -1.504792 -1.222394

1  1.031234 -1.848174

0 -0.615083  0.784086

按列排列

　　通过传递axis参数值为0或1，可以对列标签进行排序。默认情况下，axis = 0，逐行排列。

import pandas as pd

import numpy as np

df = pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7],columns = ['col2','col1'])

sorted_df=df.sort_index(axis=1)

print (sorted_df)

输出结果：

       col1      col2

1 -0.997962  0.736707

4  1.196464  0.703710

6 -0.387800  1.207803

2  1.614043  0.356389

3 -0.057181 -0.551742

5  1.034451 -0.731490

9 -0.564355  0.892203

8 -0.763526  0.684207

0 -1.213615  1.268649

7  0.316543 -1.450784

按值排序

sort_values()是按值排序的方法。它接受一个by参数，它将使用要与其排序值的DataFrame的列名称。

import pandas as pd

import numpy as np

df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = df.sort_values(by='col1')

print (sorted_df)

输出结果：

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

注意：观察上面的输出结果，col1值被排序，相应的col2值和行索引将随col1一起改变。因此，它们看起来没有排序。

可以传递多个列，前列相同的情况下，排后列

import pandas as pd

import numpy as np

df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = df.sort_values(by=['col1','col2'])

print (sorted_df)

输出结果：

   col1  col2

2     1     2

1     1     3

3     1     4

0     2     1

排序算法

sort_values()提供了从mergeesort，heapsort和quicksort中选择算法的一个配置。Mergesort是唯一稳定的算法。

import pandas as pd

import numpy as np

df = pd.DataFrame({'col1':[2,1,1,1],'col2':[1,3,2,4]})

sorted_df = df.sort_values(by='col1' ,kind='mergesort')

print (sorted_df)

输出结果：

   col1  col2

1     1     3

2     1     2

3     1     4

0     2     1

Pandas | 10 排序的更多相关文章

Pandas数据排序
Pandas数据排序 .sort_index() 在指定轴上根据索引进行排序,索引排序后内容会跟随排序 b = pd.DataFrame(np.arange(20).reshape(4,5),inde ...
pandas数据排序（series排序 & DataFrame排序）
# pandas数据排序 # series的排序: # Series.sort_values(ascending = True,inplace = False) # 参数说明: # ascending ...
Pandas的排序和排名（Series， DataFrame） + groupby
根据条件对数据集排序(sorting)也是一种重要的内置运算.要对行或列索引进行排序(按字典顺序), 可使用sort_index 方法, 它将返回一个已排序的新对象: 而DataFrame, 则可以根 ...
10.排序数组中和为给定值的两个数字[Find2NumbersWithGivenSum]
[题目] 输入一个已经按升序排序过的数组和一个数字,在数组中查找两个数,使得它们的和正好是输入的那个数字.要求时间复杂度是O(n).如果有多对数字的和等于输入的数字,输出任意一对即可. 例如输入数组1 ...
pandas 数据排序.sort_index()和.sort_values()
原文链接:https://www.jianshu.com/p/f0ed06cd5003 import pandas as pd df = pd.DataFrame(……) 说明:以下“df”为Data ...
pandas sort_values 排序后， index 也发生了改变，不改变的情况下需要 reset_index(drop = True)
shenpi.sort_values(by=['apply_date'],ascending=True,inplace=True)shenpi.reset_index(drop = True)
Python数据分析Pandas库之熊猫(10分钟二)
pandas 10分钟教程(二) 重点发法分组 groupby('列名') groupby(['列名1','列名2',.........]) 分组的步骤 (Splitting) 按照一些规则将数据分 ...
10大排序算法——Java实现
算法与实现选择排序算法思想从数组中选择最小元素,将它与数组的第一个元素交换位置.再从数组剩下的元素中选择出最小的元素,将它与数组的第二个元素交换位置.不断进行这样的操作,直到将整个数组排序. 动 ...
pandas 学习笔记【持续更新】
import numpy as np import pandas as pd import matplotlib.pyplot as plt df1 = pd.DataFrame(np.arange( ...

随机推荐

APP 链接ROS时出现pymongo.errors.ServerSelectionTimeoutError: localhost:27017 错误
ROS版本上kinetic ,APP是官网开源的make a map,当app链接ROS进行建图时,会出现报错:pymongo.errors.ServerSelectionTimeoutError: ...
书籍推荐-An introduction to Data Science
为什么要读这本书? 该书是由我们老师推荐的,通过学习此数,可以了解R语言的使用,也可以知道基本的数据分析方法. 看到Creating a Data Set in R -- 24页面
TPM（ThinkPHPMobile）使用简明教程
TPM还有很多特性,它不仅能和ThinkPHP结合,也可以结合自己已有的接口.还有一些附件插件帮助我们实现一些常用功能一.基础知识 1 手机APP的类型移动端的应用有这几种:WebApp,Nati ...
手动下载jar包导入mvn repo的方法
转载自:http://www.360doc.com/content/19/1101/16/67125028_870487351.shtml 常用Maven仓库网址:http://mvnreposito ...
MediaWiki上传文件大小设置
一.概述 MediaWiki默认最大上传文件大小为2M,碰到文件较大需要修改这个限制,需要改为8M. 二.修改php.ini 使用docker运行的MediaWiki,默认是没有php.ini这个文件 ...
Go语言-1-标识符与变量
目录 1. Go标识符 1.1 Go关键字 1.2 常量标识符(4个) 1.3 空白标识符(1个) 1.4 内置数据类型标识符 1.5 内置函数(15个) 2. Go语言操作符 3. Go语言变量 3 ...
jq处理动画累加
问题:日程提醒(跟日历一样的切换效果),只用一个div来展示当天日程数据,每次清空div里的数据再加载数据,导致切换日期时,数据展示div有闪动,于是采用动画来进行过渡,这样就巧妙地避免了闪动: $( ...
One SQL to Rule Them All – an Efficient and Syntactically Idiomatic Approach to Management of Streams and Tables（中英双语）
文章标题 One SQL to Rule Them All – an Efficient and Syntactically Idiomatic Approach to Management of S ...
Vue+element 解决浏览器自动填充记住的账号密码问题
我们在做form表单的时候,会发现,浏览器会自动的将我们之前保存的密码, 自动的填充到表单中input 为 type="password" 的框中登录页面也就算了,但是注册页面就 ...
SQL Server Compact 3.5环境部署<转>
通过使用 Microsoft Visual Studio 开发环境,可以开发使用 SQL Server Compact 3.5 的应用程序.Visual Studio 是开发和部署使用 SQL Ser ...

Pandas | 10 排序

按标签排序

排序顺序

按列排列

按值排序

排序算法

Pandas | 10 排序的更多相关文章

随机推荐

热门专题