R语言学习笔记：sort、rank、order、arrange排序函数

　　R语言中排序有几个基本函数：sort()、rank()、order()、arrange()

一、总结

　　sort()函数是对向量进行从小到大的排序

　　rank()函数返回的是对向量中每个数值对应的秩

　　order()函数返回的值表示位置，依次对应的是向量的最小值、次小值、第三小值……最大值等（位置索引）

　　arrange()函数（需加载dplyr包）针对数据框，返回基于某列排序后的数据框，方便多重依据排序

二、具体用法

1.sort

data <- c(5,6,8,2,9,3)

sort(data) # 2 3 5 6 8 9

sort(data, decreasing = TRUE) # 9 8 6 5 3 2

2.order

data <- c(5,6,8,2,9,3)

order(data) # 4 6 1 2 3 5

data[order(data)] # 等同于sort(data)排序

d <- data.frame(

  x=c(13,45,13,45,13),

  y=c(3,1,2,2,3),

  t=c(56,7,68,3,1))

d[order(d$x,d$y),] # x升序 y升序

/*

  x y  t

3 13 2 68

1 13 3 56

5 13 3  1

2 45 1  7

4 45 2  3

*/

d[order(-d$x,d$y),] # x降序 y升序

/*

  x y  t

2 45 1  7

4 45 2  3

3 13 2 68

1 13 3 56

5 13 3  1

*/

3.rank

# rank函数

rank(x, na.last = TRUE, ties.method = c("average","first","random","max","min"))

data <- c(5,6,8,2,9,3)

rank(data) # 3 4 5 1 6 2

(1) rank 函数是对一维度数组、向量x 进行排序。若x 为数值，则按照从小到大的原则进行排序。

P.S. 实际情况中，存在大量用二维表格描述的数据，比如行表示地点列表示时间的统计表，若进行排序，应先通过字符拼接的手段将表格转化为一维的向量，否则结果将失去意义。

(2) rank 将数据分为确定值与缺失值两种。缺失值可按先后排在确定值之间(na.last = FALSE), 也可排在之后(na.last = TRUE), 也可保留，不参与排序(na.last = "keep")。

(3) "first" 是最基本的排序，小数在前大数在后，相同元素先者在前后者在后。

　　"max" 是相同元素都取该组中最好的水平，即通常所讲的并列排序。

　　"min" 是相同元素都取该组中最差的水平，可以增大序列的等级差异。

　　"average" 是相同元素都取该组中的平均水平，该水平可能是个小数。

　　"random" 是相同元素随机编排次序，避免了“先到先得”，“权重”优于“先后顺序”的机制增大了随机的程度。

4.arrange(dplyr)

library(dplyr)

arrange(mtcars, cyl, disp) # 按 cyl + disp 列进行升序排列

mtcars[order(mtcars$cyl,mtcars$disp),] # 同上

/*

  mpg cyl  disp  hp drat    wt  qsec vs am gear carb

1 33.9   4  71.1  65 4.22 1.835 19.90  1  1    4    1

2 30.4   4  75.7  52 4.93 1.615 18.52  1  1    4    2

3 32.4   4  78.7  66 4.08 2.200 19.47  1  1    4    1

4 27.3   4  79.0  66 4.08 1.935 18.90  1  1    4    1

5 30.4   4  95.1 113 3.77 1.513 16.90  1  1    5    2

6 22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1

*/

head(arrange(mtcars,cyl,desc(disp)))

/*

  mpg cyl  disp  hp drat    wt  qsec vs am gear carb

1 24.4   4 146.7  62 3.69 3.190 20.00  1  0    4    2

2 22.8   4 140.8  95 3.92 3.150 22.90  1  0    4    2

3 21.4   4 121.0 109 4.11 2.780 18.60  1  1    4    2

4 26.0   4 120.3  91 4.43 2.140 16.70  0  1    5    2

5 21.5   4 120.1  97 3.70 2.465 20.01  1  0    3    1

6 22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1

*/

END 2018-11-26 11:48:18

R语言学习笔记：sort、rank、order、arrange排序函数的更多相关文章

R语言学习笔记（七）：排序函数：sort(), rank(), order()
sort() sort()函数直接对函数进行排序,并返回排序结果. > a <- c(12,4,6,5) > sort(a) [1] 4 5 6 12 rank() rank()函数 ...
R语言学习笔记 (入门知识)
R免费使用:统计工具:# 注释,行注释块注释:anything="这是注释的内容"常用R语言编辑器:Rsutdio,Tinn-R,Eclipse+StatET:中文会有乱码帮助:? ...
R语言学习笔记：基础知识
1.数据分析金字塔 2.[文件]-[改变工作目录] 3.[程序包]-[设定CRAN镜像] [程序包]-[安装程序包] 4.向量 c() 例:x=c(2,5,8,3,5,9) 例:x=c(1:100) ...
R语言学习笔记之: 论如何正确把EXCEL文件喂给R处理
博客总目录:http://www.cnblogs.com/weibaar/p/4507801.html ---- 前言: 应用背景兼吐槽继续延续之前每个月至少一次更新博客,归纳总结学习心得好习惯. ...
R语言学习笔记（二）
今天主要学习了两个统计学的基本概念:峰度和偏度,并且用R语言来描述. > vars<-c("mpg","hp","wt") &g ...
R语言学习笔记：小试R环境
买了三本R语言的书,同时使用来学习R语言,粗略翻下来感觉第一本最好: <R语言编程艺术>The Art of R Programming <R语言初学者使用>A Beginne ...
R语言学习笔记——C#中如何使用R语言setwd()函数
在R语言编译器中,设置当前工作文件夹可以用setwd()函数. > setwd("e://桌面//")> setwd("e:\桌面\")> s ...
R语言学习笔记-机器学习1-3章
在折腾完爬虫还有一些感兴趣的内容后,我最近在看用R语言进行简单机器学习的知识,主要参考了<机器学习-实用案例解析>这本书. 这本书是目前市面少有的,纯粹以R语言为基础讲解的机器学习知识,书 ...
R语言学习笔记（一）
1.不同的行业对数据集(即表格)的行和列称谓不同,统计学家称其为观测(observation)和变量(variable): 2.R语言存储数据的结构: ①向量:类似于C语言里的一位数组,执行组合功能的 ...

随机推荐

队列，event,multiprocess
队列:queue queue is especially useful in threaded programming when information must be exchanged safel ...
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode)
Hadoop部署方式-伪分布式(Pseudo-Distributed Mode) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.下载相应的jdk和Hadoop安装包 JDK:h ...
Java基础-IO流对象之File类
Java基础-IO流对象之File类作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.IO技术概述回想之前写过的程序,数据都是在内存中,一旦程序运行结束,这些数据都没有了,等下 ...
一篇很棒的 MySQL 触发器学习教程
一.触发器概念触发器(trigger):监视某种情况,并触发某种操作,它是提供给程序员和数据分析员来保证数据完整性的一种方法,它是与表事件相关的特殊的存储过程,它的执行不是由程序调用,也不是手工启动 ...
51 nod 1205 流水线调度
51 nod 1205 流水线调度基准时间限制:1 秒空间限制:131072 KB 分值: 40 难度:4级算法题 N个作业{1,2,…,n}要在由2台机器M1和M2组成的流水线上完成加工.每 ...
Android端抓取日志
一.背景: ADT-Bundlee for Windows 是由GoogleAndroid官方提供的集成式IDE,已经包含了Eclipse,你无需再去下载Eclipse,并且里面已集成了插件,它解决大 ...
Maximal Rectangle&Largest Rectangle in Histogram
这两天在做leetcode的题目,最大矩形的题目以前遇到很多次了,一直都是用最笨的方法,扫描每个柱子,变换宽度,计算矩形面积,一直都以为就这样O(n2)的方法了,没有想到居然还有研究出了O(n)的算法 ...
回溯算法——解决n皇后问题
所谓回溯(backtracking)是通过系统地搜索求解问题的方法.这种方法适用于类似于八皇后这样的问题:求得问题的一个解比较困难,但是检查一个棋局是否构成解很容易. 不多说,放上n皇后的回溯问题代码 ...
window下卸载MySQL
更多内容推荐微信公众号,欢迎关注: 网上找来的,留在这做个备份. 1.控制面板里的增加删除程序内进行删除 2.删除MySQL文件夹下的my.ini文件,如果备份好,可以直接将文件夹全部删除 3.开始- ...
[转]编译防火墙——C++的Pimpl惯用法解析
impl(pointer to implementation, 指向实现的指针)是一种常用的,用来对“类的接口与实现”进行解耦的方法.这个技巧可以避免在头文件中暴露私有细节(见下图1),因此是促进AP ...

R语言学习笔记：sort、rank、order、arrange排序函数

R语言学习笔记：sort、rank、order、arrange排序函数的更多相关文章

随机推荐

热门专题