###################################################

问题:数据框 data.frame 查、排序等,   18.4.27

怎么对数据框 data.frame实施 查询位置、查询满足条件的个案数、、排序、 ???

解决方案:

#查询位置

weizhi <- which(iris$Sepal.Length >= 6.9)   #返回一个向量,显示的是所有 >=6.9的行的行号

max(iris$Sepal.Length)    #[1] 7.9

which(iris$Sepal.Length == max(iris$Sepal.Length))   #[1] 132

which(iris$Species == "setosa" & iris$Sepal.Length >= 5.1)   #which 返回满足其内条件的元素的位置。

x[x==3] <- 25;x    #将x中等于3的元素值变为25

x[x=1] <- 12;x    #将x的第1个元素数值变为12

which.max(a)    # 找出最大元素的下标

which.min(a)    # 找出大小的元素下标

which(a==2)    # 等于2的元素的下标

which(a>5)     # 大于5的元素的下标

a[which.max(a)]    # 找出最大的元素

a[which(a>5)]    # 所有的值大于5的元素

#查询满足条件的个案数

length(which(iris$Species == "setosa" & iris$Sepal.Length >= 5.1))

sum(iris$Sepal.Length >= 6)    #统计个数,统计 iris$Sepal.Length 中大于等于6的数有多少个

#排序

#order();   #输出原行号,按照要求排序后的向量  order返回的是排序后的索引。

order(iris$Sepal.Length)    #[1]  9  4  7  3  2 10  5  8  1  6 ;返回原来的行号按照iris$Sepal.Length排序后的向量

inew = iris[order(iris$Sepal.Length),]   #由于要对行排序,所以条件要写在 中括号内 行的位置。

inew2 = iris[order(iris$Sepal.Length,-iris2$Sepal.Width),]  #默认升序  本例按iris$Sepal.Length升序,按iris$Sepal.Width降序。

#sort();   #直接输出排序后的结果。

讨论扩展:

另请参阅:

###################################################

问题:筛选子集(行子集)   18.4.24

根据 data.frame 中某列,如何筛选满足条件的行,组成一个子集

解决方案:

cond <-  iris$Species == "setosa" & iris$Sepal.Length >= 5.1   #筛选条件,返回一个与 iris$Species 长度相同的布尔向量。满足条件的为TRUE。

# 和&  或|  不等于!=  大于>  小于< ,自由组合      #如果筛选对象是因子变量,需要带引号    == “”

筛选子集 法一:用 subset 选子集

iris_setosa1 <- subset(iris,cond);

iris_setosa1 <- subset(iris,cond,select = c(1:3));   #select 用来选择 “只取select内的列” 。

iris.del.col2 <- subset(iris,cond,select = -Sepal.Width)

iris.del.col2 <- subset(iris,cond,select = c(-Sepal.Width,-Petal.Width))    #以下均可:select = c(Sepal.Width,Petal.Width)  select = c(Sepal.Width,5)

筛选子集 法二:

iris_setosa2 <- iris[cond,];

newdata <- iris[which(cond),c(1,2,5)]   #选择满足条件的行和列,一并生成新变量

讨论扩展:

对列筛选:

subset(dfrm,select=c(colname1,colname2,...,colnames),subset = (temp));   #同时实现对行、列的筛选。。内部subset对行进行筛选。

student[which(student$Gender==”F”),”Age”]     #筛选后,只取“Age列”,条件得到一个布尔向量:FALSE FALSE  TRUE,然后使用which函数可以将布尔向量中TRUE的Index返回,

iris.Species2 = iris[iris$Species == "setosa",]    #等价,更常用。和& 或| 不等于!= 大于> 小于< ,自由组合

#如果筛选对象是因子变量,需要带引号 == “”

newdata <- iris[which(iris$Species =='setosa' & iris$Sepal.Length > 5.0),c(1,2,5)]

iris_6 <- subset(iris,iris$Sepal.Length >6 | iris$Sepal.Width>4,select = c(1:3))

另请参阅:

R: data.frame 数据框的:查询位置、排序(sort、order)、筛选满足条件的子集。。的更多相关文章

  1. R语言Data Frame数据框常用操作

    Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的. Data Frame每一列有列名,每一行也可 ...

  2. 转载:R语言Data Frame数据框常用操作

    Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的. Data Frame每一列有列名,每一行也可 ...

  3. 用R语言提取数据框中日期对应年份(列表转矩阵)

    用R语言提取数据框中日期对应年份(列表转矩阵) 在数据处理中常会遇到要对数据框中的时间做聚类处理,如从"%m/%d/%Y"中提取年份. 对应操作为:拆分成列表——列表转矩阵——利用 ...

  4. R语言中将数据框(data.frame)中字符型数据转化为数值型

    as.data.frame(lapply(data,as.numeric))

  5. R语言学习——数据框

    > #数据框可以包含不同模式(数值型.字符型.逻辑型等)的数据,是R中最常处理的数据结构.数据框可以通过函数data.frame()创建:mydata<-data.frame(coll,c ...

  6. 2-7 R语言基础 数据框

    #数据框 > df <- data.frame(id=c(1,2,3,4),name=c("a","b","c","d ...

  7. R: data.frame 生成、操作数组。重命名、增、删、改

    ################################################### 问题:生成.操作数据框   18.4.27 怎么生成数据框 data.frame.,,及其相关操 ...

  8. R Data Frame

    https://www.datamentor.io/r-programming/data-frame/ Check if a variable is a data frame or not We ca ...

  9. R语言中数据框的横向合并与纵向合并

    #横向合并ID<-c(1,2,3,4)name<-c("Jim","Tony","Lisa","Tom")s ...

随机推荐

  1. LeetCode:二叉树的前、中、后序遍历

    描述: ------------------------------------------------------- 前序遍历: Given a binary tree, return the pr ...

  2. runtime-分类为什么不生成setter和getter

    前言 前几天有人问我一个问题:为什么分类不能自动创建get set方法.老实说,笔者从来没有去思考过这个问题.于是这次通过代码实践跟runtime源码来探究这个问题. 准备工作 为了能减少输出类数据的 ...

  3. [原创]java WEB学习笔记39:EL中的运算符号(算术运算符,关系运算符,逻辑运算符,empty运算符,条件运算符,括号运算符)

    本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...

  4. linux dd、echo 、watch、fuser命令

      一.dd命令 以数据流进行复制,cp命令则是以文件为单位进行复制 if=数据来源    of=数据存储目标    bs=# 复制的字节数   count=# 复制几个bs   seek=# 跳过多 ...

  5. dos命令行中不同磁盘的调转

    windows下,dos中不同磁盘的跳转: 直接 盘符+回车: 如跳转到d盘: D:回车即可 : Microsoft Windows [版本 10.0.10586] (c) 2015 Microsof ...

  6. Hibernate错误及解决办法

    1.Hibernate 报错:this project is not a myeclipse hibernate project . assuming hibernate 3 cap res:项目名上 ...

  7. 动态规划 最长回文子串 leetcode5

    public static String longestPalindrome(String s) { if(null==s||s.length()==0) return s; int n=s.leng ...

  8. python中的单引号,双引号和三双引号的区别

    1.单引号和双引号没有区别.都可以用就是为了方便,减少写太多的转义字符. 比如: str='Let\'s go!' str="Let's go!" 两种等价,但是第二种写法显然更优 ...

  9. Android之单元测试学习

    1.单元测试概念 单元测试(又称为模块测试),检验程序模块(软件设计的最小单位)正确性的测试工作,常常是程序员写的一段代码.对于面向对象编程,最小单元就是方法,包括基类(超类).抽象类.或者派生类(子 ...

  10. ACM学习历程—SGU 275 To xor or not to xor(xor高斯消元)

    题目链接:http://acm.sgu.ru/problem.php?contest=0&problem=275 这是一道xor高斯消元. 题目大意是给了n个数,然后任取几个数,让他们xor和 ...