用R的dplyr进行数据转换(一)】的更多相关文章

在网上找了很久关于数据转换的,都没有找到比较好的.现在为大家整理一下.按照我自己的思路.当然也是为了自己做笔记. 为了方便,大家可以统一安装一个系列的包,这个只需要安装tidyverse这个包就可以,它会安装一系列的数据处理的包,比如ggplot2,dplyr等主力的包. #安装tidyverse包 install.packages('tidyverse') #加载这个包 library(tidyverse) 我现在使用的版本如下: #需要先安装devtools这个包 > devtools::s…
昨天学了一下R语言dplyr包,处理数据框还是很好用的.记录一下免得我忘记了... 先写一篇入门的,以后有空再写一篇详细的用法. #dplyr learning library(dplyr) #filter() #选择符合条件的数据框的行,返回数据框 #Usage #filter(.data, ...) # ...为限制条件 #eg filter(starwars, species == "Human") filter(starwars, mass > 1000) # Multi…
dplyr的优点很明显,数据框操作简洁,如filter(df, x == 1, y == 2, z == 3)等于df[df$x == 1 & df$y ==2 & df$z == 3, ].然而优点也是缺点,因为它的的参数不是透明的,这意味着你不能用一个看似等价的对象代替一个在别处定义的值. df <- tibble(x = 1:3, y = 3:1) filter(df, x == 1) #错误 my_var <- x filter(df, my_var == 1) #同样…
关于这两个函数,官方是这么定义的: substitute returns the parse tree for the (unevaluated) expression expr, substituting any variables bound in env. quote simply returns its argument. The argument is not evaluated and can be any R expression. 貌似看不懂,看几个例子来帮助理解. > x <…
例如将如下数据转换成data.frame型: l <- replicate( 5, list(sample(letters, 4)), simplify = FALSE ) => 用unlist拆分list后重构矩阵然后转换为data.frame lr <- data.frame(matrix(unlist(l), nrow=5, byrow=T),stringsAsFactors=FALSE) lapply 函数和sapply函数 data.frame(matrix(lapply(l,…
Tidyverse 学习笔记 1.gapminder 我理解的gapminder应该是一个内置的数据集 加载之后使用 > # Load the gapminder package > library(gapminder) > # Load the dplyr package > library(dplyr) > # Look at the gapminder dataset > gapminder A tibble: 1,704 x 6 country continen…
select函数 dplyr包select函数用的很多,不过我们一般也是通过正反选列名或数字来选择列. 常见用法如: select(iris,c(1,3)) select(iris,1,3) #同上 select(iris,1:3) select(iris,-c(1,3)) select(iris, Sepal.Length, Sepal.Width) select(iris, Sepal.Length:Species) select(iris, -Sepal.Length, -Sepal.Wi…
tidyverse系列的R包虽然解放了大家的双手,但同时也束缚了我们重新编写函数的能力.在这一套语法中,要实现作为函数参数的字符串和变量之间的相互转换困难重重,但只要掌握了其中原理后,也就能够游刃有余地处理了. 首先要理解基础R中几个重要又易忽略的函数. eval Evaluate an (Unevaluated) Expression: Evaluate an R expression in a specified environment. 简言之就是:对表达式对象的求值. 可以把字符串转化成…
R数据科学(R for Data Science) Part 1:探索 by: PJX for 查漏补缺 exercise: https://jrnold.github.io/r4ds-exercise-solutions ------------前言------------------------------- library(tidyverse) #核心包:ggplot2/tibble/readr/purrr/dplyr/tidyr/forcats/stringr #更新 tidyverse…
R 语言基本数据结构 首先让我们先进入 R 环境下: sudo R 赋值 R 中可以用 = 或者 <- 来进行赋值 ,<- 的快捷键是 alt + - . > a <- c(2,5,8) > a [1] 2 5 8 筛选 我们可以用下标来筛选,例如: > a[1:2] [1] 2 5 注意 R 语言的下标是从 1 开始的. 当然我们也可以用逻辑进行筛选,例如: > a[a>4] [1] 5 8 为了了解这个式子的原理,我们先看看 a>4 是什么: &g…