1 tibble包简介

包名: tibble
编码: UTF-
最新版本: 1.2
标题: 简单数据框
描述: 构建一个 'tbl_df' 类，可以比传统的R数据框提供更好的检查和打印功能。
作者: Hadley Wickham , Romain Francois ,Kirill Müller, RStudio
URL: https://github.com/hadley/tibble
要求: R (>= )
Github: https://github.com/hadley/tibble

　　tibble包是一个轻量级的包，它实现的data.frame的重新塑造，保留了data.frame中经过实践证明有效的部分，吸取了专注于数据操作的dplyr包的基本思想。tibble包提供了更优于data.frame的性能，包括：打印，提取子集和因子操作。

tibble包内提供的主要函数：

名称	功能
as_tibble	强制转换lists和matrices为数据框(data.frame)
tibble	创建数据框(data.frame)或列表(list)
tribble	智能行(Row-wise)创建tibble
obj_sum/ type_sum/ tbl_sum	给出对象的简明摘要：对象类型和数据框大小
rownames	行名的操作工具（非常有用）：可以提取行名为列或列为行名
has_name	检查命名元素的存在has_name(iris, "Species")
repair_names	修复对象的名称（如果没有命名则用V+i代替）
all_equal	数据框相等的柔性比较，忽略行和列的排列顺序
glimpse	有点像str()，主要是查看数据集的结构
enframe	将向量变为数据框
print.tbl_df	print(x,n)打印数据集x的前n行，默认为10行，有点像head()
add_column	给数据框添加列
add_row	给数据框添加行
is.tibble	检测对象是否为tibble
knit_print.trunc_mat	截断显示

2 安装和使用

2.1 安装

从CRAN安装：

install.packages("tibble")

从github安装：

# install.packages("devtools")
devtools::install_github("hadley/tibble")

2.2 创建tibbles对象

可以利用as_tibble()函数将已经存在的对象（data.frame,list,matrix,or table）强制转为tibble对象：

library(tibble)
as_tibble(iris)
#> # A tibble:  ×
#>    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
#>           <dbl>       <dbl>        <dbl>       <dbl>  <fctr>
#>            5.1         3.5          1.4         0.2  setosa
#>            4.9         3.0          1.4         0.2  setosa
#>            4.7         3.2          1.3         0.2  setosa
#>            4.6         3.1          1.5         0.2  setosa
#>            5.0         3.6          1.4         0.2  setosa
#>            5.4         3.9          1.7         0.4  setosa
#>            4.6         3.4          1.4         0.3  setosa
#>            5.0         3.4          1.5         0.2  setosa
#>            4.4         2.9          1.4         0.2  setosa
#>           4.9         3.1          1.5         0.1  setosa
#> # ... with  more rows

也可以利用tibble()函数创建：

tibble(x = :, y = , z = x ^  + y)
#> # A tibble:  ×
#>       x     y     z
#>   <int> <dbl> <dbl>
#>
#>
#>
#>
#>               
 
a <- :
tibble(a, b = a * )
## # A tibble:  ×
##       a     b
##    <int> <dbl>
##
##
##
##
##          
 
tibble(a, b = a * , c = )
## # A tibble:  ×
##       a     b     c
##     <int> <dbl> <dbl>
##
##
##
##
##               
 
tibble(x = runif(), y = x * )
# # A tibble:  ×
#        x         y
#      <dbl>     <dbl>
#   0.7098188 1.4196377
#   0.2790267 0.5580533
#   0.2655437 0.5310874
#   0.1237294 0.2474587
#   0.9018147 1.8036293
#   0.1594413 0.3188827
#   0.2592028 0.5184056
#   0.6570324 1.3140648
#   0.8955551 1.7911102
#  0.1940897 0.3881794
 
tibble(x = letters)
# # A tibble:  ×
#        x
#      <chr>
#       a
#       b
#       c
#       d
#       e
#       f
#       g
#       h
#       i
#      j
# # ... with  more rows
 
tibble(x = :, y = list(:, :, :))
#> # A tibble:  ×
#>       x          y
#>   <int>     <list>
#>        <]>
#>       <]>
#>       <]>

也可以使用tribble()函数一行一行的定义一个tibble对象：

tribble(
  ~x, ~y,  ~z,
  ,  3.6,
  ,  8.5
)
#> # A tibble:  ×
#>       x     y     z
#>   <chr> <dbl> <dbl>
#>      a        3.6
#>      b        8.5

查看类型，最底层还是data.frame：

class(as_tibble(iris))
#> [] "tbl_df"     "tbl"        "data.frame"

2.3 添加行和列

### 添加行
add_row(.data, ..., .before = NULL, .after = NULL)
.data 要添加的数据框
.before , .after  在哪行之前或之后添加该数据
df <- tibble(x = :, y = :)
df
#> # A tibble:  ×
#>       x     y
#>   <int> <int>
#>
#>
#>           1

library(dplyr)
df %>% add_row(x = 4, y = 0, .before = 2)
#> # A tibble: 4 × 2
#>       x     y
#>   <dbl> <dbl>
#> 1     1     3
#> 2     4     0
#> 3     2     2
#> 4     3     1
 
df %>% add_row(x = 4:5, y = 0:-1)
#> # A tibble: 5 × 2
#>       x     y
#>   <int> <int>
#> 1     1     3
#> 2     2     2
#> 3     3     1
#> 4     4     0
#> 5     5    -1
 
add_row(df, x = 4)
#> # A tibble: 4 <U+00D7> 2
#>       x     y
#>   <dbl> <int>
#> 1     1     3
#> 2     2     2
#> 3     3     1
#> 4     4    NA

### 添加列
add_column(.data, ..., .before = NULL, .after = NULL)
.data 要添加的数据框
.before , .after  在哪行=列之前或之后添加该数据
 
df %>%
  add_column(z = -:, w = )
#> # A tibble:  ×
#>       x     y     z     w
#>   <int> <int> <int> <dbl>
#>               -
#>
#>                     
 
df %>%
  add_column(z = -:, .after = )
#> # A tibble:  ×
#>       x     z     y
#>   <int> <int> <int>
#>          -
#>
#>                
 
df %>%
  add_column(w = :, .before = "x")
#> # A tibble:  ×
#>       w     x     y
#>   <int> <int> <int>
#>
#>
#>

2.4 命名操作

2.4.1 rownames 行名的操作工具

　　df 数据框

　　var 用于rownames的列的名称

　　has_rownames(df) 确定数据框是否有行名

　　remove_rownames(df) 删除数据框的行名

library(tibble)
head(mtcars)
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4
## Mazda RX4 Wag
## Datsun
## Hornet  Drive
## Hornet Sportabout
## Valiant                         
 
head(iris)
##    Sepal.Length Sepal.Width Petal.Length Petal.Width Species
##           5.1         3.5          1.4         0.2  setosa
##           4.9         3.0          1.4         0.2  setosa
##           4.7         3.2          1.3         0.2  setosa
##           4.6         3.1          1.5         0.2  setosa
##           5.0         3.6          1.4         0.2  setosa
##           5.4         3.9          1.7         0.4  setosa
 
has_rownames(mtcars)
## [] TRUE
 
has_rownames(iris)
## [] FALSE
 
has_rownames(remove_rownames(mtcars))
## [] FALSE
 
head(remove_rownames(mtcars))
##    mpg cyl disp  hp drat    wt  qsec vs am gear carb
##
##
##
##
##
##

　　rownames_to_column(df, var = "rowname") 数据框的行名作为数据框的列，列名为rowname

　　column_to_rownames(df, var = "rowname") 数据框的某列作为行名

head(rownames_to_column(mtcars,"row2col"))
##             row2col  mpg cyl disp  hp drat    wt  qsec vs am gear carb
##          Mazda RX4
##      Mazda RX4 Wag
##         Datsun
##     Hornet  Drive
##  Hornet Sportabout
##            Valiant               
 
mtcars_tbl <- as_tibble(rownames_to_column(mtcars))
mtcars_tbl
# # A tibble:  ×
#              rowname   mpg   cyl  disp    hp  drat    wt  qsec    vs    am
#                <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#           Mazda RX4
#       Mazda RX4 Wag
#          Datsun
#      Hornet  Drive
#   Hornet Sportabout
#             Valiant
#          Duster
#           Merc 240D
#            Merc
#           Merc
# # ... with  more rows, and  more variables: gear <dbl>, carb <dbl>
 
head(column_to_rownames(as.data.frame(mtcars_tbl)))
##                    mpg cyl disp  hp drat    wt  qsec vs am gear carb
## Mazda RX4
## Mazda RX4 Wag
## Datsun
## Hornet  Drive
## Hornet Sportabout
## Valiant                         
 
df <- rownames_to_column(mtcars,"row2col")
column_to_rownames(df,"row2col")

2.4.2 has_name 检查数据框或者其他对象中是否存在指定命名元素，返回逻辑值（TRUE or FALSE）

has_name(x, name)
x  数据框或其他命名对象
name  需检查的元素
 
has_name(iris, "Species")
## [] TRUE
 
has_name(mtcars, "gears")
## [] FALSE

2.4.3 repair_names 修复对象的名称（如果没有命名则用V+i代替）

repair_names(x, prefix = "V", sep = "")
x  命名的向量
prefix  字符串，前缀，该前缀用于新列名
sep  分隔符

list(, , )
# [[]]
# []
#
# [[]]
# []
#
# [[]]
# [] 
 
repair_names(list(, , )) # works for lists, too
# $V1
# []
#
# $V2
# []
#
# $V3
# [] 
 
tbl <- as_tibble(structure(list(, , ), class = "data.frame"),validate = FALSE)
tbl
# A tibble:  ×
# ... with  variables:  <dbl>,  <dbl>,  <dbl>
repair_names(tbl)
# A tibble:  <U+00D7>
# ... with  variables: V1 <dbl>, V2 <dbl>, V3 <dbl>
 
repair_names(list(,,),prefix = "new",sep = "-")
# $``
# []
#
# $``
# []
#
# $``
# []

2.5 其他函数

2.5.1 obj_sum/ type_sum/ tbl_sum 给出对象的简明摘要：对象类型和数据框大小

obj_sum(x)
# 如果is_s3_vector值为TRUE，也就是是S3类型的向量，同时返回对象的尺寸的对象数据类型
 
type_sum(x)
# 给出对象类型简短摘要
 
tbl_sum(x)
# 给出一个类似于表对象的简短的文字描述，包括维数，数据源，可能的组（for dplyr）
 
is_vector_s3(x)

> obj_sum(:)
# [] "int [10]"
 
> obj_sum(matrix(:))
# [] "int [10 <U+00D7> 1]"
 
> obj_sum(Sys.Date())
# [] "date [1]"
 
> obj_sum(Sys.time())
# [] "dttm [1]"
 
> obj_sum(mean)
# [] "fun"

2.5.2 all_equal 数据框柔性比较，忽略行和列的排列顺序

　　当使用all.equal比较两个tbl_df，默认情况下行和列的顺序是被忽略的，并且类型也不是强制要求。

all_equal(target, current, ignore_col_order = TRUE, ignore_row_order = TRUE, convert = FALSE, ...)
"all.equal"(target, current, ignore_col_order = TRUE, ignore_row_order = TRUE, convert = FALSE, ...)
 
参数：
target, current 要比较的两个数据框
ignore_col_order 是否需要忽略列顺序，默认为TRUE
ignore_row_order 是否需要忽略行顺序，默认为TRUE
convert  是否需要转换为相似的类型，默认为FALSE，如果为TRUE，会将因子factor转为字符character，整型integer double转为双精度浮点型
...

# 对行号和列号进行采样，打乱行列顺序
scramble <- function(x) x[sample(nrow(x)), sample(ncol(x))]
 
#　转为tbl-df类型
mtcars_df <- as_tibble(mtcars)
 
# 默认情况下行列顺序是忽略的
all.equal(mtcars_df, scramble(mtcars_df))
# [] TRUE
 
# 修改默认行列顺序不被忽略
all.equal(mtcars_df, scramble(mtcars_df), ignore_col_order = FALSE)
# [] TRUE
 
all.equal(mtcars_df, scramble(mtcars_df), ignore_row_order = FALSE)
# [] "Component “mpg”: Mean relative difference: 0.3503521"
# [] "Component “cyl”: Mean relative difference: 0.4912281"
# [] "Component “disp”: Mean relative difference: 0.5690846"
# [] "Component “hp”: Mean relative difference: 0.5386953"
# [] "Component “drat”: Mean relative difference: 0.1387415"
# [] "Component “wt”: Mean relative difference: 0.3286861"
# [] "Component “qsec”: Mean relative difference: 0.1222072"
# [] "Component “vs”: Mean relative difference: 2"
# [] "Component “am”: Mean relative difference: 2"
# [] "Component “gear”: Mean relative difference: 0.32"
# [] "Component “carb”: Mean relative difference: 0.8"
 
# 默认情况下all.equal对变量的差异很敏感
df1 <- tibble(x = "a")
df2 <- tibble(x = factor("a"))
all.equal(df1, df2)
# [] "Incompatible type for column x: x character, y factor"
 
all.equal(df1, df2,convert = TRUE)
# [] "Factor levels not equal for column x"
# Warning message:
#   Incompatible type for column x: x character, y factor

2.5.3 glimpse 有点像str()，主要是查看数据集的结构

glimpse(x, width = NULL, ...)
x glimpse的对象
width 输出宽度：默认为tibble.width设定的宽度（如果有限）或者是控制台显示的宽度
 
glimpse(mtcars)
 
# Observations:
# Variables:
# $ mpg  <dbl> ...
# $ cyl  <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ disp <dbl> 160.0, 160.0, 108.0, 258.0, 360.0, 225.0, 360.0, 146.7, 140.8,...
# $ hp   <dbl> , , , , , , , , , , , , , ...
# $ drat <dbl> ....
# $ wt   <dbl> 2.620, 2.875, 2.320, 3.215, 3.440, 3.460, 3.570, 3.190, 3.150,...
# $ qsec <dbl> 16.46, 17.02, 18.61, 19.44, 17.02, 20.22, 15.84, 20.00, 22.90,...
# $ vs   <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ am   <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ gear <dbl> , , , , , , , , , , , , , , , , , , , , ,...
# $ carb <dbl> , , , , , , , , , , , , , , , , , , , , ,...
 
if (!requireNamespace("nycflights13", quietly = TRUE))
  stop("Please install the nycflights13 package to run the rest of this example")
 
# install.packages("nycflights13")
 
glimpse(nycflights13::flights)
 
# Observations: ,
# Variables:
# $ year           <, , , , , , , , ...
# $ month          <, , , , , , , , , , , , , , , , , ...
# $ day            <, , , , , , , , , , , , , , , , , ...
# $ dep_time       <, , , , , , , , , , ...
# $ sched_dep_time <, , , , , , , , , , ...
# $ dep_delay      <dbl> , , , -, -, -, -, -, -, -, -, -, -, -,...
# $ arr_time       <, , , , , , , , , , ...
# $ sched_arr_time <, , , , , , , , , , ...
# $ arr_delay      <dbl> , , , -, -, , , -, -, , -, -, ,...
# $ carrier        <chr> "UA", "UA", "AA", "B6", "DL", "UA", "B6", "EV", "B6"...
# $ flight         <, , , , , , , , , ...
# $ tailnum        <chr> "N14228", "N24211", "N619AA", "N804JB", "N668DN", "N...
# $ origin         <chr> "EWR", "LGA", "JFK", "JFK", "LGA", "EWR", "EWR", "LG...
# $ dest           <chr> "IAH", "IAH", "MIA", "BQN", "ATL", "ORD", "FLL", "IA...
# $ air_time       <dbl> , , , , , , , , , , ...
# $ distance       <dbl> , , , , , , , , , ...
# $ hour           <dbl> , , , , , , , , , , , , , , , , , ...
# $ minute         <dbl> , , , , , , , , , , , , , , , ...
# $ time_hour      <dttm> -- ::, -- ::, --...

2.5.4 enframe 将向量变为数据框

　　将元向量或者列表转为两列的数据框，如果元向量没有命名，使用自然序列命名列。

enframe(x, name = "name", value = "value")
x 元向量
name,value  两列命名，默认分别为name和value
 
enframe(:)
# # A tibble:  ×
#   name value
#   <int> <int>
#
#
#           
 
enframe(c(a = , b = ))
# # A tibble:  ×
#    name value
#   <chr> <dbl>
#      a
#      b

2.5.5 print.tbl_df

　　print(x,n)打印数据集x的前n行，默认为10行，有点像head()

　　描述矩阵的工具

"print"(x, ..., n = NULL, width = NULL, n_extra = NULL)
 
trunc_mat(x, n = NULL, width = NULL, n_extra = NULL)
 
x 展示的对象
n 要显示的行，如果为NULL(默认)并且行数小于tibble.print_max设定的值则会打印所有的行，否则会打印tibble.print_max设定的函数
width 生成的文本的宽度默认为NULL，此种情况下和使用getOption("tibble.width")或者getOption("width")设定值；后者只显示适应屏幕的列。也可以设定options(tibble.width = Inf)来显示所有的列
n_extra 整个tibble的宽度太小而打印的额外的信息，默认为NULL，会打印tibble.max_extra_cols作为额外的列信息

trunc_mat(mtcars)
# # data.frame [ × ]
#      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# *  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
#
#
#
#
#
#
#
#
#
# ... with  more rows
 
print(as_tibble(mtcars))
# # A tibble:  ×
#      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# *  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
#
#
#
#
#
#
#
#
#
# ... with  more rows
 
print(as_tibble(mtcars), n = )
# # A tibble:  ×
#     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
# # ... with  more rows
print(as_tibble(mtcars), n = )
# # A tibble:  ×
#      mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
# * <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#
#
#
# # ... with  more rows
print(as_tibble(mtcars), n = )
# 全部打印
 
if (!requireNamespace("nycflights13", quietly = TRUE))
  stop("Please install the nycflights13 package to run the rest of this example")
 
print(nycflights13::flights, n_extra = )
print(nycflights13::flights, width = Inf)

2.5.6 is.tibble 检测对象是否为tibble

is.tibble(x)
is_tibble(x)

参考链接：http://www.rdocumentation.org/packages/tibble/versions/1.2

本文链接：http://www.cnblogs.com/homewch/p/5827928.html

tibble包：高效显示表格数据的结构的更多相关文章

接收Android数据递归显示表格数据
<html> <head> <title>展示</title> <script type="text/javascript" ...
MySQL在控制台上以竖行显示表格数据
直接在SQL语句后面加\G即可,如: select * from user limit 10\G; 如果想要知道这些参数可以直接在命令行后面加入\?
jxl读取Excel表格数据
调用jxl包实现Excel表格数据的读取,代码如下: import java.io.File; import java.io.IOException; import java.util.ArrayLi ...
SSM_CRUD新手练习（9）显示分页数据
我们已经做好了用来显示数据的分页模板,现在只需要将我们从后台取出的数据填充好,显示出来. 我们使用<c:forEach>标签循环取出数据,所以需要先导入JSTL标签库 <%@ tag ...
easyui学习笔记7—在手风琴中显示表格
在这一篇中我们看看如何在手风琴里面显示表格数据的. 1.先看看引用的资源 <link rel="stylesheet" type="text/css" h ...
如何在iOS地图上高效的显示大量数据
2016-01-13 / 23:02:13 刚才在微信上看到这篇由cocoachina翻译小组成员翻译的文章,觉得还是挺值得参考的,因此转载至此,原文请移步:http://robots.thought ...
[ios3-地图] 如何在iOS地图上高效的显示大量数据 [转]
[转至:http://blog.csdn.net/pjk1129/article/details/17358337] 原文:How To Efficiently Display Large Amoun ...
R语言数据分析利器data.table包 —— 数据框结构处理精讲
R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快.包括两个方面,一方面是写的快,代码简洁,只要一行命令就可以完成诸多任务,另一方面是处理 ...
DT包 -- R语言中自定义表格数据
DT 包提供了 JavaScript 库 DataTables 的一个R接口,它使得R对象(矩阵或数据框)可以在HTML页面上显示为表格. 该包的DataTables函数生成的表格提供了数据的筛选.分 ...

随机推荐

深入理解springAOP
概念:AOP(Aspect-Oriented Programming)即面向切面编程.它是对传统的OOP(面向对象)编程的一种补充,在OOP中往往一个对象有什么行为我们就定义什么方法,对象与对象之间存 ...
Solr学习总结（七）Solr搜索引擎的整体架构
经过前面一段时间的努力,终于把我所知道的关于solr 的内容都总结完了.前面讲到了solr 的安装配置,web管理后台的使用,solr 的查询参数和查询语法,还说到了solr的客户端 solrnet ...
[NHibernate]组件之依赖对象
目录写在前面文档与系列文章组件之依赖对象一个例子总结写在前面周一至周四一直在成都出差,也一直没有更新博客了,一回到家第一件事就是扒一扒最近博客园更新的文章,然后把想看的收藏了,大概有20 ...
PHP函数call_user_func和call_user_func_array详解
今天在群里面,有个叫lewis的在问call_user_func_array的用法,因为之前一直没有用过,也不能说什么,于是看一下手册,发现是这么写的: call_user_func_array (P ...
idea之resource配置
1.问题在idea中配置springmvc项目,用hibernate管理数据库,在web.xml中作如下配置:  <listener& ...
Site Not Found
http://moofx.it/ Site Not Found http://www. suchso.com /code/ace/gallery.html http://demo.rocketthem ...
【Python基础学习六】函数
1.创建函数 Python中函数的关键字def来定义. def fibs(num): f=[0,1] for i in range(1,num): f.append(f[-1]+f[-2]) retu ...
python pickle
>>> import pickle >>> m_list=[',2,'asa'] >>> m_list [', 2, 'asa'] >> ...
Java批量文件打包下载
经常遇到选择多个文件进行批量下载的情况,可以先将选择的所有的文件生成一个zip文件,然后再下载,该zip文件,即可实现批量下载,但是在打包过程中,常常也会出现下载过来的zip文件中里面有乱码的文件名, ...
Servlet 之 GenericServlet
我们都知道javaweb中servlet的三大组件 servlet filter listener 实现动态资源的是可以继承 Servlet接口,或者集成GenericServlet .Http ...

tibble包：高效显示表格数据的结构