R包开发过程记录
目的
走一遍R包开发过程,并发布到Github上使用。
步骤
1. 创建R包框架
Rsutdio ——> File——> New Project——> New Directory ——> R Package
创建完成后,在R包文件夹下有如下文件(夹):
- man: 存放
*.Rd
文件 - R: 存放R脚本
- DESCRIPTION: R包描述信息
- NAMESPACE: 命令空间
- rmytools.Rproj: R工程文件
2. 自定义R包
上面是Rstudio为开发者创建的一个框架,接下来是对自己开发的R包进行编写和注解。
①编写功能函数
点击Rstudio右下角Files中的R目录新建R函数(自带了一个hello.R)。要实现什么样的功能就编写相应函数,函数功能的组织和构建也是开发者重要的技能之一。这里作为示例,随便写了个画饼图的函数(因为现有画饼图的函数都不友好)。
my_pie <- function(data,ncol){
plotdat <- as.data.frame(table(data[,ncol])) %>% dplyr::arrange(-Freq)
plotdat$Label <- paste(plotdat$Var1, paste0("(",round(((plotdat$Freq/sum(plotdat$Freq))*100),2),"%)"))
p <- ggplot(plotdat, aes (x="", y = Freq, fill = factor(Var1))) +
geom_col(position = 'stack', width = 1) +
geom_text_repel(aes(label = Label, x = 1.3),size=5,
position = position_stack(vjust = 0.5)) +
theme_classic() +
theme(plot.title = element_text(hjust=0.5),
axis.line = element_blank(),
axis.text = element_blank(),
axis.ticks = element_blank()) +
labs(fill = "Category",x = NULL,y = NULL) +
coord_polar("y")
}
与一般的函数编写不同的是,我们需要对这个函数编写文档,这就是为什么我们在用R包中函数时可用?
来查看函数帮助。
编写完成后。。。
第一步,给函数添加注释,这里是对函数整体进行roxygen注释,方便文档生成,而非普通代码注释。光标放在函数名上,使用Ctrl+Shift+Alt+R
快捷键即可生成一个基本模板,我们根据需要进行相应修改即可。
#' Using a dataframe specific column to plot a pie figure
#'
#' @param data a dataframe or tibble
#' @param ncol specific column, factor
#'
#' @return a figure as ggplot2 object
#' @export
#'
#' @examples
#' my_pie(mtcars,ncol=2)
#' my_pie(diamonds,ncol=3)
#' my_pie(diamonds,ncol=3)+guides(fill="none")
#'
my_pie <- function(data,ncol){
plotdat <- as.data.frame(table(data[,ncol])) %>% dplyr::arrange(-Freq)
plotdat$Label <- paste(plotdat$Var1, paste0("(",round(((plotdat$Freq/sum(plotdat$Freq))*100),2),"%)"))
p <- ggplot(plotdat, aes (x="", y = Freq, fill = factor(Var1))) +
geom_col(position = 'stack', width = 1) +
geom_text_repel(aes(label = Label, x = 1.3),size=5,
position = position_stack(vjust = 0.5)) +
theme_classic() +
theme(plot.title = element_text(hjust=0.5),
axis.line = element_blank(),
axis.text = element_blank(),
axis.ticks = element_blank()) +
labs(fill = "Category",x = NULL,y = NULL) +
coord_polar("y")
}
第二步,运行devtools::document()
,会在man文件夹下生成该函数的Rd文件:
如果修改了函数的注释,需要重新执行第二步。
每个函数都是这样添加注释和文档,比如再添加一个ID转换的函数:
②修改DESCRIPTION
点击右下角Files中的DESCRIPTION对模块进行修改。
添加一些主要的信息即可:
- Package: 包名
- Description: 描述信息
- Depends: 依赖R版本(要注意空格,否则后续会报错)
- Suggest:建议包,非必需
- Imports:依赖包(这里编写的函数依赖了图中5个R包)
- License:协议
③安装R包
Rstudio ——> Build
,可构建源码包或者二进制包。
点击后会进行编译以及更新文档。
使用?my_pie
等编写的函数,已经可以查看文档了,说明编译成功,已经可以使用R包了。
3. 上传Github
如果只是自己使用,可以放在本地。本着R语言开源精神,要想分享给其他人使用,需要有地方托管。权威认可的地方如CRAN、Bioconductor等,但如果专业度不够高或者处于开发阶段,还是托管在Github上吧。
从本地仓库上传到Github远程仓库,与一般代码上传无异。
首先,进入本地R包目录。
git init
git add .
git commit -m 'my first r package'
然后,登录Github新建Repository
(建议用SSH地址,尽量不要用HTTPS地址)。
第三,本地仓库关联GitHub,上传代码。
git remote add origin git@github.com:***/test.git
git pull origin master #先pull下
git push -u origin master
有个小插曲,我在pull的过程中,遇到了如下错误:
原因是SSH keys没有设置或者过期了,SSH keys 可以在没有密码的情况下信任当前工作的计算机。解决办法是生成并设置SSH keys。具体可参考这篇教程:解决github Permission denied (publickey)问题。
上传成功。
4. 安装使用
devtools工具为我们提供了Github的R包安装方式:
devtools::install_github("**/my_rpackage/rmytools")
library(rmytools)
用内置数据集试下:
my_pie(mtcars,2)
my_pie(diamonds,ncol=3)
my_pie(diamonds,ncol=3)+guides(fill="none") #ggplot2对象,自由编辑
用R包来管理组织自己平时经常用的代码是一种非常高效的方式,后续想添加任何功能或修改原有脚本,只需git push,重新装一下R包即可。是时候整理整理之前混乱的代码了(俗称屎山)。
R包开发过程记录的更多相关文章
- 机器学习数据集,主数据集不能通过,人脸数据集介绍,从r包中获取数据集,中国河流数据集
机器学习数据集,主数据集不能通过,人脸数据集介绍,从r包中获取数据集,中国河流数据集 选自Microsoft www.tz365.Cn 作者:Lee Scott 机器之心编译 参与:李亚洲.吴攀. ...
- 极简 R 包建立方法--转载
https://cosx.org/2013/11/building-r-packages-easily/ 最近想试一下捣腾一个 R 包出来,故参考了一些教程.现在看到的最好的就是谢益辉大大之前写过的开 ...
- 如何创建R包并将其发布在 CRAN / GitHub 上--转载
转载--https://www.analyticsvidhya.com/blog/2017/03/create-packages-r-cran-github/ 什么是 R 包?我开始创建 R 包的原因 ...
- 如何制作自己的R包?
摘自 方匡南 等编著<R数据分析-方法与案例详解>.电子工业出版社 R包简介 R包提供了一个加载所需代码.数据和文件的集合.R软件自身就包含大约30种不同功能的包,这些基本包提供了R软件的 ...
- 如何制作自己的R包
如何制作自己的R包? 摘自 方匡南 等编著<R数据分析-方法与案例详解>.电子工业出版社 R包简介 R包提供了一个加载所需代码.数据和文件的集合.R软件自身就包含大约30种不同功能的包,这 ...
- R语言无网络安装R包,彻底解决依赖问题!
R version: 3.5.3, 3.6.3 更新日期: 2020-9-10 大家测试后多提建议哈, 有问题我会持续更新的 在工作中,我们使用的服务器通常是不能联外网的,这在安装R包的时候产生了巨大 ...
- R包MetaboAnalystR安装指南(Linux环境非root)
前言 这是代谢组学数据分析的一个R包,包括用于代谢组学数据分析.可视化和功能注释等众多功能.最近有同事在集群中搭建蛋白和代谢流程,安装这个包出现了问题,于是我折腾了一上午. 这个包的介绍在:https ...
- 普通用户安装 R 包
转自 http://bnuzhutao.cn/archives/901 一般 R 语言的书籍上,介绍安装 R 包的方法都是这样的: install.packages("packagename ...
- R包介绍
R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截至2013年3月6日,CRAN已经收录了各类包4338个. 一. R语言包的安装 ...
随机推荐
- mybatis中的#和$的区别 以及 防止sql注入
声明:这是转载的. mybatis中的#和$的区别 1. #将传入的数据都当成一个字符串,会对自动传入的数据加一个双引号.如:order by #user_id#,如果传入的值是111,那么解析成sq ...
- Beta_Scrum Meeting_2
会议概要 日期:2021年5月30日 出席人员:除zwh以外的所有人员 会议概述:讨论前两天工作进度以及后两天工作计划 人员分工 组员 负责 前两日完成的工作 后两日即将完成的工作 遇到的困难 hcc ...
- BUAA2020软工作业(二)——对软件工程的初步理解
项目 内容 这个作业属于哪个课程 2020春季计算机学院软件工程(罗杰 任健) 这个作业的要求在哪里 个人博客作业 我在这个课程的目标是 进一步提高自己的编码能力,工程能力 这个作业在哪个具体方面帮助 ...
- logstash处理多行日志-处理java堆栈日志
logstash处理多行日志-处理java堆栈日志 一.背景 二.需求 三.实现思路 1.分析日志 2.实现,编写pipeline文件 四.注意事项 五.参考文档 一.背景 在我们的java程序中,经 ...
- spring security中动态更新用户的权限
在程序的执行过程中,有时有这么一种需求,需要动态的更新某些角色的权限或某些人对应的权限,当前在线的用户拥有这个角色或拥有这个权限时,在不退出系统的情况下,需要动态的改变的他所拥有的权限. 需求:张三 ...
- Linux有什么可取之处竟如此受欢迎
什么是Linux? Linux是一个操作系统软件.和Windows不同的是,Linux是一套开放源代码程序的.并可以自由传播的类Unix操作系统,它是一个支持多用户.多任务.多线程和多CPU的操作系统 ...
- 洛谷 P3147 [USACO16OPEN]262144 P
链接: P3147 P3146双倍经验 前言: 今天发现的一道很有意思的DP题 分析: 第一眼以为是区间DP,于是设f[i][j]为从第i个数到第j个数可以合出的最大值,但思考后发现并不能简单合并,并 ...
- 小白自制Linux开发板 九. 修改开机Logo
许久不见啊,今天我们继续来修改我们的系统. 通过前面的几篇文章我们已经能轻松驾驭我们的开发板了,但是现在都是追求个性化的时代,我们在开发板上打上了自己的Logo,那我们是否可以改变开机启动的Logo呢 ...
- 从零开始 DIY 智能家居 - 基于 ESP32 的智能紫外线传感器模块
目录 前言 硬件选择 二.使用步骤 获取代码 设备控制命令: 设备和协议初始化流程: 配置设备信息 回调函数注册 数据获取与上报流程 总结 前言 做了这么多传感器都是自己玩,这次家里人看不下去了,非得 ...
- DC综合与Tcl语法结构概述
转载:https://www.cnblogs.com/IClearner/p/6617207.html 1.逻辑综合的概述 synthesis = translation + logic optimi ...