目前GWAS方向发了很多文献,但是并没有一个很完善的R包对这些文献的数据进行汇总. 接下来推荐的这个是最新发表的GWAS数据汇总R包​.看了一下功能齐全,但是数据不是收录的很齐全​. 下面具体讲一下.​ 在R上安装 install.packages("remotes") remotes::install_github("ramiromagno/gwasrapidd") 查询是否有发表关于自身免疫性疾病的文章 library(gwasrapidd) my_studie…
划重点: 其中dataset_path = ''表示在Python工作文件夹 dataset_path = '..'表示在Python工作文件夹的上级文件夹 dataset_path = '某某文件夹/'表示在Python工作文件夹的某个下级文件夹   Python 数据集的相对路径/选择上级文件夹   选取相对路径关键在于两行代码 import os dataset_path = '' datafile2 = os.path.join(dataset_path, '跨境审核辅助表.xls')…
包(package)是多个函数的集合,常作为分享代码的基本单元,代码封装成包可以方便其他用户使用.越来越多的R包正在由世界上不同的人所创建并分发,这些分发的R包,可以从CRAN 或 github 上获取,由于向 CRAN 提交包审核非常严格,有些开发者并没有将自己开发的R包提至CRAN的意向,通过 devtools 可以轻松从 github上下载安装.包的生命周期一般会经历 source.bundled.binary.installed和in-memory五个阶段.参考资料 (http://r-…
摘自 方匡南 等编著<R数据分析-方法与案例详解>.电子工业出版社 R包简介 R包提供了一个加载所需代码.数据和文件的集合.R软件自身就包含大约30种不同功能的包,这些基本包提供了R软件的基本功能.与此同时,R作为一个开源软件,它提供了各种统计计算函数,从而方便使用者能够灵活机动的进行数据分析,甚至创造出符合特定需要的新统计计算方法,而这些函数大多是以包的形式提供,这些都是世界各地R用户自己编写的,并上传到网上分享.因此,制作出属于用户自己的R包,并与全世界的R用户共享是一件非常有意思的事情.…
如何制作自己的R包? 摘自 方匡南 等编著<R数据分析-方法与案例详解>.电子工业出版社 R包简介 R包提供了一个加载所需代码.数据和文件的集合.R软件自身就包含大约30种不同功能的包,这些基本包提供了R软件的基本功能.与此同时,R作为一个开源软件,它提供了各种统计计算函数,从而方便使用者能够灵活机动的进行数据分析,甚至创造出符合特定需要的新统计计算方法,而这些函数大多是以包的形式提供,这些都是世界各地R用户自己编写的,并上传到网上分享.因此,制作出属于用户自己的R包,并与全世界的R用户共享是…
https://cosx.org/2013/11/building-r-packages-easily/ 最近想试一下捣腾一个 R 包出来,故参考了一些教程.现在看到的最好的就是谢益辉大大之前写过的开发 R 程序包之忍者篇,以及 Hadley 大神(ggplot2 devtools 等一系列包的作者)的 教程.但是前者有一些过时,后者是全英文的,所以我这里记录一下比较简单的过程,给读者们一个参考思路.如果你有一些 R 程序,想塞到去一个自创的 R 包中,那么这篇文章就可能是你想要的.为了方便说明…
[下面列出每个步骤最有用的一些R包] .数据导入 以下R包主要用于数据导入和保存数据: feather:一种快速,轻量级的文件格式:在R和python上都可使用 readr:实现表格数据的快速导入 readxl:读取Microsoft Excel电子表格数据 openxlsx:读取Microsoft Excel电子表格数据 googlesheets:读取google电子表格数据 haven:读取SAS,SPSS和Stata统计软件格式的数据 httr:从网站开放的API中读取数据 rvest:网…
平时都是几百万的数据量,这段时间公司中了个大标,有上亿的数据量. 现在情况是数据已经在数据库里面了,需要用R分析,但是完全加载不进来内存. 面对现在这种情况,R提供了ff, ffbase , ETLUtils  的解决方案. 它可以很简单的加载,转换数据库的数据进入R内存,ETLUtils 包现在已经扩展了read.odbc.ffdf 方法用来查询Oracle, MySQL, PostgreSQL & sqlite databases.. 下面我们就来展示一个例子. require(ETLUti…
mysql查询进程.导入数据包大小设置 zoerywzhou@163.com http://www.cnblogs.com/swje/ 作者:Zhouwan 2017-12-27 查询正在执行的进程: 进入mysql,show processlist; mysql> show processlist;+-----+------+-----------------+------+---------+------+----------+------------------+| Id | User |…
前言 R对windows使用很友好,对Linux来说充满了敌意.小数据可以在windows下交互操作,效果很好很棒.可是当我们要处理大数据,或者要在集群上搭建pipeline时,不得不面对在Linux上装R及想要的R包这个难题,尤其是对非root用户而言更是艰难重重. 准备依赖库 依次安装:zlib/bzip/liblzma/pcre/curl,注意顺序和版本.目前3.4以上3.6以下R版本相对较为稳定和不过时,我自己安装的是3.5.2. cd zlib-1.2.11 ./configure -…
JDBC Request 这个Sampler可以向数据库发送一个jdbc请求(sql语句),并获取返回的数据库数据进行操作.它经常需要和JDBC Connection Configuration配置原件(配置数据库连接的相关属性,如连接名.密码等)一起使用. 一.准备工作 1.本文使用的是mysql数据库进行测试,数据库的用户名为root(你自己的用户名),用户名密码为*********(你自己的密码) 2.数据库中有表:test,表的数据结构如下: 表中数据如下: select * from…
JDBC Request 这个Sampler可以向数据库发送一个jdbc请求(sql语句),并获取返回的数据库数据进行操作.它经常需要和JDBC Connection Configuration配置原件(配置数据库连接的相关属性,如连接名.密码等)一起使用. 一.准备工作 1.本文使用的是mysql数据库进行测试,数据库的用户名为root(你自己的用户名),用户名密码为*********(你自己的密码) 2.数据库中有表:test,表的数据结构如下: 表中数据如下: select * from…
R不必说,数据统计分析可视化的必备语言,R包开发的门槛比较低,所以现在随便一篇文章都会发表一个自己的R包,这样有好处(各种需求早有人帮你解决了)也有坏处(R包太多,混乱,新手上手较难).作为生信工程师,日常就是查看别人写的R包,分析数据,然后借鉴.修改,根据自己的需求开发新的R包. 参考: http://blog.fens.me/r-build-package/ R包开发 如何系统地学习 R 语言的各种 packages? Developing Packages with RStudio To…
JDBC Request 这个Sampler可以向数据库发送一个jdbc请求(sql语句),并获取返回的数据库数据进行操作.它经常需要和JDBC Connection Configuration配置原件(配置数据库连接的相关属性,如连接名.密码等)一起使用. 一.准备工作 1.本文使用的是mysql数据库进行测试,数据库的用户名为root(你自己的用户名),用户名密码为*********(你自己的密码) 2.数据库中有表:test,表的数据结构如下: 表中数据如下: select * from…
https://www.cnblogs.com/jessepeng/p/10984983.html Linux 的R环境,可以通过anaconda jupyter notbook很容易的配置,见我之前的博客  https://www.cnblogs.com/shanyr/p/11276755.html 安装R包 Linux下安装R包一般有2种方式: 1. R CMD INSTALL 下载源码 R CMD INSTALL /.../mypackage.tar.gz 也可指定安装库路径: R CMD…
wget是linux下命令行的下载工具,功能很强大,它能完成某些下载软件所不能做的,比如如果你想下载一个网页目录下的所有文件,如何做呢?网络用户有时候会遇到需要下载一批文件的情况,有时甚至需要把整个网站下载下来或者制作网站的镜像.在Windows下的用户都比较熟悉 Teleport,webzip等等网站下载工具,实际上AIX中也完全可以做到这样的功能,那就是利用wget工具.wget是一个命令行工具,用来下载网络文件或者整个网站,它具有自动重试.断点续传.支持代理服务器等等强大的功能.它可以完全…
转自 http://bnuzhutao.cn/archives/901 一般 R 语言的书籍上,介绍安装 R 包的方法都是这样的: install.packages("packagename"); 一般而言这不会成功,因为它默认会安装到系统目录下面,而普通用户在这个目录里并没有写入的权限. 因此,需要在 install.packages 这个函数里面指定安装的路径,例如想安装到 /home/myname/R 这个目录,就这么写: install.packages("packa…
R语言的使用,很大程度上是借助各种各样的R包的辅助,从某种程度上讲,R包就是针对于R的插件,不同的插件满足不同的需求,截至2013年3月6日,CRAN已经收录了各类包4338个. 一. R语言包的安装 1.通过选择菜单: 程序包->安装程序包->在弹出的对话框中,选择你要安装的包,然后确定. 2.使用命令 install.packages("package_name","dir") package_name:是指定要安装的包名,请注意大小写. dir:包…
浅复制 工作要用到的.git有1.8G太大了.下载过程要好几个小时,太慢了.可以这样操作 git clone 默认会下载项目的完整历史版本,如果你只关心最新版的代码,而不关心之前的历史信息,可以使用 git 的浅复制功能: $ git clone --depth=1 https://github.com/bcit-ci/CodeIgniter.git--depth=1 表示只下载最近一次的版本,使用浅复制可以大大减少下载的数据量,例如,CodeIgniter 项目完整下载有近 100MiB ,而…
Saiku根据入参日期查询出对应的数据 之前好像有写过一篇博客关于saiku date range的,现在进一步更新啦!!! 这里的日期筛选会更完善一些,需要提供两个参数 开始日期与结束日期(startdate and  enddate) 参数的日期格式为: yyyy-MM-dd (2019-03-26) 主要是更改了saiku原代码中的两个js文件: js/saiku/models/Query.js  与  js/saiku/views/SelectionsModal.js  >> 如果是改…
机器学习数据集,主数据集不能通过,人脸数据集介绍,从r包中获取数据集,中国河流数据集   选自Microsoft www.tz365.Cn 作者:Lee Scott 机器之心编译 参与:李亚洲.吴攀.杜夏德 要学习怎么使用微软 Azure 机器学习,最重要的是获取样本数据集和进行实验. 在微软,我们有大量的样本数据集可用.这些数据集已经在 Azure Cortana Intelligence Gallery 中的样本模型中得到了应用. 其中一些数据集可以通过 Azure Blob 存储获取,所以…
转载--https://www.analyticsvidhya.com/blog/2017/03/create-packages-r-cran-github/ 什么是 R 包?我开始创建 R 包的原因是?创建包的好处和挑战必要条件开始创建你的第一个包发布包向CRAN 做贡献后的体验附加提示Additional resources 1. 什么是 R 包? R 包就是一个可重复使用的 R 函数,附带有关如何使用的标准.简要说明文档.有时,包还附带简单的数据. 直至今日,CRAN 上有 10000多个…
出现这个问题的原因是因为文件下载到一半就中断了,解决办法是删除datasets中下载到一半的数据包. 下面以我遇到的问题为例: 我下载数据下载到最后一个包就没有反应了,于是我强制终止了运行,可能是因为网络问题,到后面我再运行发现疯狂报错... 搜了很多博客,有的说删掉tmp文件夹下的文件,有的说删除掉dataset下的文件,但是后来我发现每个人的问题不一样,下载文件的目录可能也不同. 在Windows下查看已下载的MNIST数据文件 上图中画圈的位置有个Keras,我的datasets就是在Ke…
本文对应脚本已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes 1 简介 我们平时在数据可视化或空间数据分析的过程中经常会需要某个地区的道路网络及节点数据,而OpenStreetMap就是一个很好的数据来源(譬如图1柏林路网): 图1 通常我们可以在 https://www.openstreetmap.org/export 中选择矩形区域内的路网矢量数据进行下载,但这种方式对选择区域的大小有一定限制,想获取较大范围区域…
文章更新于:2020-03-07 按照惯例,需要的文件附上链接放在文首: 文件名:R-3.6.2-win.exe 文件大小:82.4M 下载链接:https://www.lanzous.com/i9c70mf SHA256: DC967492639B236BA057FA3B4CA482FA64C7A8E4CAD720595592C5387D28B49F 文章目录 一.R 语言介绍 二.R 语言语法知识 (一)规则 (二)编程实践 1.定义变量 2.算数运算符 三.数据结构 1.向量 2.矩阵和数…
R version: 3.5.3, 3.6.3 更新日期: 2020-9-10 大家测试后多提建议哈, 有问题我会持续更新的 在工作中,我们使用的服务器通常是不能联外网的,这在安装R包的时候产生了巨大的不便.网上有很多帖子使用tools::package_dependencies这个工具下载依赖,但是这个工具是有坑的,相信尝试过的同学依然会发现有些依赖包在下载时被漏掉了,查了很多帖子,这个问题一直没有很好的解决. 今天,我就来解决这个问题,一来,方便自己,二来,服务他人. 我们就用R自己来解决自…
前言 这是代谢组学数据分析的一个R包,包括用于代谢组学数据分析.可视化和功能注释等众多功能.最近有同事在集群中搭建蛋白和代谢流程,安装这个包出现了问题,于是我折腾了一上午. 这个包的介绍在:https://github.com/xia-lab/MetaboAnalystR,安装确实还比较复杂,依赖的东西太多太多.废话不多说,记录下安装历程. 安装过程 首先最好是已经安装了自己的R版本(非root),比如我的是R-3.5.2.然后进入R中,依照文档给的顺序依次安装: 第一步:安装依赖包 insta…
1.安装,加载所用到到R包 用BiocManager安装,可同时加载依赖包 source("https://bioconductor.org/biocLite.R") BiocManager::install("clusterProfiler") library(clusterProfiler) ##富集分析library(topGO) ###画GO图library(AnnotationHub) ##获取数据库library(BiocFileCache) ##依赖包…
最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下: 1. mixOmics 应该是在多组学领域知名度最高的一个R包,有专门的团队,做了十余年了,引用量也比较高. 官网:http://mixomics.org/ 文章:mixOmics: An R package for 'omics feature selection and multiple data integration Gi…
最终效果图: 样式丑哭了,我毕竟不是前端,宗旨就是练练手,体验微信小程序的开发,以最直接的方式获取12306数据查询火车票. 目录结构: search1是出发站列表,search2是目的站列表,命名没有太好好想. 车站信息 12306查询页面,打开浏览器开发者工具分析请求,发现各个车站的信息都在这个JS文件中: 当然车站的信息会发生变动,所以最好的方式就是抓取数据,我现在为了方便,直接把数据拷贝过来,就是一大堆字符串: 通过正则截取出目前项目需要的两个东西,如:北京北 VAP 在search1.…