查询、下载GWAS目录数据的R包(gwasrapidd)

橙子牛奶糖 2024-08-24 01:18:45 原文

目前GWAS方向发了很多文献，但是并没有一个很完善的R包对这些文献的数据进行汇总。

接下来推荐的这个是最新发表的GWAS数据汇总R包。看了一下功能齐全，但是数据不是收录的很齐全。
下面具体讲一下。

在R上安装

install.packages("remotes")

remotes::install_github("ramiromagno/gwasrapidd")

查询是否有发表关于自身免疫性疾病的文章

library(gwasrapidd)

my_studies <- get_studies(efo_trait = 'autoimmune disease')

查询发表自身免疫性疾病文章的数量

n(my_studies)

获取发表自身免疫性疾病的文章ID

my_studies@studies$study_id

查询发表自身免疫性疾病的文章标题

my_studies@publications$title

查看发表自身免疫性疾病文章在pubmed的界面信息

open_in_pubmed(my_studies@publications$pubmed_id)

获取发表身高文献的SNP关联信息

my_associations <- get_associations(study_id = my_studies@studies$study_id)

查询P值小于1e-6的位点

dplyr::filter(my_associations@associations, pvalue < 1e-6) %>% # Filter by p-value
tidyr::drop_na(pvalue) %>%
dplyr::pull(association_id) -> association_ids # Extract column association_id

提取显著信号位点信息

my_associations2 <- my_associations[association_ids]

显示显著信号位点的个数

n(my_associations2)

显示显著信号位点的RS ID， risk allele, 频率

my_associations2@risk_alleles[c('variant_id', 'risk_allele', 'risk_frequency')] %>%

print(n = Inf)

获取含有rs12752552位点的文献

s2 <- get_studies(variant_id = 'rs12752552')

测试了一下，优点是减去了很多信息检索的工作，缺点是这个包刚开发不久，信息还不够齐全

更多详细信息请看gwasrapidd

参考文献：Magno R, Maia A T. gwasrapidd: an R package to query, download and wrangle GWAS Catalog data[J]. bioRxiv, 2019: 643940.

查询、下载GWAS目录数据的R包(gwasrapidd)的更多相关文章

python 导入同级目录文件、上级目录文件以及下级目录数据集和模块包
划重点: 其中dataset_path = ''表示在Python工作文件夹 dataset_path = '..'表示在Python工作文件夹的上级文件夹 dataset_path = '某某文件夹 ...
R(三): R包原理及安装
包(package)是多个函数的集合,常作为分享代码的基本单元,代码封装成包可以方便其他用户使用.越来越多的R包正在由世界上不同的人所创建并分发,这些分发的R包,可以从CRAN 或 github 上获 ...
如何制作自己的R包？
摘自方匡南等编著<R数据分析-方法与案例详解>.电子工业出版社 R包简介 R包提供了一个加载所需代码.数据和文件的集合.R软件自身就包含大约30种不同功能的包,这些基本包提供了R软件的 ...
如何制作自己的R包
如何制作自己的R包? 摘自方匡南等编著<R数据分析-方法与案例详解>.电子工业出版社 R包简介 R包提供了一个加载所需代码.数据和文件的集合.R软件自身就包含大约30种不同功能的包,这 ...
极简 R 包建立方法--转载
https://cosx.org/2013/11/building-r-packages-easily/ 最近想试一下捣腾一个 R 包出来,故参考了一些教程.现在看到的最好的就是谢益辉大大之前写过的开 ...
R 包
[下面列出每个步骤最有用的一些R包] .数据导入以下R包主要用于数据导入和保存数据: feather:一种快速,轻量级的文件格式:在R和python上都可使用 readr:实现表格数据的快速导入 r ...
R语言操作mysql上亿数据量(ff包ffbase包和ETLUtils包)
平时都是几百万的数据量,这段时间公司中了个大标,有上亿的数据量. 现在情况是数据已经在数据库里面了,需要用R分析,但是完全加载不进来内存. 面对现在这种情况,R提供了ff, ffbase , ETLU ...
mysql查询进程、导入数据包大小设置
mysql查询进程.导入数据包大小设置 zoerywzhou@163.com http://www.cnblogs.com/swje/ 作者:Zhouwan 2017-12-27 查询正在执行的进程: ...
Linux环境下R和R包安装及其管理
前言 R对windows使用很友好,对Linux来说充满了敌意.小数据可以在windows下交互操作,效果很好很棒.可是当我们要处理大数据,或者要在集群上搭建pipeline时,不得不面对在Linux ...

随机推荐

静态Pod
静态Pod kubernetes 除了我们常用的普通Pod外,还有一种特殊的Pod,叫静态Pod. 概念静态Pod是直接由节点kubelet进程来管理的,不能通过apiserver的master节点 ...
NGINX状态模块的使用
nginx状态模块可以用来查看当前nginx服务器的并发量和总的请求数启用nginx的状态模块状态模块需要在编译安装的时候启用. 1.下载nginx源码包 2.安装nginx并启用模块 3.修改n ...
beta版本——第五次冲刺
第五次冲刺 (1)SCRUM部分☁️ 成员描述: 姓名李星晨完成了哪个任务界面优化花了多少时间 2h 还剩余多少时间 2h 遇到什么困难没有这两天解决的进度 2/2 后续两天的计划完成文 ...
助教总结---继alpha版本1之后
本周心得: 在项目的开发当中,学生难免会有懈怠的时候,作为助教更应该去督促和激励同学们,但本质上该对自己负责任的是同学们自己.同学们项目的第一版本已经出来了,这个过程他们自己知道付出了多少,相信他们体 ...
学习app开发思路
1.首先在学习之前进行一次或者是整体或者是部分的检测,当第一次检测就通过,则可以认为是熟练掌握的东西(可以在后期对其进行验证是否是熟练)2.后面的学习过程,对回答的正确与否以及从第一次开始学习到目前为 ...
java怎么比较两个实体类的属性值
分享一下比较两个实体类的工具包 package cn.mollie.utils; import java.beans.Introspector; import java.beans.PropertyD ...
P1972 [SDOI2009]HH的项链[离线+树状数组/主席树/分块/模拟]
题目背景无题目描述 HH 有一串由各种漂亮的贝壳组成的项链.HH 相信不同的贝壳会带来好运,所以每次散步完后,他都会随意取出一段贝壳,思考它们所表达的含义.HH 不断地收集新的贝壳,因此,他的项链 ...
与你一起学习MS Project——理论篇：项目管理与Project
Hi,你好!我是大黄蜂,非常高兴借此机会与你一起学习微软Project的相关知识和技能.这一次的分享主要是结合本人在实际使用Project 2013过程中的一些方法技巧,其中有一些材料则来源于互联网, ...
lis框架各种方法的使用
//这个必须是lpedorapp表的主键才行LPEdorAppDB tLPEdorAppDB = new LPEdorAppDB();tLPEdorAppDB.setEdorAcceptNo(mEdo ...
Spark 缓存机制
Spark中的缓存机制:避免spark每次都重算RDD以及它的所有依赖,cache().persist(). checkpoint(). 1.cache():会被重复使用,但是不能太大的RDD,将其c ...