最近打算开始写一个多组学(包括宏基因组/16S/转录组/蛋白组/代谢组)关联分析的R包,避免重复造轮子,在开始之前随便在网上调研了下目前已有的R包工具,部分罗列如下:

1. mixOmics

应该是在多组学领域知名度最高的一个R包,有专门的团队,做了十余年了,引用量也比较高。

官网:http://mixomics.org/

文章:mixOmics: An R package for ‘omics feature selection and multiple data integration

Github:https://github.com/mixOmicsTeam/mixOmics

Bookdown:https://mixomicsteam.github.io/Bookdown/

特点:

  • 组学数据广,基因/转录/蛋白/代谢都有涉及(是我的榜样);
  • 独特的多变量降维分析和可视化方法(我统计没学好,所以不做太多统计方法,重点在于可视化,包括多种关联角度的展示方式)。

主要内容:

统计方法:PCA/IPCA/CCA/PLS/PLS-DA/MixMC/MINT/DIABLO

可视化:2D和3D散点图/相关性网络/聚类/相关性圈图/箭头图/DIABLO圈图/载荷图

此外,这个包还自带了不少demo数据,具体可看官方文档。

2. tRanslatome

2014年就发表了,好在一直都有维护。

文章:tRanslatome: an R/Bioconductor package to portray translational control

Bioconductor:https://bioconductor.org/packages/release/bioc/html/tRanslatome.html

作者博客:http://www.mybiosoftware.com/tag/translatome

Github:https://github.com/tomateba/tRanslatome(五年前的源码)

特点:

  • 组学:主要是针对基因表达量的关联,包括转录组、翻译组和蛋白组;
  • 统计方法:Rank Product, Translational Efficiency, t-test, Limma, ANOTA, DESeq, edgeR
  • 可视化:scatterplots, histograms, MA plots, standard deviation (SD) plots, coefficient of variation (CV) plots

3. OmicsARules

最近新出的一个R包,创建了一种新的关联方法。

文章:OmicsARules: a R package for integration of multi-omics datasets via association rules mining

Github:https://github.com/BioinformaticsSTU/OmicsARules

特点:

  • 主要针对基因组和转录组数据,包括基因突变位点和非编码RNA;
  • 发明一种Lamda3的度量方法创建关联规则,可视化不是重点。

4. iCluster / iClusterPlus

十年前开发的iCluster算法(联合潜在变量模型),针对癌症数据多组学聚类。去年的时候又开发了一个新的iClusterPlus包,做了一些升级。

文章1:Integrative clustering of multiple genomic data types using a joint latent variable model with application to breast and lung cancer subtype analysis

Github:https://github.com/cran/iCluster

Bioconductor:https://bioconductor.org/packages/release/bioc/html/iClusterPlus.html

文章2:A fully Bayesian latent variable model for integrative clustering analysis of multi-type omics data

这种基于模型算法的工具我只能望洋兴叹,会用就不错了。

5. integrOmics

十多年的工具,虽然当年发了Bioinformatics,后面没有维护更新,废了。

文章:integrOmics: an R package to unravel relationships between two omics datasets

Github:https://github.com/cran/integrOmics

6. moCluster

这也是一种算法,和icluster类似,主要整合数据聚类,用于细胞或疾病分子分型等。应用场景相对比较单一。

7. MCIA

这个包又可称omicade4: Multiple co-inertia analysis of omics datasets,即多元协惯量分析。一种多元统计分析方法,类似于PCA的展示吧,比较有限。

Bioconductor:http://bioconductor.org/packages/release/bioc/html/omicade4.html

Github:https://github.com/aedin/omicade4

8. 其他

其他还有不少R包做组学数据整合,或是基于新的算法,或是仅针对基因突变和基因表达关系等方面进行关联,相对而言比较冷门,如:

  • CNAmet
  • PLRS
  • NuChart
  • MOO
  • Mergeeomics(这个包主要做GWAS/TWAS/EWAS/eQTL等,有点意思)

除了以上常用的R包,更多的多组学工具和方法可参考这一篇综述:https://jme.bioscientifica.com/view/journals/jme/62/1/JME-18-0055.xml

多组学分析及可视化R包的更多相关文章

  1. MetaboAnalyst的多组学分析

    MetaboAnalyst是做代谢的R包,功能十分强大.也开发了web版本,代谢组学的分析这里不介绍,主要讲讲它开发的多组学分析的相关内容. 既然是做代谢的工具,即使是增加了多组学内容,肯定也是以代谢 ...

  2. 解读人:谭亦凡,Macrophage phosphoproteome analysis reveals MINCLE-dependent and -independent mycobacterial cord factor signaling(巨噬细胞磷酸化蛋白组学分析揭示MINCLE依赖和非依赖的分支杆菌索状因子信号通路)(MCP换)

    发表时间:2019年4月 IF:5.232 一. 概述: 分支杆菌索状因子TDM(trehalose-6,6’-dimycolate)能够与巨噬细胞C-型凝集素受体(CLR)MINCLE结合引起下游通 ...

  3. 解读人:范徉,Methylome and Metabolome Analyses Reveal Adaptive Mechanisms in Geobacter sulfurreducens Grown on Different Terminal Electron Acceptors(甲基化组学和代谢组学分析发现Geobacter sulfurreducens生长在不同电子终受体中的适应机制)

    发表时间: (2019年4月) IF:3.950 单位: Fujian Provincial Key Laboratory of Soil Environmental Health and Regul ...

  4. R包MetaboAnalystR安装指南(Linux环境非root)

    前言 这是代谢组学数据分析的一个R包,包括用于代谢组学数据分析.可视化和功能注释等众多功能.最近有同事在集群中搭建蛋白和代谢流程,安装这个包出现了问题,于是我折腾了一上午. 这个包的介绍在:https ...

  5. Untargeted lipidomics reveals specific lipid abnormality in nonfunctioning human pituitary adenomas 非靶向脂质组学揭示非功能人类脑垂体瘤中的特异性脂质 (解读人:胡丹丹)

    文献名:Untargeted lipidomics reveals specific lipid abnormality in nonfunctioning human pituitary adeno ...

  6. 可视化数据包分析工具-CapAnalysis

    可视化数据包分析工具-CapAnalysis 我们知道,Xplico是一个从pcap文件中解析出IP流量数据的工具,本文介绍又一款实用工具-CapAnalysis(可视化数据包分析工具),将比Xpli ...

  7. R包 randomForest 进行随机森林分析

    randomForest 包提供了利用随机森林算法解决分类和回归问题的功能:我们这里只关注随机森林算法在分类问题中的应用 首先安装这个R包 install.packages("randomF ...

  8. 【GS模型】使用R包sommer进行基因组选择的GBLUP和RRBLUP分析?

    目录 简介 GS示例代码 简介 R包sommer内置了C++,运算速度还是比较快的,功能也很丰富,可求解各种复杂模型.语法相比于lme4包也要好懂一些. 建议查看文档:vignette("v ...

  9. maftools|TCGA肿瘤突变数据的汇总,分析和可视化

    本文首发于公众号“生信补给站”,https://mp.weixin.qq.com/s/WG4JHs9RSm5IEJiiGEzDkg 之前介绍了使用maftools | 从头开始绘制发表级oncoplo ...

随机推荐

  1. CSP-S 2021 遗言

    感谢€€£,谢谢宁嘞! 第一题,€€£给了很多限制条件,什么"先到先得"."只有一个跑道",让它看起来很好做,然后来骗,来偷袭,广大"消费者" ...

  2. 零基础入门非常好的C语言基础资料

    C语言程序的结构认识 用一个简单的c程序例子,介绍c语言的基本构成.格式.以及良好的书写风格,使小伙伴对c语言有个初步认识. 例1:计算两个整数之和的c程序: #include main() { in ...

  3. Shooting Bricks题解

    题目传送门 以后我绝对不会一直磕着一道题磕几个小时了...感觉还是自己节奏出了问题,不知为啥感觉有点小慌... 算了,其实再回头仔细看一下这个题dp的思路还是比较好想出来的,打代码之前一定要做好足够的 ...

  4. C#笔记1__命名空间 / 常量 / object / is、as、...?... :...

    命名空间:namespace Test1{ ... } 引用命名空间:using System; using 别名=命名空间 常量:const double PI=3.14; using System ...

  5. Linux&c 文件操作,线程进程控制,网络编程,简单知识点梳理

    一:文件操作 在linux下,一切皆文件,目录是文件,称为目录文件,内容是该目录的目录项(但是目录只有内核可以编辑,超级用户也不可以编辑),设备也是设备文件,在/dev存放的就是一些设备文件,linu ...

  6. JavaScript 对象:String & Array 及其常见应用

    String对象 split 功能:把字符串分割为字符串数组.官方文档已经描述的够清楚,不多赘述.主要说一下需要注意的情况以及应用 1.省略分割参数 var str="How are you ...

  7. Hadoop HA集群 与 开发环境部署

    每一次 Hadoop 生态的更新都是如此令人激动 像是 hadoop3x 精简了内核,spark3 在调用 R 语言的 UDF 方面,速度提升了 40 倍 所以该文章肯定得配备上最新的生态 hadoo ...

  8. pytest-allure测试报告

    该类型的警告大多属于版本更新时,所使用的方法过时的原因,可以在该方法的说明出查找替换的方法 1.安装allure a)下载allure.zip https://github.com/allure-fr ...

  9. 微信小程序(九)

    小程序运行环境与基本架构 每个小程序都是运行在它所在的微信客户端上的,通过微信客户端给它提供的运行环境,小程序可以直接获取微信客户端的原生体验和原生能力. wxml视图文件和wxss样式文件都是对渲染 ...

  10. 菜鸡的Java笔记 第二十二 - java 对象多态性

    本次只是围绕着多态性的概念来进行讲解,但是所讲解的代码与实际的开发几乎没有关系,而且多态一定是在继承性的基础上才可以操作的,        而本次将使用类继承的关系来描述多态的性质,实际的开发中不会出 ...