文章题目

A systematic evaluation of single-cell RNA-sequencing imputation methods

中文名:

单细胞RNA测序插补方法的系统评价

文章地址:

https://doi.org/10.1186/s13059-020-02132-x

本帖只探讨设计假阳性的检测部分,其余不做补充。

评价插补方法:



多种插补方法的评测:

评估了

(1)基于模型的插补方法(bayNorm[19]、SAVER[20]、SAVER-X[21]、scImpute[22]、scRecover[23]、VIPER[24])

(2)基于平滑的插补法(DrImpute[25]、MAGIC[26]、kNN平滑[27])

(3)使用深度学习方法(AutoImpute[28]、DCA[29]、DeepImpute[30]、SAUCIE[31]、scScope[32]、scVI[33])

(4)基于低秩矩阵的方法(ALRA[34]、mcImpute[3]、PBLR[36])的数据重建方法

比较思路:

  1. 通过比较同质细胞群中的插补细胞轮廓和批量样本之间的相似性,评估插补方法本身在恢复真实表达值方面的性能
  2. 研究了下游分析中插补方法的性能,包括差异表达分析、无监督聚类和轨迹分析

使用数据:

  1. 模拟数据
  2. 使用 plast-based和droplet-based的两种scRNA-seq数据

有关假阳性的测试部分:

1.DEG分析

假设:多次测试校正后 同质细胞不会出现DEG

试验方法:

同一细胞类型分成两组细胞 X_Y X和Y分别代表每一组的细胞个数

在不做插补和做完各类插补后 两组之间的差异性 计算MAST和Wilcoxon两种index

结果:

不同类型的插补方法识别假阳性DEG的方法并不一致,因为所有类型的插拔方法(基于模型、基于平滑和基于数据重建)都有报告假阳性DEGs的例子。同时,当识别DEG时,细胞群大小不平衡导致更多的插补方法使用MAST和Wilcoxon报告假阳性

2.补充第一条

问题:已知细胞类型特异性标记基因的插补表达是否能够正确预测细胞类型(使用真-数据集)

数据集

使用基于UMI和FACS分类的外周血单个核细胞(PBMC)数据集(PBMC_10x_tissue)和在纯化的PBMC细胞类型中高度表达的已知PBMC标记基因(CD19用于B细胞;CD14用于单核细胞;CD34用于CD34+细胞;CD3D用于CD4 T辅助细胞、细胞毒性T细胞、记忆T细胞、细胞毒T细胞、调节性T细胞;CD8A用于细胞毒性T淋巴细胞和细胞毒T淋巴细胞)

试验方法:

评估了基于标记基因(如CD19)表达预测细胞类型(如B细胞)的性能。

估计了ROC(AUROC)曲线下的面积,其中标记基因的表达(如CD19表达)是预测因子,而真正的细胞类型(如B细胞或非B细胞)是标签

结果:

11种插补方法中有10种(返回插补数值的)产生的AUROC高于没有插补的方法

3.DE占数据集中基因的比率对插补方法的影响

已知

在识别DEG的背景下,DE对插补法的性能至关重要

方法

使用大量RNA序列数据将细胞系成对和分层基因分为高LFC和低LFC,其中高(或低)LFC基因定义为基于LFC绝对值的前10%(或后10%)基因。

LFC-Log Fold change:具体含义看下面这篇帖子:

DEG计算指标-LFC和P-value

结果



当DE的大小较大时,大多数插补方法(16种返回插补值的方法中有13种)的体细胞DEG和单细胞DEG之间的重叠程度高于无插补(图3j)。.然而,当 DE 的幅度较小时,与没有插补相比,16 种方法中只有 2 种增加了散装和单细胞 DEG 之间的重叠,这表明大多数插补方法可能已经平滑了小的差异信号 (Fig. 3k)

不同数据集有不同的信号丰度与强度,数据集合内DEG越多,imputation越容易将插补后结果与Bulk批量RNA结果重合。

大多数插补方法改进了对具有大 LFC 的 DE 基因的分析,而不是没有插补,但对具有小 LFC 的基因没有改进

结论

目前的插补方法作为一个整体,似乎对提供单个基因活性的点估计最为有效,当与各种下游分析任务相结合时,它们的效率会降低

对于差异表达分析,有效性降低可能是由于插补后细胞方差描述不准确。对于聚类和轨迹分析,效率可能会降低,因为这两种分析试图分析细胞与细胞之间的关系,而不是单个基因。细胞聚类和轨迹分析通常通过将每个细胞的高维表达向量嵌入到一个相对低维的空间来进行。低维空间中的每个维度都包含来自许多基因的信息,这通过稀释技术噪声(如由于技术变化而观察到的零点)来增加信噪比,即使没有插补。

因此,插补对细胞间关系的恢复影响较小。相比之下,单个基因的测量包含高水平的技术噪声,通过从其他基因或细胞中借用信息进行插补,可以大大减少技术噪声。因此,插补可能更有助于分析单个基因,而不是细胞与细胞之间的关系

未来有待研究的一个公开问题是,插补对各种下游分析任务的改进是否已经达到上限,如果没有,如何设计新的插补方法,以进一步改进考虑到细胞变异性的细胞间关系或差异表达的分析

imputation文献-A systematic evaluation of single-cell RNA-sequencing imputation methods的更多相关文章

  1. Advances in Single Cell Genomics to Study Brain Cell Types | 会议概览

    单细胞在脑科学方面的应用 Session 1: Deciphering the Cellular Landscape of the Brain Using Single Cell Transcript ...

  2. 单细胞参考文献 single cell

    许多分析软件 : https://github.com/seandavi/awesome-single-cell#software-packages Smart-seq.CEL-seq.SCRB-se ...

  3. 单细胞测序技术(single cell sequencing)

    单细胞测序技术(single cell sequencing) 2018-03-02 11:02   来源: 一呼百诺  点击次数:6587关键词:   前言 单细胞生物学最近几年是非常热门的研究方向 ...

  4. Analysis of single cell RNA-seq data(单细胞终极课程)

    业界良心啊,开源的单细胞课程. 随便看了几章,课程写得非常用心,非常适合新手. 课程地址:Analysis of single cell RNA-seq data 源码地址:hemberg-lab/s ...

  5. Multiclonal Invasion in Breast Tumors Identified by Topographic Single Cell Sequencing

    Title:  Multiclonal Invasion in Breast Tumors Identified by Topographic Single Cell Sequencing 课题的目的 ...

  6. Single Cell Genomics Day: A Practical Workshop

    干货满满! Single Cell Genomics Day: A Practical Workshop

  7. CAR-T|Single cell plan|Extracellular RNA|

    生物医疗大数据 安吉丽娜朱莉发现抑癌基因事件,BRCA突变与乳腺癌关联. 个体化测序商品23 and me 多组学数据研究:eg:太空和地球双胞胎发现生化指标差不多. 研究模式和工业模式相结合. 研究 ...

  8. 文献阅读 | Benchmarking single cell RNA-sequencing analysis pipelines using mixture control experiments

    资源: sci-hub paper CellBench package - github CellBench_data - code for the paper 现在单细胞领域的突出问题就是工具过多, ...

  9. 论文学习-系统评估卷积神经网络各项超参数设计的影响-Systematic evaluation of CNN advances on the ImageNet

    博客:blog.shinelee.me | 博客园 | CSDN 写在前面 论文状态:Published in CVIU Volume 161 Issue C, August 2017 论文地址:ht ...

  10. 单细胞 RNA-seq 10X Genomics

    单细胞流程跑了不少,但依旧看不懂结果,是该好好补补了. 有些人可能会误会,觉得单细胞的RNA-seq数据很好分析,跟分析常规的RNA-seq应该没什么区别.今天的这篇文章2015年3月发表在Natur ...

随机推荐

  1. CodeGym自学笔记12——类名

    类的全名 类的全名由所有包的名称(由句点分隔)和类名组成. "要在代码中使用类,你需要指出类的全名.你也可以使用类的短名称,即只使用类名,但你需要'导入类'.这意味着在声明类之前,你要指出单 ...

  2. 使用PHP自带的过滤验证函数:Filter

    在PHP开发中,大家经常会对提交的表单数据做合法性验证,比如验证Email/IP/URL,大家首先想到的应该是使用正则验证.其实在PHP中已经内置了一个过滤验证函数Filter,大家可以参考一下. P ...

  3. vue中组件传值的几种方式

    一.父组件给子组件传值方式(步骤) 1.VC1(子组件)定义props[a,b,c] 注意:props中的每个值都可以加各种修饰,如数据类型,是否可为空,默认值... 2.VC2(父组件)引用子组件 ...

  4. U盘插上电脑上后自动备份文件

    缘由 一直有个不好的习惯,将所有文件都存在个人U盘,下班直接拔了就回家. 前久把U盘插入MacBook后,U盘就无法读数据了,搞了很久也没搞定. 当然了,里面的数据也无法使用了. 所以,现在的想法: ...

  5. Kongmaster

    圣人处无为之事 大智若愚 穷则独善其身,达则兼济天下

  6. 路飞项目 day02 全局日志、全局异常处理、封装Response、数据库准备

    一.路飞项目全局日志配置 ​ 那个代码不用死记硬背,知道一些地方是啥意思即可 1.复制django自带的日志模块的大代码到dev(settings)文件中 LOGGING = { 'version': ...

  7. iptables( < deb ufw)

    iptables其实不是真正的防火墙,可以把它理解成一个客户端代理,用户通过iptables这个代理,将用户的安全设定执行到对应的netfilter安全框架"中,netfilter位于内核空 ...

  8. ISP(图像信号处理)算法概述、工作原理、架构、处理流程

    目录 ISP的主要内部构成: ISP内部包含 CPU.SUP IP(各种功能模块的通称).IF 等设备 ISP的控制结构: 1.ISP逻辑 2.运行在其上的firmware ISP上的Firmware ...

  9. python_test_0001_base_string

    #!/usr/bin/python # -*- coding: UTF-8 -*- from lib_001_decorator_log_funcname import decorator_log_f ...

  10. [Javascript摸鱼记录] 关于js简单字符删减替换增加插入追加前中后处理

    以前总是怕死js如其名,能让我入坑润不出来,然后最近被迫写点静态html,又要用到数值运算处理, 于是又开启了「好几十个标签栏解决一个问题」的"探索路程",顺便记录一下摸鱼结果希望 ...