文章亮点:

按level来管理和分析数据,文章有不同stage,每个stage有不同subtype,这应该是一个真tree,而不只是一个进化树,文章里出现最多的进化树把所有的stage都整合了。

空间归类和taxonomy的工作,mapped cell types spatially and derived a hierarchical, data-driven taxonomy

神经元按解剖单元和递质类型归类;Neurons were the most diverse and were grouped by developmental anatomical units and by the expression of neurotransmitters and neuropeptides.

背景常识:

Neuronal diversity was driven by genes encoding cell identity, synaptic connectivity, neurotransmission, and membrane conductance.

先去看下科普视频,不然都不认识文章里面的各种名词。

这篇文章的侧重点在于CNS和发育,所以花了很大篇幅来用Dendrogram阐述Taxonomy。但我觉得这个系统树其实是失败的,太着重于subtype,而忽略了stage。其实也是算法的局限。

这种大数据的管理是真的难,管理架构不行,后面分析就举步维艰。本文的数据管理策略值得学习。

Molecular Architecture of the Mouse Nervous System - Sten Linnarsson

Mouse brain atlas - 对应的数据库

问题

1. 测了什么细胞?测了多少个细胞?

很明确,这篇文章关注的重点是Mouse Nervous System老鼠神经系统;那么是哪个阶段的呢?In summary, male and female mice were postnatal ages P12-30, as well as 6 and 8 weeks old. 明显得老鼠成熟了才有CNS和PNS,文章称是刚刚成型的老鼠神经系统adolescent mouse nervous system。测了50万个细胞,最新的4个胚胎发育天E9.5-E13.5测了200万个

We performed a comprehensive survey of the adolescent mouse nervous system by scRNA-seq. We dissected the brain and spinal cord into contiguous anatomical regions and further included the peripheral sensory, enteric, and sympathetic nervous system. In total, we analyzed 19 regions (Figure 1A) but omitted at least the retina, the olfactory epithelium, the vomeronasal organ, the inner ear, and the parasympathetic ganglia.

这里不是全部混合测序,建库之前就按解剖学分区了,分成了19个区,但是也忽略了一些特定的区域。

总体而言,测了CNS、PNS和ENS。

这次测序用的是商业的droplet microfluidics (10X Genomics Chromium),估计花了不少钱,后面就自己开发了 SPLiT-seq。

结果

A Molecular Survey of the Mouse Nervous System

In addition, the dataset was affected by a number of technical artifacts, including low-quality cells, batch effects, sex-specific gene expression, neuronal-activity-dependent gene expression, and more.

To overcome these challenges, we developed a multistage analysis pipeline called “cytograph,” which progressively discovers cell types or states while mitigating the impact of technical artifacts

cytograph,我很感兴趣,整合的算法,但是本文没怎么提及,因为还没有发表。在这个R统一了生物信息的时代,他们组还是坚持用python。

这个课题组还是要用loom,确实很不方便,不仅跨平台,而且要学习一个新的工具。

更新:查了下,loom还是有好处的,它是一个数据库数据结构,适用于超大数据,数据只存储于磁盘上,内存放不下,需要时才会调用,而且是分chunk

Loom files are stored on disk and are never loaded entirely. They are more like databases: you connect, retrieve some subset of the data, maybe update some attributes.

loom更像是纯粹的最终读取文件,edit loom文件非常不方便。

一个现有的矛盾就是,我们的所有数据分析都是在R里用R包跑出来的,loom是用Python开发的,对R的支持非常不好。想把loom里面的数据都导出来真的很费力。

以下代码可以在普通电脑上操作,不用担心内存不足。

import loompy
import pandas as pd
ds = loompy.connect("l5_all.loom")
# ds2 <- ds[:, ds.ca.Tissue == "ENS"]
# ds.ca.keys()
# ds.ra['ClusterName', 'Clusters', "CellID"] data = {"CellID":ds.ca.CellID, "ClusterName":ds.ca.ClusterName, "Clusters":ds.ca.Clusters, "Tissue":ds.ca.Tissue}
df = pd.DataFrame(data)
df.to_csv("cellID.clusterName.csv")

Postnatal Neurogenesis in the Central Nervous System

Astroependymal Cells Are Diverse and Spatially Patterned

Loss of Patterning in the Oligodendrocyte Lineage and Convergence to a Single Brain-wide Intermediate State

Vascular Cells and a Family of Broadly Distributed Mesothelial Fibroblasts

Neural-Crest-Derived Glia and Oligodendrocyte Progenitors

Peripheral Nervous System

Central Nervous Systems Neurons

Spatial Distributions Reflect Molecular Diversity

Drivers of Neuronal and Glial Diversity

里面的postonal embryogenesis的数据对我们很有用!

数据下载

读取和操作loom数据

R包 loomR 不好用,标准不够统一。

下载我感兴趣的ENS的文件:

http://mousebrain.org/tissues.html

细胞的注释信息则从总的loom文件中提取(如上)。

文献阅读 | Molecular Architecture of the Mouse Nervous System的更多相关文章

  1. 文献阅读 | The single-cell transcriptional landscape of mammalian organogenesis | 器官形成 | 单细胞转录组

    The single-cell transcriptional landscape of mammalian organogenesis 老板已经提了无数遍的文章,确实很nb,这个工作是之前我们无法想 ...

  2. 文献阅读笔记——group sparsity and geometry constrained dictionary

    周五实验室有同学报告了ICCV2013的一篇论文group sparsity and geometry constrained dictionary learning for action recog ...

  3. 文献阅读 | Epigenetics in ENS development and Hirschsprung disease

    系列篇: Epigenetics in ENS development and Hirschsprung disease - Review Epigenetic Mechanisms in Hirsc ...

  4. 文献阅读 | A single-cell molecular map of mouse gastrulation and early organogenesis

    A single-cell molecular map of mouse gastrulation and early organogenesis Here we report the transcr ...

  5. phd文献阅读日志-博一上学期

    为了记住并提醒自己阅读文献,进行了记录(这些论文都是我看过理解的),论文一直在更新中. 博一上学期: 1.week 6,2017.10.16 2014-Automatic Semantic Model ...

  6. AutoML文献阅读

    逐步会更新阅读过的AutoML文献(其实是NAS),以及自己的一些思考 Progressive Neural Architecture Search,2018ECCV的文章: 目的是:Speed up ...

  7. 空间插值文献阅读(Geostatistical approaches for incorporating elevation into the spatial interpolation of rainfall)

    空间插值技术应用必读论文---P. Goovaerts, Geostatistical approaches for incorporating elevation into the spatial ...

  8. 人体姿势识别,Convolutional pose machines文献阅读笔记。

    开源实现 https://github.com/shihenw/convolutional-pose-machines-release(caffe版本) https://github.com/psyc ...

  9. 文献阅读方法 & 如何阅读英文文献 - 施一公(转)

    附: 如何看懂英文文献?(好) 看需求,分层次 如何总结和整理学术文献? Mendeley & Everything 如何在pdf文献上做笔记?福晰阅读器 自己感悟: 一篇专业文献通常会有几页 ...

随机推荐

  1. 微信小程序 时间戳 转化为 日期格式

    util.js  : function transTime(unixtime) { var dateTime = new Date(parseInt(unixtime) * 1000) var yea ...

  2. SQL SERVER-日期按时区转换

    SELECT SWITCHOFFSET('2019-07-19 08:35:06.637','+08:00')

  3. c# 常见文件操作

  4. SELinux 权限设置

    SELinux 权限设置 一.SELinux简介 SELinux全称是Security Enhanced Linux,由美国国家安全部(National Security Agency)领导开发的GP ...

  5. 华为云和开源Istio运维管理对比样例应用部署

    前言 在公有云方面,华为云已经率先将 Istio 作为产品投入到公有云中进行商业应用中,保持和开源istio高度兼容,做了商业化的运维管理界面,同时进行了性能优化.这里我们做一次验证测试. Booki ...

  6. homebrew一直处于updating状态

    vim ~/.bash_profile 增加一行 export HOMEBREW_NO_AUTO_UPDATE=true 之后再source一下

  7. docer安装之pure-ftp

    https://hub.docker.com/r/stilliard/pure-ftpd Docker Pure-ftpd Server https://hub.docker.com/r/stilli ...

  8. Vuex基础 -01 -实现简易计数器 -支持 加数/ 减数/ 奇数再加/ 异步加法(setTimeout 1000ms) -单组件演示语法

    Vuex 的结构图 工程组织 Vuex的核心管理程序 store.js /* vuex的核心管理程序 */ import Vue from 'vue' import Vuex from 'vuex' ...

  9. 《少年先疯队》第八次团队作业:Alpha冲刺第三天

    前言   第三天冲刺会议    时间:2019.6.16   地点:宿舍 3.1 今日完成任务情况以及遇到的问题.   3.1.1今日完成任务情况 姚玉婷:酒店的会员信息的管理,如会员的添加,删除 马 ...

  10. 神经网络MNIST数据集分类tensorboard

    今天分享同样数据集的CNN处理方式,同时加上tensorboard,可以看到清晰的结构图,迭代1000次acc收敛到0.992 先放代码,注释比较详细,变量名字看单词就能知道啥意思 import te ...