文献阅读 | The single-cell transcriptional landscape of mammalian organogenesis | 器官形成 | 单细胞转录组
The single-cell transcriptional landscape of mammalian organogenesis
老板已经提了无数遍的文章,确实很nb,这个工作是之前我们无法想象得,想想如何把我们的数据和他们的数据整合到一起。
文献阅读 | Molecular Architecture of the Mouse Nervous System 这篇侧重强调的是神经系统的单细胞发育过程测序。
Mouse Organogenesis Cell Atlas (MOCA) - 所有数据均可下载
这个数据可以挖掘的东西有很多,我的DPR可以挖出很多有意思的东西。
we profiled the transcriptomes of around 2 million cells derived from 61 embryos staged between 9.5 and 13.5 days of gestation, in a single experiment.
测了2百万个细胞,61个胚胎样本,4天的核心胚胎发育历程。
下面这张图基本就是本文的核心了,不同stage,不同subtype,不同的trajectory。
背景
之前的mouse scRNA-seq数据库
- Han, X. et al. Mapping the Mouse Cell Atlas by Microwell-seq. Cell 172, 1091–1107 (2018).
- The Tabula Muris Consortium, Quake, S. R., Wyss-Coray, T. & Darmanis, S. Transcriptomic characterization of 20 organs and tissues from mouse at single cell resolution creates a Tabula Muris. Preprint at https://www.biorxiv.org/ content/10.1101/237446v2 (2018).
- A single-cell survey of the small intestinal epithelium - Aviv Regev
- Molecular Architecture of the Mouse Nervous System - Mouse brain atlas 神经系统
结果解读
Single-cell RNA-seq of two million cells
问题:
1. 测了什么细胞?
这篇文章不像那篇mouse Brain Atlas,本文测了四天的胚胎发育的所有细胞,没有解剖分区,没有FACS sorting,没错,全测。
We collected 61 C57BL/6 mouse embryos at E9.5, E10.5, E11.5, E12.5 or E13.5
5个发育天,所以总体有五个阶段,但是每个阶段取了多个样本,一共61个样本。
As a control, we spiked a mixture of human HEK-293T and mouse NIH/3T3 nuclei into two wells. 对照
2. 怎么测得?上面的图解释得很直观,index建好了,最终一个nova-seq直接测完,震撼。
3. 为什么只测nuclei?bais更小,可以直接测冷冻的样品。有相关文章:Single-nucleus and single-cell transcriptomes compared in matched cortical cell types
4. 一些震惊的问题?
过滤的阈值非常低,UMI (unique molecular identifier) count ≥ 200,这岂不是有严重的偏差?
只有7%的细胞被测到,大部分都在建库的时候过滤掉了;
其实还好,平均一个胚胎测了30w个细胞,我们的一个sorting后的E13.5的ENCC都能测1w个。
一个细胞测这么少的reads,只检测到500个基因,确定这种数据可用吗?
答案是:数据有很强的特性,从中可以获取某些信息,但肯定的是,更多的信息被丢失了,所以别指望这个数据是万能的。
Identification of cell types and subtypes
这部分没啥意思,就是把所有的阶段混在一起聚类,找marker,人工定义每个cluster。
总觉得人工找的不可靠,或多或少会有偏向性和谬误,最少目前我们的认知是有限的。
Characterization of the apical ectodermal ridge
分析了一个特例,没有太多的意思。
Reconstructing developmental trajectories
十个主要的发育路径
一起测序的,数据不好分离,不知道里面哪些数据对我们有用,PNS和ENS应该不是一个东西。
十个主要发育路径底下的子路径
Reconstructing skeletal myogenesis
另一个特例。
优势分析:
- 通量大,200万个细胞
- 覆盖了关键的4天,E9.5-E13.5
- 适配的分析方法,大数据的处理方法
- 关键的subtype和lineage都有所揭示
- 公开了所有的数据
缺点:
- 浪费了太多细胞
- 分辨率太低,单个细胞检测到的基因和UMIs太低
- 某些精细的分析根本无法完成
ENS数据下载:
先下载细胞的注释文件,找出与enteric有关的细胞;
https://oncoscape.v3.sttrcancer.org/atlas.gs.washington.edu.mouse.rna/downloads
然后再下载monocle的cds文件,提取需要的raw data。
不要用浏览器下载,用wget
wget https://shendure-web.gs.washington.edu/content/members/cao1025/public/mouse_embryo_atlas/cds_cleaned.RDS