RNA-seq | scRNA-seq | fancy分析工具
2023年05月31日
带小弟学习RNA-seq,以前自己的流程过于实用简单,缺乏了严谨性,现在正规的从头来一遍。
参考:
- RNA-seq入门实战(零):RNA-seq流程前的准备——Linux与R的环境创建
- RNA-seq入门实战(一):上游数据下载、格式转化和质控清洗
- RNA-seq入门实战(二):上游数据的比对计数——Hisat2+ featureCounts 与 Salmon
- RNA-seq入门实战(三):在R里面整理表达量counts矩阵
- RNA-seq入门实战(四):差异分析前的准备——数据检查
- RNA-seq入门实战(五):差异分析——DESeq2 edgeR limma的使用与比较
- RNA-seq入门实战(六):GO、KEGG富集分析与enrichplot超全可视化攻略
- RNA-seq入门实战(七):GSEA——基因集富集分析
- RNA-seq入门实战(八):GSVA——基因集变异分析
- RNA-seq入门实战(九):PPI蛋白互作网络构建(上)——STRING数据库的使用
- RNA-seq入门实战(十):PPI蛋白互作网络构建(下)——Cytoscape软件的使用
- RNA-seq入门实战(十一):WGCNA加权基因共表达网络分析——关联基因模块与表型
想要拔高生信paper level的必备分析
没有吃透这些工具,那作为生信人是不合格的!
类似打球的肌肉记忆,生信分析也需要“肌肉记忆”,这就是对各种工具的熟练掌握,这样才能把精力放在重要问题的思考和推理上。
收集总结各种精华工具,做好代码测试和工具测评,有条件可以封装代码形成自己的函数,下次使用时即可一行代码调用,形成自己的“肌肉记忆”。
这里只作目录收集总览,具体测试代码会开单独的技术型文章,深入细节。
ORA
普通的基因集富集,不想多说,必做。
GSEA
教程:Gene Set Enrichment Analysis (GSEA) User Guide - 官方
我之前的文章:
GSEA - Gene set enrichment analysis 基因集富集 | ORA - Over-Representation Analysis 分析原理与应用
之前做GSEA分析都是用的clusterProfiler,它会使用现成的工具如fgsea,但这些工具已经过时太久了,现在有个GSEABase,可以替代。
新开一篇测试细节文章:GSEABase做富集分析
关于MSigDB的介绍 - MSigDB:GSEA提供的基因集数据库
变种
- DGSEA
- ssGSEA (单样本escape整合)
TF
必不可少,调控的核心。
主要工具:
- SCENIC
- 手动TF target分析
- Cistrome
PPI
蛋白互作,跟调控擦边了,不局限与TF。
主要工具:
- GENEMANIA
- STRING
WGCNA
基因模块分析,数据特异性的结果
CCI
细胞通讯,细胞层面的调控。
主要工具:
- CytoTalk
- CellChat
参考:
Sci Adv|谭凯/高琳团队合作开发细胞间通讯分析新算法,从头构建细胞类型特异性信号转导网络
inferCNV
重点应用在肿瘤癌症领域
待测试:
- GenePattern
- GSVA
统计
什么情况该用什么统计检验?
benchmark
A multicenter study benchmarking single-cell RNA sequencing technologies using reference samples - NBT - 2020