Deseq2 的可视化策略汇总

1) MA图
 

 

对于MA图而言, 横坐标为该基因在所有样本中的均值,basemean = (basemean_A + basemean_B ) / 2, 纵坐标为 log2Fold change
其中,pvalue < 0.1 以下的点被认为是差异基因,标记为红色
 
 
2)  count 图 (单个基因在不同组样本中的分布)
 

 

 
 
为了防止样本表达量相同时,点出现重合的情况,添加了扰动
library("ggplot2")
ggplot(d, aes(x=condition, y=count)) + geom_point(position=position_jitter(w=0.1,h=0)) + scale_y_log10(breaks=c(25,100,400))
 
 
 
3) heatmap (基因表达矩阵的heatmap)
值得注意的是,当我们想要通过heatmap 图来看规律的时候,可以先不对样本和基因进行聚类,直接按照分组顺序来排就好,这样可以直观的看出来在不同分组中的规律
 

 

 
4)  heatmap (sample-to-sample 的距离矩阵的热图)
 

 

 
此时,可以对样本进行聚类,看样本的聚类效果和实验设计时的分组是否一致;
 
5)PCA 图(样本的PCA 图)
 

 

6) boxplot (观察离群值点)
 
 
 
 

posted on 2018-02-22 11:21  庐州月光  阅读(6359)  评论(0编辑  收藏  举报