Deseq2 的可视化策略汇总
1) MA图
对于MA图而言, 横坐标为该基因在所有样本中的均值,basemean = (basemean_A + basemean_B ) / 2, 纵坐标为 log2Fold change
其中,pvalue < 0.1 以下的点被认为是差异基因,标记为红色
2) count 图 (单个基因在不同组样本中的分布)
为了防止样本表达量相同时,点出现重合的情况,添加了扰动
library("ggplot2")
ggplot(d, aes(x=condition, y=count)) + geom_point(position=position_jitter(w=0.1,h=0)) + scale_y_log10(breaks=c(25,100,400))
3) heatmap (基因表达矩阵的heatmap)
值得注意的是,当我们想要通过heatmap 图来看规律的时候,可以先不对样本和基因进行聚类,直接按照分组顺序来排就好,这样可以直观的看出来在不同分组中的规律
4) heatmap (sample-to-sample 的距离矩阵的热图)
此时,可以对样本进行聚类,看样本的聚类效果和实验设计时的分组是否一致;
5)PCA 图(样本的PCA 图)
6) boxplot (观察离群值点)
欢迎关注微信公众号<生信修炼手册>