1. 火山图的用途
主要是展示差异表达的基因,通常应用于转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。
2. 怎么看火山图
1)坐标轴:
横轴是log2(Fold change),显示差异倍数(FC),点越偏离中心,表示差异倍数越大;
纵轴是-log 10 (adj. p-value),显示显著性,点越靠图的顶部,表示差异越显著;
2)点:
图中每个点代表一个检测到的基因(或蛋白、代谢物等),图中这些点分别具有不同颜色,颜色的意义可以参考图片右侧的图例:
UP:差异显著且上调的基因
DOWN:差异显著且下调的基因
NOT:差异不显著的基因
3)差异基因筛选阈值设置:
根据差异倍数(fold change)和显著性(P-value)设定差异基因的筛选阈值
p-value:表示某个基因在分组之间的表达是否差异显著,一般认为p-value<0.05为显著。adjusted p-value:即经过统计学方法校正后的p-value,由于统计学上常用的校正方法包括“BH”、“FDR”等,所以在一些文章中也会看到筛选差异基因的阈值是FDR<0.05。p值越小差异越显著,但直接用adjusted p-value画图的话点会集中在底部不美观,而-log 10 (adjusted p-value)转换后正好是反了过来,数值越大越显著,而且以10为底很容易换算回去,做出的图比较美观。
常见的P的取值有0.05,0.01...
Fold Change:表示两个分组之间的差异倍数,其绝对值越大说明某基因在两组之间的表达差异也越大。该值为正时,表示差异上调;该值为负时,表示差异下调。画图时,一般转换为log2FoldChange,使展示更直观。
logFC一般在10以内,差距为210 = 1024倍。大多在5以内。常见的logFC有1(2倍),1.2,1.5,2(4倍),2.2...
示例:按示例图中将“adjusted p-value<0.05”且“log2FoldChange的绝对值大于1”设置为差异基因筛选阈值,那么:
-log 10 (adj. p-value) > 1.30且log2FoldChange > 1的基因为红色点,即UP;
-log10 (adj. p-value) >1.30且log2FoldChange < -1的基因为蓝色点,即DOWN;
-log 10 (adj. p-value) <1.30的基因为黑色点,即NOT。
3. 其他形式的火山图
不一样的只是形式,代表的结果还是不变的,万变不离其宗。