教小高改bug

  博客园 :: 首页 :: 博问 :: 闪存 :: :: 联系 :: :: 管理 ::

  

1. 火山图的用途

主要是展示差异表达的基因,通常应用于转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。

2. 怎么看火山图

1)坐标轴:

横轴是log2(Fold change),显示差异倍数(FC),点越偏离中心,表示差异倍数越大;

纵轴是-log 10 (adj. p-value),显示显著性,点越靠图的顶部,表示差异越显著;

2)点:

图中每个点代表一个检测到的基因(或蛋白、代谢物等),图中这些点分别具有不同颜色,颜色的意义可以参考图片右侧的图例:

UP:差异显著且上调的基因

DOWN:差异显著且下调的基因

NOT:差异不显著的基因

3)差异基因筛选阈值设置:

根据差异倍数(fold change)和显著性(P-value)设定差异基因的筛选阈值

p-value:表示某个基因在分组之间的表达是否差异显著,一般认为p-value<0.05为显著。adjusted p-value:即经过统计学方法校正后的p-value,由于统计学上常用的校正方法包括“BH”、“FDR”等,所以在一些文章中也会看到筛选差异基因的阈值是FDR<0.05。p值越小差异越显著,但直接用adjusted p-value画图的话点会集中在底部不美观,而-log 10 (adjusted p-value)转换后正好是反了过来,数值越大越显著,而且以10为底很容易换算回去,做出的图比较美观。

常见的P的取值有0.05,0.01...

Fold Change:表示两个分组之间的差异倍数,其绝对值越大说明某基因在两组之间的表达差异也越大。该值为正时,表示差异上调;该值为负时,表示差异下调。画图时,一般转换为log2FoldChange,使展示更直观。

logFC一般在10以内,差距为210 = 1024倍。大多在5以内。常见的logFC有1(2倍),1.2,1.5,2(4倍),2.2...

示例:按示例图中将“adjusted p-value<0.05”且“log2FoldChange的绝对值大于1”设置为差异基因筛选阈值,那么:

-log 10 (adj. p-value) > 1.30且log2FoldChange > 1的基因为红色点,即UP;

-log10 (adj. p-value) >1.30且log2FoldChange < -1的基因为蓝色点,即DOWN;

-log 10 (adj. p-value) <1.30的基因为黑色点,即NOT。

3. 其他形式的火山图

不一样的只是形式,代表的结果还是不变的,万变不离其宗。

 

 

 

posted on 2022-10-03 20:42  小高不高  阅读(1167)  评论(0编辑  收藏  举报