[论文总结] kmeans聚类和WGCNA
kmeans聚类和WGCNA
总结了3篇论文中kmeans聚类和WGCNA的运用。
论文1
Comprehensive dissection of transcript and metabolite shifts during seed germination and post-germination stages in poplar[Qu et al. BMC Plant Biology, 2019]
前言: 介绍了种子萌发过程,以及杨树作为模式植物,通过转录组和代谢组分析来研究种子萌发过程基因和代谢物变化的重要性。
内容: 通过kmeans将全部差异基因分为了24类,这24个类别对应了种子萌发的6个时期。根据24个类别的表达特征的相关性又细分为9个类别。再 对9个类别的基因做了富集分析。
下一步对全部的差异表达基因进行了WGCNA。然后对所有颜色模块采用了FISHER检验,查看模块的富集途径。
对绿色和棕色模块进行了富集图分析以及对比。然后对这两个模块进行了网络图分析。
选取的4个初级代谢途径中相关的代谢产物进行了分析以及对代谢产物相关的表达基因进行了热图分析。最后将转录组数据和代谢组数据进行了联合分析。
论文2
Comparative Transcriptome Analysis of Different
Dendrobium Species Reveals Active Ingredients-Related Genes and Pathways [Yuan et al., International Journal of Molecular Sciences, 2019]
前言: 介绍了石斛的营养成分,转录组技术以及共表达网络分析和数据来源。
结果: 测定了数据的根茎叶的生物碱以及多糖的含量。分析了石斛根茎叶中差异表达的基因。做了火山图和韦恩图。通过K-means 聚类了所有的差异表达基因。
然后进行了GO与KEGG 富集分析以及WGCNA。
论文3
A Predictive Coexpression Network Identifies Novel Genes Controlling the Seed-to-Seedling Phase Transition in Arabidopsis thaliana1 [Anderson Tadeu Silva et al., Plant Physiology, 2016]
介绍: 了解种子发芽过程的重要性,介绍了转录组的作用和论文目的。
结果:
-
种子到幼苗过渡期间转录组变化(PCA分析)介绍7个不同发育时期(DS,6H,TR,RP,RH,GC,OC)差异表达基因的数目。
-
将19,130个转录组映射到种子萌发6个阶段。结果表明,不同组基因在不同的位置显示出表达高峰发展阶段,这表明它们与特定阶段的开发功能具有较高相关性。
-
通过K-means分成10个簇(DP1-10)进行了GO富集分析。得知K-mean 10个簇富集种子不同萌发阶段的主要参与基因的变化。
-
作者的主要目的是研究种子从自养到异养的光合作用过渡时期是哪些基因在起作用。基因集与过渡区域(DP1、DP2 DP6, DP7,和DP10)明显丰富细胞分化,增殖,光合作用。 DP2、DP6 DP10可能进行细胞分裂与后续细胞化过程但没有光合作用。 然而,光合作用和叶绿素绑定在DP1和DP7丰富。 光合作用相关基因表达可能已经在TR阶段开始。观察了DP1,DP2,DP6,DP7和DP10变化相关的基因相互作用区域。 DP2和DP10显示基因表达模式从DS增加到6H,而DP1和DP6显示基因表达从6H增加到TR。这表明这四个DP与种子发芽的早期相关,与幼苗的生长无关。因此,在这五个DP(DP1,DP2,DP6,DP7和DP10)中,预计DP7中的基因是调控发芽和幼苗期的主要基因。因此,DP7是与从发芽(6H)到早期幼苗建立(OC)的过渡相关的最具代表性的基因集。 DP7的独特之处在于RP后转录本丰度增加,此后一直保持较高水平。 DP7的表达模式表明,所有的转录本一致地上调表达直到幼苗发育。这可能表明RP的调节过程会影响1600多个转录本,这些转录本将控制幼苗的生长。
-
最后对DP7的基因进一步确定和分析功能。
总结
第一、二篇论文将K-means和WGCNA分开分析,而第三篇将这两个分析合并起来,文章整体性和逻辑性更强。
本文来自博客园,作者:落痕的寒假,转载请注明原文链接:https://www.cnblogs.com/luohenyueji/p/16970232.html