(转)转录组福音 | 基于表达谱研究疾病七大思路汇总
收藏|基于表达谱研究疾病七大思路汇总 - 生信人
IF:9|全新的疾病特征基因筛选策略 - 生信人
昨天我们推广的疾病的分析思路,火爆网络,索性今天再来一个返场小段,供大家消遣一下。
因为大部分的疾病不致死,或者说预后部分的信息收集并不全面,所以在做生信分析的时候跟肿瘤相比,就缺了最重要的一步预后效果验证如何。
我们之前说过肿瘤筛选marker有三大步骤,差异,降维,预后。
但是对于疾病来说没有了预后,文章思路就不完整了。
小编今天通过对AD研究的几篇文章来简单介绍下如果没有预后,我们如何研究,如何分析。
1、核心基因+多因子(6+)
2、WGCNA+多样本验证(3+)
3、WGCNA+多因子(1.9)
4、Network&pathway(2.4)
5、CeRNA思路:多套数据整合(3.6)
6、基因诊断模型+WB验证(2.8)
7、lncRNA诊断模型+SVM(8.9)
有生信分析需求
请扫码添加微信
获取更多疾病相关思路
一、核心基因+多因子
Identification of molecular signatures and pathways to identify novel therapeutic targets in Alzheimer's disease: Insights from a systems biomedicine perspective
(Genomics IF: 6+)
核心基因是公号去年推广的一个免费视频,简单说来就是GEO数据筛选差异,通过网络降维,然后TCGA预后验证。但是如果对于疾病没有了预后,通常我们会增加TF、miRNA、Drug等因子的研究,筛序到核心的基因,再拓展下相关的因子、药物等等。
二、WGCNA+多样本表达验证
Identification of KIAA0513 and Other Hub Genes Associated With Alzheimer Disease Using Weighted Gene Coexpression Network Analysis
(Froniter in genetics IF: 3+)
这篇文章研究的是颞叶皮层AD样本的WGCNA分析,筛选到核心模块和基因之后,还是缺点东西,所以作者选择了去用其他的组织样本进行表达验证,甚至用了老鼠的样本。
同时,作者深知分析内容不够,生信来凑的实际情况,于是这篇文章的图,超级精美。
看到这有小伙伴就说了,难道不能WGCNA筛选降维之后,看看多因子么,当然可以。
三、WGCNA+多因子
Screening and Identification of Potential Peripheral Blood Biomarkers for Alzheimer’s Disease Based on Bioinformatics Analysis
(medical science monitor IF: 1.9+)
还记得小编说过的吧,要保证思路、分析、数据至少有一个不一样。
这篇文章也是WGCNA,虽然后面成了多因子,但是呢如果样本也都一样,还是有作弊的嫌疑。
但是呢,作者很厉害,选择的是PBMC的数据。
分析内容为筛选差异,WGCNA筛选核心基因和模块,富集分析,然后针对核心基因找多因子分析。
同样,图很漂亮。
说到疾病,不能忘记下面这个疾病研究的经典思路。
四、Network&pathway
Integrated identification of key genes and pathways in Alzheimer’s disease via comprehensive bioinformatical analyses
(hereditas IF: 2.4)
这个是什么意思呢,就是筛选差异,做完降维之后,更多的放在富集分析上,多做些富集分析的内容,不往后走了。
五、CeRNA思路:多套数据整合
Systematic Characterization of Circular RNA-Associated CeRNA Network Identified Novel circRNABiomarkers in Alzheimer’s Disease
(Frontiers in Bioengineering and Biotechnology IF: 3.6)
这个不多说,跟多因子的思路差不多,不过由于ceRNA研究涉及到lcnRNA就得验证,所以人家作者挑战了高难度选择了circRNA,这样不验证的理由可以是数据少喽,轻松过关。
换句话说,做这个思路不管是数据多少,其实就是辛苦活了,堆了很多的数据。
The data analyzed in this study were obtained from the GSE5281, GSE1297, GSE12685 GSE16759。
六、基因诊断模型+WB验证
Identification of Blood Biomarkers for Alzheimer’s Disease Through Computational Prediction and Experimental Validation
(Frontiers in Neurology IF: 2.8)
寻找marker ,降维,构建模型来做诊断模型,这个很经典,但是很难找到合适的数据验证的时候,就得需要通过实验来验证了,这个思路也很不错。
有小伙伴问了,如果诊断数据不够,我又想做诊断模型,应该怎么做。
我建议你提高难度系数,做lncRNA的诊断模型,同时构建诊断模型的时候选择一些高级的模型构建方法,比如这一篇。
七、lncRNA诊断模型+SVM
Analysis of long noncoding RNAs highlights region-specific altered expression patterns and diagnostic roles in Alzheimer’s disease
( briefings in bioinformatics IF: 8.9)
通过整合芯片的原始数据,构建lncRNA的表达谱数据,然后筛选差异的lncRNA,构建基于lncRNA的诊断模型。差异的lncRNA+SVM,效果确实好啊。