相关性correction | 关联性association | 因果性causality | pathogenicity致病性
引言:
- GWAS通过association test来找trait或disease的关联的SNP
- eQTL也是通过关联性来找gene expression相关的locus
- 转录组层面也频繁利用相关性来找某个regulator的target
已经看到问题的核心了,co,就是同时出现(离散),同升同减(连续,positive co)。
co不等于causal,找causal必须要去挖掘其物理上的联系,比如fine mapping就是通过epigenetic的数据来找,基因调控的causal就肯定要做实验。
我发表的几篇paper里也都是用correction来找调控机制,gene expression和AS event。
这里有个不错的教程,找mRNA和lncRNA的调控关系:特定mRNA基因的相关性lncRNA计算
核心就一句话,gene expression的相关性,一行代码即可。
但这篇教程有如下几个亮点:
- 根据pathway缩小计算范围
- 几个R包的灵活运用
- 相关性的P值
以下把其代码跑了一遍: