利用GCTA工具计算复杂性状/特征(Complex Trait)的遗传相关性(genetic correlation)

如文章“Genome-wide Complex Trait Analysis(GCTA)-全基因组复杂性状分析”中介绍的GCTA,是一款基于全基因组关联分析发展的分析工具,除了计算不同性状/表型间(traits)的遗传相关性外,还可以计算亲缘关系、近交系数……,下面简单介绍如何利用GCTA计算不同性状/表型的遗传相关性。

一,在Linux上安装GCTA工具:

1
2
wget -r -np -pk -nH -P ./to/your/path/way/gcta http://cnsgenomics.com/software/gcta/gcta_1.26.0.zip #在Linux下下载GCTA工具
unzip gcta_1.26.0.zip #解压GCTA工具

“wget -r -np -pk -nH -P”命令完全照搬,“./to/your/path/way/gcta”是指你想把GCTA软件下载在哪个路径,按个人需求适当修改。

二、准备PLINK二进制格式文件,比如 test.fam, test.bim test.bed 

三、生成 test.grm.bintest.grm.N.bintest.grm.id 格式文件

1
/gcta/gcta64 --bfile test --autosome --make-grm --out test #生成grm格式文件,方便后面的遗传相关性分析

“/gcta/gcta64”指GCTA软件的位置

“--make-grm”指生成 test.grm.bintest.grm.N.bin和test.grm.id 格式文件

“--out test”指输出的文件名为test

四、准备性状/表型文件,后缀为.txt格式,不需要表头,第一列为family ID, 第二列为individual ID 第三列和第四列为 phenotypes ,类似于PLINK的表型文件格式

五、计算遗传相关性

1
gcta/gcta64 --reml-bivar --reml-bivar-nocove --grm test --pheno pheno.txt --reml-bivar-lrt-rg 0 --out test

得到test.hsq 格式的文件

test.hsp文件内容如下:

Source Variance SE
V(G)_tr1 0.479647 0.179078  #trait 1 的遗传方差和标准误
V(G)_tr2 0.286330 0.181329   #trait 2 的遗传方差和标准误
C(G)_tr12 0.230828 0.147958  #trait 1 和 2 之间的遗传协方差和标准误
V(e)_tr1 0.524264 0.176650  #trait 1 的剩余方差和标准误
V(e)_tr2 0.734654 0.181146  #trait 2 的剩余方差和标准误
C(e)_tr12 0.404298 0.146863  #trait 1 和 2 的剩余协方差和标准误
Vp_tr1 1.003911 0.033202
Vp_tr2 1.020984 0.033800
V(G)/Vp_tr1 0.477779 0.176457
V(G)/Vp_tr2 0.280445 0.176928
rG 0.622864 0.217458  # 遗传相关性和标准误
n 3669  # 样本量

其中,rG即为我们想要的遗传相关性,0.622864 和 0.217458分别代表两个性状/表型间的遗传相关性(genetic correlation)和标准误(Stand error)

 

posted @   橙子牛奶糖  阅读(8774)  评论(44编辑  收藏  举报
编辑推荐:
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾(3.3-3.9)
· AI 智能体引爆开源社区「GitHub 热点速览」
· 写一个简单的SQL生成工具
点击右上角即可分享
微信分享提示