plink软件计算位点杂合度和样本杂合度
杂合度计算分为两种:位点杂合度和样本杂合度
1、计算位点杂合度,测试数据如下:
[root@centos79 test]# ls outcome.map outcome.ped [root@centos79 test]# cat outcome.map ## 8个snp位点 1 snp1 0 55910 1 snp2 0 85204 1 snp3 0 122948 1 snp4 0 203750 1 snp5 0 312707 1 snp6 0 356863 1 snp7 0 400518 1 snp8 0 487423 [root@centos79 test]# cat outcome.ped ## 8个样本 DOR 1 0 0 0 -9 G G C C G G G G G A A A G G G C DOR 2 0 0 0 -9 G G G C G G G G G G A A A G C C DOR 3 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 4 0 0 0 -9 G G C C G G G G G G A A G G G G DOR 5 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 6 0 0 0 -9 G G C C G G G G G G A A A A C C DOR 7 0 0 0 -9 G G C C G G A G A A A A G G C C DOR 9 0 0 0 -9 G G C C G G A G A A A A G G C C
2、--hardy计算位点杂合度
[root@centos79 test]# plink --file outcome --hardy --out sitehet &> /dev/zero [root@centos79 test]# ls outcome.map outcome.ped sitehet.hwe sitehet.log sitehet.nosex ## 结果文件 [root@centos79 test]# cat sitehet.hwe CHR SNP TEST A1 A2 GENO O(HET) E(HET) P ## o(HET)为观测杂合度百分率,利于第一个位点0,全部是G 1 snp1 ALL(NP) 0 G 0/0/8 0 0 1 1 snp2 ALL(NP) G C 0/1/7 0.125 0.1172 1 1 snp3 ALL(NP) 0 G 0/0/8 0 0 1 1 snp4 ALL(NP) A G 0/2/6 0.25 0.2188 1 1 snp5 ALL(NP) A G 2/1/5 0.125 0.4297 0.07692 1 snp6 ALL(NP) 0 A 0/0/8 0 0 1 1 snp7 ALL(NP) A G 1/3/4 0.375 0.4297 1 1 snp8 ALL(NP) G C 1/3/4 0.375 0.4297 1 [root@centos79 test]# cat outcome.ped DOR 1 0 0 0 -9 G G C C G G G G G A A A G G G C DOR 2 0 0 0 -9 G G G C G G G G G G A A A G C C DOR 3 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 4 0 0 0 -9 G G C C G G G G G G A A G G G G DOR 5 0 0 0 -9 G G C C G G G G G G A A A G G C DOR 6 0 0 0 -9 G G C C G G G G G G A A A A C C DOR 7 0 0 0 -9 G G C C G G A G A A A A G G C C DOR 9 0 0 0 -9 G G C C G G A G A A A A G G C C
2、--het 计算样本杂合度
首先要剔除没有多态的位点:
[root@centos79 test]# ls outcome.map outcome.ped [root@centos79 test]# plink --file outcome --maf 0.0000001 --recode tab --out test &> /dev/null ## 利用plink的--maf参数剔除没有多态的位点 [root@centos79 test]# ls outcome.map outcome.ped test.log test.map test.nosex test.ped [root@centos79 test]# cat test.ped ## 剩余5个位点 DOR 1 0 0 0 -9 C C G G A G G G G C DOR 2 0 0 0 -9 G C G G G G A G C C DOR 3 0 0 0 -9 C C G G G G A G G C DOR 4 0 0 0 -9 C C G G G G G G G G DOR 5 0 0 0 -9 C C G G G G A G G C DOR 6 0 0 0 -9 C C G G G G A A C C DOR 7 0 0 0 -9 C C A G A A G G C C DOR 9 0 0 0 -9 C C A G A A G G C C [root@centos79 test]# plink --file test --het --out indhet &> /dev/null ## 计算样本杂合度 [root@centos79 test]# ls indhet.het indhet.log indhet.nosex outcome.map outcome.ped test.log test.map test.nosex test.ped [root@centos79 test]# cat indhet.het FID IID O(HOM) E(HOM) N(NM) F ## 0(HOM)为观测的纯合子数目,N是总的位点数杂合度为 (O-N)/N DOR 1 3 3.375 5 -0.2308 ## 比如第一个样本三个纯合子,那么杂合子5-3=2;杂合度 (5-3)/ 5 = 0.4 DOR 2 3 3.375 5 -0.2308 DOR 3 3 3.375 5 -0.2308 DOR 4 5 3.375 5 1 DOR 5 3 3.375 5 -0.2308 DOR 6 5 3.375 5 1 DOR 7 4 3.375 5 0.3846 DOR 9 4 3.375 5 0.3846
分类:
生信
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律