vcf文件中如何确定文件是否已经phasing(定相)

 

001、未定相

复制代码
[root@PC1 test2]# ls
test1.vcf  test2.vcf
[root@PC1 test2]# grep -v "^#" test1.vcf | head | cut -f 1-16  ##  为定相是斜杠
1       55910   s64199.1        G       .       .       .       PR      GT      0/0     0/0     0/0     0/0     0/0     0/0     0/0
1       85204   OAR19_64675012.1        C       G       .       .       PR      GT      0/0     0/1     0/0     0/0     0/0     0/0     0/0
1       122948  OAR19_64715327.1        G       .       .       .       PR      GT      0/0     0/0     0/0     0/0     0/0     0/0     0/0
1       203750  OAR19_64803054.1        G       A       .       .       PR      GT      0/0     0/0     0/0     0/0     0/0     0/0     0/1
1       312707  DU281551_498.1  G       A       .       .       PR      GT      0/1     0/0     0/0     0/0     0/0     0/0     1/1
1       356863  s18939.1        A       .       .       .       PR      GT      0/0     0/0     0/0     0/0     0/0     0/0     0/0
1       400518  OAR1_88143.1    G       A       .       .       PR      GT      0/0     0/1     0/1     0/0     0/1     1/1     0/0
1       487423  s09912.1        C       G       .       .       PR      GT      0/1     0/0     0/1     1/1     0/1     0/0     0/0
1       578716  s36301.1        G       A       .       .       PR      GT      0/1     0/1     0/0     0/0     0/0     0/0     1/1
1       639876  s34880.1        A       .       .       .       PR      GT      0/0     0/0     0/0     0/0     0/0     0/0     0/0
复制代码

 

 

 

002、定相

复制代码
[root@PC1 test2]# ls
test1.vcf  test2.vcf
[root@PC1 test2]# grep -v "^#" test2.vcf | head | cut -f 1-16            ## 定相后是竖杠
1       55910   s64199.1        G       .       .       PASS    .       GT      0|0     0|0     0|0     0|0     0|0     0|0     0|0
1       85204   OAR19_64675012.1        C       G       .       PASS    .       GT      0|0     1|0     0|0     0|0     0|0     0|0     0|0
1       122948  OAR19_64715327.1        G       .       .       PASS    .       GT      0|0     0|0     0|0     0|0     0|0     0|0     0|0
1       203750  OAR19_64803054.1        G       A       .       PASS    .       GT      0|0     0|0     0|0     0|0     0|0     0|0     1|0
1       312707  DU281551_498.1  G       A       .       PASS    .       GT      1|0     0|0     0|0     0|0     0|0     0|0     1|1
1       356863  s18939.1        A       .       .       PASS    .       GT      0|0     0|0     0|0     0|0     0|0     0|0     0|0
1       400518  OAR1_88143.1    G       A       .       PASS    .       GT      0|0     0|1     1|0     0|0     0|1     1|1     0|0
1       487423  s09912.1        C       G       .       PASS    .       GT      0|1     0|0     0|1     1|1     1|0     0|0     0|0
1       578716  s36301.1        G       A       .       PASS    .       GT      1|0     1|0     0|0     0|0     0|0     0|0     1|1
1       639876  s34880.1        A       .       .       PASS    .       GT      0|0     0|0     0|0     0|0     0|0     0|0     0|0
复制代码

 

 

reference

01、https://mp.weixin.qq.com/s?__biz=Mzg5NDIyMTQ3NQ==&mid=2247486224&idx=1&sn=9c1c5cf324a0acc32fcf132d488d9688&scene=21#wechat_redirect

 

posted @   小鲨鱼2018  阅读(41)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2023-05-12 linux 中 awk命令如何输出双引号和单引号
2023-05-12 linux 中 创建环境变量若干方法
2023-05-12 ubuntu 中解决目录名称过长的问题
2023-05-12 linux 中 export命令
2023-05-12 linux 中xargs 命令
2022-05-12 R语言绘图控制表框类型bty
2022-05-12 ggplot2中geom_segment函数的用法
点击右上角即可分享
微信分享提示