gatk中的 GenomicsDBImport 模块
官网:https://gatk.broadinstitute.org/hc/en-us/articles/5358869876891-GenomicsDBImport
001、一般用法,变异检测库
gatk --java-options "-Xmx4g -Xms4g" GenomicsDBImport -V SRR21814509.g.vcf -V SRR21814514.g.vcf --genomicsdb-workspace-path my_database --tmp-dir /public/home/b20223040323/tmp -L NC_003070.9
002、-L参数可以指定多条染色体
gatk --java-options "-Xmx4g -Xms4g" GenomicsDBImport -V SRR21814509.g.vcf -V SRR21814514.g.vcf --genomicsdb-workspace-path my_database --tmp-dir /public/home/b20223040323/tmp -L chr.list
chr.list 格式:
NC_003070.9 NC_003071.7
003、将g.vcf文件写入文件列表
gatk --java-options "-Xmx4g -Xms4g" GenomicsDBImport --sample-name-map cohort.sample_map --genomicsdb-workspace-path my_database --tmp-dir /public/home/b20223040323/tmp -L NC_003070.9
cohort.sample_map 文件格式:
SRR21814509 SRR21814509.g.vcf
SRR21814514 SRR21814514.g.vcf
004、添加样本,更新my_database数据库
gatk GenomicsDBImport -V SRR21814498.g.vcf --genomicsdb-update-workspace-path my_database --tmp-dir /public/home/b20223040323/tmp
005、从数据集中对单条染色体进行变异检测
gatk --java-options "-Xmx60G -XX:+UseParallelGC -XX:ParallelGCThreads=20" GenotypeGVCFs -R /public/home/b20223040323/arabidopsis/fasta/GCF_000001735.4_TAIR10.1_genomic.fna -L NC_003070.9 -V gendb://my_database -O test.vcf
006、对单条染色体的指定范围进行变异检测
gatk --java-options "-Xmx60G -XX:+UseParallelGC -XX:ParallelGCThreads=20" GenotypeGVCFs -R /public/home/b20223040323/arabidopsis/fasta/GCF_000001735.4_TAIR10.1_genomic.fna -L NC_003070.9:1-1000 -V gendb://my_database -O test.vcf
参考:
01、https://gatk.broadinstitute.org/hc/en-us/articles/360047216891-GenomicsDBImport
分类:
生信
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2020-12-02 Linux中利用DHCP服务为特定设备分配固定IP
2020-12-02 linux系统中部署DHCP服务并验证