1. 软件的安装
a. bcftools 的安装
b. bgzip的安装: https://blog.csdn.net/weixin_30471065/article/details/95108525
下载链接:https://github.com/samtools/htslib/releases/download/1.2.1/htslib-1.2.1.tar.bz2
2. 合并
第一步:
用bgzip将所有的vcf文件压缩
bgzip -c -f f_nist_1_2.vcf > f_nist_1_2.vcf.gz
第二步:
用bcftools 对每一个压缩好的vcf文件建立index
bcftools index f_nist_1_2.vcf.gz
第三步:
用bcftools将压缩好的所有vcf文件进行合并
bcftools merge fc_nist_1_1.vcf.gz fc_nist_1_2.vcf.gz fc_nist_1_3.vcf.gz fc_nist_1_4.vcf.gz fc_nist_2_1.vcf.gz fc_nist_2_2.vcf.gz fc_nist_2_3.vcf.gz fc_nist_2_4.vcf.gz -Oz -o merge.vcf.gz
任务完成,得到最后合并好的vcf文件。
bcftools文件的一些使用方法:
http://www.htslib.org/doc/1.0/bcftools.html
bgzip的使用方法参考网址:
http://www.htslib.org/doc/bgzip.html
拆分成单个样本的vcf文件:
1、下载安装bcftools。
2、准备样本ID文件,这里命名为samplelistname.txt,一个样本一行,如下所示:
sample1
sample2
sample3
3、输入命令:
bcftools view -S samplelistname.txt /1000genomes/ALL.chr16.phase3_shapeit2_mvncall_integrated_v5a.20130502.genotypes.vcf.gz -Ov > samplelist_1000Genomes.vcf