samtools+bcftools 进行SNP calling

两个软件的作用:
1.samtools mpileup 主要是用于收集BAM文件中的信息,这个位点上有多少条read匹配,匹配read的碱基是什么,并将这些信息存储在BCF文件中。
2.bcftools 是真正进行calling的软件。其也可以用来BCF和VCF格式的转换。

常见流程:

#index REF
$samtools faidx GCF.fa
$bowtie2-build ./GCF.fa ./index/GCF

#生成bam比对文件
$bowtie2 -x ./index/GCF reads.fastq -S ./1.sam
$samtools view -sb 1.sam >1.bam

#对bam文件排序
$samtools sort -n 1.bam>1.sorted.bam 

#mpileup收集bam信息
$samtools mpileup -gUf ./GCF.fa 1.sorted.bam -o 1.bcf 
#-g,输出格式为BCF;-U ,输出格式不压缩,利于下步分析;-f,faidx后的REF

#bcftools call SNP
$bcftools view -cvNg 1.bcf>1.vcf
#-c,用贝叶斯推理进行calling;-v,只输出variant位点(force -c);-g 在variant位点,call per-sample genotypes(force -c);-N 跳过REF中不是A/T/C/G的点 #对vcf文件进行过滤 $vcfutils.pl varFilter -D100 > var.flt.vcf #-D 设置call SNP的最大reads depth

  

posted on 2017-07-23 15:53  青萍,你好  阅读(3324)  评论(0编辑  收藏  举报

导航