samtools+bcftools 进行SNP calling
两个软件的作用:
1.samtools mpileup 主要是用于收集BAM文件中的信息,这个位点上有多少条read匹配,匹配read的碱基是什么,并将这些信息存储在BCF文件中。
2.bcftools 是真正进行calling的软件。其也可以用来BCF和VCF格式的转换。
常见流程:
#index REF $samtools faidx GCF.fa $bowtie2-build ./GCF.fa ./index/GCF #生成bam比对文件 $bowtie2 -x ./index/GCF reads.fastq -S ./1.sam $samtools view -sb 1.sam >1.bam #对bam文件排序 $samtools sort -n 1.bam>1.sorted.bam #mpileup收集bam信息 $samtools mpileup -gUf ./GCF.fa 1.sorted.bam -o 1.bcf #-g,输出格式为BCF;-U ,输出格式不压缩,利于下步分析;-f,faidx后的REF #bcftools call SNP $bcftools view -cvNg 1.bcf>1.vcf
#-c,用贝叶斯推理进行calling;-v,只输出variant位点(force -c);-g 在variant位点,call per-sample genotypes(force -c);-N 跳过REF中不是A/T/C/G的点 #对vcf文件进行过滤 $vcfutils.pl varFilter -D100 > var.flt.vcf #-D 设置call SNP的最大reads depth
拒绝低效率勤奋,保持高效思考