samtools 使用简述

功能如下:

1、View

  主要功能讲sam文件转位bam文件。

      涉及的参数:

  -b 输出bam格式。。默认是sam文件

  -h 输出的sam文件带header。。默认不带

  -H 仅仅输出header

  -S 输入sam文件。。默认bam文件

  -u 输出bam文件不进行压缩。。必须有-b参数

  -c 输出比对上的数

  -f 输出含有所有flag都reads

  -F 输出没有flag的reads。。数字4代表改reads没有比对上,数字8表示mate序列没有比对上

  -q 比对的最低质量值。。一般20就可以

  例子:

  1⃣️ sam文件转位bam文件:samtools view -bS file.sam > file.bam

          bam转sam:samtools view -h -o file.sam file.bam

      2⃣️ 提取比对到参考基因组上的reads:samtools view -bF 4 file.bam > file.F.bam。。若提取两条reads都比对上,则F值设计为12。 4+8

  3⃣️ 提取bam文件中比对到chr3的结果,并以sam文件保存:samtools view file.bam chr3 > chr.sam






2、sort

  用法:samtools sort [-n] [-m] <in.bam> <out.bam>

  -m 内存参数默认下500,000,000 即500M(不支持M,G等缩写)

  -n 设定排序方式按short reads 的ID排。默认按照fasta在文件中的顺序

      例子:samtools sort accepted.bam accepted.sort.accepted.sort.bam

 3、merge

  将2个或者2个以上已经sort过的bam文件进行合并。

  samtools merge <out.bam> <in1.bam> <in2.bam> [....]

4、index

  必须对bam文件sort后在可以进行index。建立索引后生成.bai的文件。用于快速的随机处理。如tview等。

   samtools index <in.bam> <out.index> 

  以下两种都可以:

  samtools index file.sort.bam

  samtools index file.sort.bam file.sort.bam.bai

5、faidx

  对fasta文件建立索引,生成.fai文件。可以快速提取fasta文件中的某一序列

  samtools faidx genome.fasta

  提取序列:

  samtools faidx genome.fasta scafold10 > scafold10.fasta

6、tview

  smatools tview <file.bam> [ref.fasta]

  第一排位参考基因组序列,否则为N。按下g可以输入要到达基因组的某一位点,如:“chr3:1000” 3号人色体1000位。”.“切换显示碱基和点号,用“r”显示read name 等

7、flagstat

  samtools flagstat <in.bam>  

 

  待续。。。。。

 https://blog.csdn.net/sinat_38163598/article/details/72910115

 

 

 

关注下方公众号可获得更多精彩

posted @ 2018-08-02 21:59  斩毛毛  阅读(6906)  评论(0编辑  收藏  举报