比对程序 Bowtie2 的简单使用
主要简述 bowtie2 的入门用法,完成从原始序列到最后完成mapping 之后的 sam格式文件。
参考文档
最重要的参考文档还是官方文档:
文献: Fast gapped-read alignment with Bowtie 2
下载,安装
下载:
bowtie2 -2.2.5
下载已经预编译好的软件即可。
安装:
先解压到一个文件夹
export PATH=$PATH:/home/user/bowtie2/
如果需要永久设置,需要把上面一行加到 ./bashrc 文件中即可
测试:
在任何目录下:
$ bowtie2
# 会出现各种信息,包括版本,用法等等
以下是比较简单的例子:
建立索引
$ bowtie2-build tigr7.fq /media/文档/Bowtie2Index/tigr7
# bowtie2-build : 是建立 索引
# tigr7.fa : 是基因组序列
# /media/文档/Bowtie2Index/tigr7 : 指的是输出的索引文件 放在 /media/文档/Bowtie2Index/ 目录下,并且所有index文件的前缀名为 tigr7,
mapping
把原始 fq 序列文件 mapping 到 参考基因组上,生成 sam 格式文件
/home/bowtie2/bowtie2 -p 4 -x /media/文档/Bowtie2Index/tigr7 -1 /media/文档/1.fq -2 /media/文档/2.fq -S /media/文档/eg2.sam
# -p 4 指的是用 4 个线程去运行程序
# -x 指的是 The basename of the index for the reference genome,即后跟 参考基因组的位置
# -1 /media/文档/1.fq 指的是 paired-end seq 中 的一端测序结果
# -2 /media/文档/2.fq 指的是 paired-end seq 中 的另一端测序结果
# -S /media/文档/eg2.sam 指的是 File to write SAM alignments to
这样, 就生成了所谓的 sam 格式文件, 以便于后续用 samtools 去处理。