linux 安装bwa与samtools以及使用方法

安装conda参考在Linux上安装Anaconda - 阿坦 - 博客园 (cnblogs.com)

使用conda安装bwa:

1、打开终端或命令行界面。

2、创建一个新的conda环境(可选)。这是一个可选步骤,但推荐为bwa创建一个独立的环境以避免与其他软件包的冲突。您可以使用以下命令创建一个名为"bwa-env"的环境:

   conda create -n bwa-env

3、激活新创建的conda环境(如果您在上一步中创建了环境)。使用以下命令激活"bwa-env"环境:

   conda activate bwa-env

4、使用conda安装bwa。运行以下命令:

   conda install -c bioconda bwa

这将从Bioconda软件源安装最新版本的bwa软件包及其依赖项。

使用conda安装samtools:

1、打开终端或命令行界面。

2、创建一个新的conda环境(可选)。这是一个可选步骤,但推荐为samtools创建一个独立的环境以避免与其他软件包的冲突。您可以使用以下命令创建一个名为"samtools-env"的环境:

   conda create -n samtools-env

3、激活新创建的conda环境(如果您在上一步中创建了环境)。使用以下命令激活"samtools-env"环境:

   conda activate samtools-env

4、使用conda安装samtools。运行以下命令:

   conda install -c bioconda samtools

这将从Bioconda软件源安装最新版本的samtools软件包及其依赖项。

注意切换软件需要重新激活一下软件环境才可再次使用该软件(也就是重新执行一下第3步)。

使用命令如下

 

bwa aln ref.fa short_read.fq > aln_sa.sai    //将"short_read.fq"中的短读序列与"ref.fa"中的参考基因组进行比对。比对的结果会保存在"aln_sa.sai"文件中。
bwa samse ref.fa aln_sa.sai short_read.fq > aln-se.sam    //使用BWA工具生成SAM(Sequence Alignment/Map)格式的输出。它使用"ref.fa"作为参考基因组,"aln_sa.sai"作为比对文件,"short_read.fq"作为短读序列的输入。生成的SAM文件会保存在"aln-se.sam"中。
samtools view -b -S -h aln-se.sam > aln-se.bam    //使用samtools工具将SAM文件"aln-se.sam"转换为BAM(Binary Alignment/Map)格式。选项"-b"和"-S"指定输入格式为SAM,"-h"将头部信息包含在输出中。转换后的BAM文件保存为"aln-se.bam"。
samtools stats  aln-se.bam >  aln-se.bam.stat    //使用samtools从BAM文件"aln-se.bam"生成统计信息。它计算各种统计数据,如读取数量、比对质量和错误率。统计结果保存在"aln-se.bam.stat"文件中。
grep 'error rate' aln-se.bam.stat    //使用grep工具在"aln-se.bam.stat"文件中搜索包含"error rate"的行。它提取与错误率相关的信息。
reads mapped/raw total sequences    //这是来自统计文件"aln-se.bam.stat"的一行,提供了成功比对到参考基因组的读取数量以及总序列数量的信息。
less -S   aln-se.bam.stat    //使用less工具以可滚动的方式显示"aln-se.bam.stat"文件的内容。选项"-S"用于防止行换行,使得长行更易于阅读。
samtools view aln-se.bam|less -S    //使用samtools查看BAM文件"aln-se.bam"的内容。然后使用管道符(|)将输出传递给less工具,以便可以滚动查看内容。选项"-S"用于防止行换行。

 

posted @ 2023-12-19 16:30  阿坦  阅读(2303)  评论(0)    收藏  举报