linux 安装bwa与samtools以及使用方法
安装conda参考在Linux上安装Anaconda - 阿坦 - 博客园 (cnblogs.com)
使用conda安装bwa:
1、打开终端或命令行界面。
2、创建一个新的conda环境(可选)。这是一个可选步骤,但推荐为bwa创建一个独立的环境以避免与其他软件包的冲突。您可以使用以下命令创建一个名为"bwa-env"的环境:
conda create -n bwa-env
3、激活新创建的conda环境(如果您在上一步中创建了环境)。使用以下命令激活"bwa-env"环境:
conda activate bwa-env
4、使用conda安装bwa。运行以下命令:
conda install -c bioconda bwa
这将从Bioconda软件源安装最新版本的bwa软件包及其依赖项。
使用conda安装samtools:
1、打开终端或命令行界面。
2、创建一个新的conda环境(可选)。这是一个可选步骤,但推荐为samtools创建一个独立的环境以避免与其他软件包的冲突。您可以使用以下命令创建一个名为"samtools-env"的环境:
conda create -n samtools-env
3、激活新创建的conda环境(如果您在上一步中创建了环境)。使用以下命令激活"samtools-env"环境:
conda activate samtools-env
4、使用conda安装samtools。运行以下命令:
conda install -c bioconda samtools
这将从Bioconda软件源安装最新版本的samtools软件包及其依赖项。
注意切换软件需要重新激活一下软件环境才可再次使用该软件(也就是重新执行一下第3步)。
使用命令如下
bwa aln ref.fa short_read.fq > aln_sa.sai //将"short_read.fq"中的短读序列与"ref.fa"中的参考基因组进行比对。比对的结果会保存在"aln_sa.sai"文件中。 bwa samse ref.fa aln_sa.sai short_read.fq > aln-se.sam //使用BWA工具生成SAM(Sequence Alignment/Map)格式的输出。它使用"ref.fa"作为参考基因组,"aln_sa.sai"作为比对文件,"short_read.fq"作为短读序列的输入。生成的SAM文件会保存在"aln-se.sam"中。 samtools view -b -S -h aln-se.sam > aln-se.bam //使用samtools工具将SAM文件"aln-se.sam"转换为BAM(Binary Alignment/Map)格式。选项"-b"和"-S"指定输入格式为SAM,"-h"将头部信息包含在输出中。转换后的BAM文件保存为"aln-se.bam"。 samtools stats aln-se.bam > aln-se.bam.stat //使用samtools从BAM文件"aln-se.bam"生成统计信息。它计算各种统计数据,如读取数量、比对质量和错误率。统计结果保存在"aln-se.bam.stat"文件中。 grep 'error rate' aln-se.bam.stat //使用grep工具在"aln-se.bam.stat"文件中搜索包含"error rate"的行。它提取与错误率相关的信息。 reads mapped/raw total sequences //这是来自统计文件"aln-se.bam.stat"的一行,提供了成功比对到参考基因组的读取数量以及总序列数量的信息。 less -S aln-se.bam.stat //使用less工具以可滚动的方式显示"aln-se.bam.stat"文件的内容。选项"-S"用于防止行换行,使得长行更易于阅读。 samtools view aln-se.bam|less -S //使用samtools查看BAM文件"aln-se.bam"的内容。然后使用管道符(|)将输出传递给less工具,以便可以滚动查看内容。选项"-S"用于防止行换行。