HISAT2安装及使用
HISAT2用于转录组数据比对参考基因组。
参考自:
https://github.com/andreaminio/AnnotationPipeline-EVM_based-DClab
一、安装
conda create -n rnaseq -c bioconda hisat2
二、使用
HISAT2 index building for reference
hisat2-build -p 16 genome.fa genome
Usage: hisat2-build [options]* <ref_in> <ht2_index_basename>
PE reads alignment(分不同组织分别运行)
hisat2 -x <hisat2_index_basename> -1 ${sample}_clean_R1.fq.gz -2 ${sample}_clean_R2.fq.gz --dta -t -p 48 2>HISAT2.err | samtools view -bS -T <hisat2_index_basename> | samtools sort -@ 48 > ${sample}.bam
三、 批量处理
批量处理多个样本组织
bash ~/biosoft/bin/doMap.HISAT2.PE.sh
sample_list.txt(假如用于测序的有8个组织样本,如A样本有A_Flower_clean_R1.fq.gz/A_Flower_clean_R2.fq.gz)
vim sample_list.txt
***************************************
A_Flwoer
A_Fruit
A_Leaf
A_Root
B_Flower
B_Fruit
B_Leaf
B_Root
***************************************
脚本内容如下
vim doMap.HISAT2.PE.sh
***************************************
cat sample_list.txt | while read sample
do
hisat2 -x <hisat2_index_basename> -1 ${sample}_clean_R1.fq.gz -2 ${sample}_clean_R2.fq.gz --dta -t -p 48 2>HISAT2.err | samtools view -bS -T <hisat2_index_basename> | samtools sort -@ 48 > ${sample}.bam
samtools index ${sample}.bam
done
****************************************