NextDenovo安装及使用
Graph-based从头拼接软件,和canu一样可以先correct然后再组装。但nextdenovo一般用于ont组装。结合nextpolish可以获取碱基准确度达985以上。
配置好组装序列文件路径以及配置文件,直接运行即可,使用简单。
一、安装
#建议在python2.7环境下,因为需要安装paralleltask,太高的python版本可能报错?
conda create -n python2.7 python=2.7
conda activate python2.7
pip install paralleltask
wget https://github.com/Nextomics/NextDenovo/releases/latest/download/NextDenovo.tgz
tar -vxzf NextDenovo.tgz && cd NextDenovo
echo "export PATH=$PATH:/home/liuxin/biosoft/NextDenovo" >> ~/.bashrc
source ~/.bashrc
#使用
conda activate python2.7
cd ~/biosoft/NextDenovo/test_data
nextDenovo run.cfg
二、标准流程
1、准备input.fofn
ls reads1.fasta reads2.fastq reads3.fasta.gz reads4.fastq.gz ... > input.fofn
2、配置run.cfg
cp doc/run.cfg ./
3、运行
nextDenovo run.cfg
4、查看结果
Sequence: 01_rundir/03.ctg_graph/nd.asm.fasta
Statistics: 01_rundir/03.ctg_graph/nd.asm.fasta.stat
PS: 官网提供的另一个测试数据来源太大了,就不再测试了。
三、补充
配置文件说明,详情参考https://nextdenovo.readthedocs.io/en/latest/OPTION.html
主要分全局选项控制nextdenovo行为,以及控制correction、assembly的相关参数设置,参数一眼明朗,具体使用时再来解析。
[General]
job_type = local
job_prefix = nextDenovo
task = all
rewrite = yes
deltmp = yes
parallel_jobs = 20
input_type = raw
read_type = ont # clr, ont
input_fofn = input.fofn
workdir = 01_rundir #输出目录
[correct_option]
read_cutoff = 1k
genome_size = 1g # estimated genome size
sort_options = -m 20g -t 15
minimap2_options_raw = -t 8
pa_correction = 3
correction_options = -p 15
[assemble_option]
minimap2_options_cns = -t 8
nextgraph_options = -a 1