使用wtdbg利用三代数据进行基因组de novo组装

相较于其他三代四代数据组装软件(Canu(也可用于纠错),smartdenovo,miniasm,Flye,TULIP,FALCON,FALCON-unzip等)

wtdbg有如下优点

 

安装运行简单 (可用run_wtdbg_assembly.sh脚本生成运行脚本),运行速度快,

运行内容:一步组装,两轮纠错

“--edge-min”值对基因大小影响特别大,在基因组复杂度低和测序深度大的情况下可提高该值,可降低运行内存和运行时间。(仅进行第一轮组装) [2]

 

wtdbg2软件使用[2,3]:

提供参数给run_wtdbg_assembly.sh,会动生成运行脚本。 

$ ./run_wtdbg_assembly.sh -h
$ cat run.sh

### assembling
wtdbg-1.2.8 -t 0 -i reads.fa.gz --tidy-reads 5000 -fo dbg -k 0 -p 21 -S 4 --rescue-low-cov-edges
进行基因组装
$ wtdbg2 -t 16 -i reads.fa.gz -fo prefix -L 5000

### first round of correction
wtdbg-cns -t 0 -i dbg.ctg.lay -fo dbg.ctg.lay.fa -c 0
得到一致性序列
$ wtpoa-cns -t 16 -i prefix.ctg.lay -fo prefix.ctg.lay.fa

### mapping
kbm-1.2.8 -t 0 -d dbg.ctg.lay.fa -i reads.fa.gz -k 0 -p 21 -S 4 -O 0 | best_kbm_hit.pl | awk '{print $6"\t"$9"\t"$10"\t"$1"\t"$2"


### generating new layout map2dbgcns dbg.ctg.lay.fa reads.fa.gz dbg.map >dbg.map.lay

### second round of correction wtdbg-cns -t 0 -i dbg.map.lay -fo dbg.map.fa -k 13 -c 3

### Finished
 

其他三代组装软件总结:

https://www.cnblogs.com/djx571/p/10223742.html

 

参考资料:

[1]https://github.com/ruanjue/wtdbg2

[2] https://www.jianshu.com/p/193f2cdd4407

[3] http://www.chenlianfu.com/?p=2647

[4]https://yiweiniu.github.io/blog/2018/06/Genome-Assembly-Pipeline-wtdbg/ 安装,参数调整等

posted on 2019-10-18 09:56  BPSO_mynotes  阅读(2808)  评论(0编辑  收藏  举报

导航