使用wtdbg利用三代数据进行基因组de novo组装

相较于其他三代四代数据组装软件（Canu（也可用于纠错），smartdenovo，miniasm，Flye，TULIP，FALCON，FALCON-unzip等）

wtdbg有如下优点：

安装运行简单 (可用run_wtdbg_assembly.sh脚本生成运行脚本)，运行速度快,

运行内容：一步组装，两轮纠错

“--edge-min”值对基因大小影响特别大，在基因组复杂度低和测序深度大的情况下可提高该值，可降低运行内存和运行时间。（仅进行第一轮组装） [2]

wtdbg2软件使用[2,3]：

提供参数给run_wtdbg_assembly.sh，会动生成运行脚本。　

$ ./run_wtdbg_assembly.sh -h
$ cat run.sh

### assembling
wtdbg-1.2.8 -t 0 -i reads.fa.gz --tidy-reads 5000 -fo dbg -k 0 -p 21 -S 4 --rescue-low-cov-edges

进行基因组装
$ wtdbg2 -t 16 -i reads.fa.gz -fo prefix -L 5000


### first round of correction
wtdbg-cns -t 0 -i dbg.ctg.lay -fo dbg.ctg.lay.fa -c 0

得到一致性序列
$ wtpoa-cns -t 16 -i prefix.ctg.lay -fo prefix.ctg.lay.fa


### mapping
kbm-1.2.8 -t 0 -d dbg.ctg.lay.fa -i reads.fa.gz -k 0 -p 21 -S 4 -O 0 | best_kbm_hit.pl | awk '{print $6"\t"$9"\t"$10"\t"$1"\t"$2"


### generating new layout
map2dbgcns dbg.ctg.lay.fa reads.fa.gz dbg.map >dbg.map.lay


### second round of correction
wtdbg-cns -t 0 -i dbg.map.lay -fo dbg.map.fa -k 13 -c 3


### Finished


其他三代组装软件总结：
https://www.cnblogs.com/djx571/p/10223742.html

参考资料：

[1]https://github.com/ruanjue/wtdbg2

[2] https://www.jianshu.com/p/193f2cdd4407

[3] http://www.chenlianfu.com/?p=2647

[4]https://yiweiniu.github.io/blog/2018/06/Genome-Assembly-Pipeline-wtdbg/ 安装，参数调整等

posted on 2019-10-18 09:56 BPSO_mynotes 阅读(2808) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

BPSO_Mynotes

使用wtdbg利用三代数据进行基因组de novo组装

导航

公告