Fast and accurate de novo genome assembly from long uncorrected reads
Fast and accurate de novo genome assembly from long uncorrected reads
快速和准确的从头基因组组装从长时间未纠正的read
+Author Affiliations
- Corresponding author: mile.sikic@fer.hr
-
↵5 These authors contributed equally to this work.
Abstract
The assembly of long reads from Pacific Biosciences and Oxford Nanopore Technologies typically requires resource-intensive error-correction and consensus-generation steps to obtain high-quality assemblies. We show that the error-correction step can be omitted and that high-quality consensus sequences can be generated efficiently with a SIMD-accelerated, partial-order alignment–based, stand-alone consensus module called Racon. Based on tests with PacBio and Oxford Nanopore data sets, we show that Racon coupled with miniasm enables consensus genomes with similar or better quality than state-of-the-art methods while being an order of magnitude faster.
太平洋生物科学公司和牛津纳米孔技术公司的长片段组装通常需要资源密集型的纠错和共识生成步骤,以获得高质量的组装。
我们的研究表明,使用名为Racon的simd加速、基于部分顺序对齐的独立的consensus模块,可以省去错误校正步骤,并有效地生成高质量的consensus序列。
基于对PacBio和Oxford Nanopore数据集的测试,我们发现,Racon与miniasm相结合可以实现与最先进的方法相似或更好的一致基因组,同时速度更快一个数量级。
posted on 2020-09-30 21:15 王闯wangchuang2017 阅读(159) 评论(0) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具