Improving and correcting the contiguity of long-read genome assemblies of three plant species using optical mapping and chromosome conformation capture data
Improving and correcting the contiguity of long-read genome assemblies of three plant species using optical mapping and chromosome conformation capture data
利用光学制图和染色体构象捕获数据改善和纠正三种植物长时间读取基因组装配的连续性
Jiao W B, Accinelli G G, Hartwig B, et al. Improving and correcting the contiguity of long-read genome assemblies of three plant species using optical mapping and chromosome conformation capture data[J]. Genome research, 2017, 27(5): 778-786.
1:测序对象3个十字花科植物:Arabis alpina(2n=16),Euclidium syriacum(2n=14), and Conringia planisiliqua(2n=14)
2:测序PacBio RS II,测序平均长度8.5 kb, 6.9 kb and 7.9 kb,测序86x, 47x and 54x
3:对比两种组装方式:Falcon(2016)与PBcR(2015),Falcon会产生比PBcR更少的contig,在物种Euclidium syriacum的组装上表现的更为明显,是四分之一。
4:拼接错误大多是小的缺失,主要是通过二代测序进行polish,使用Quiver软件
5:使用SMRT Analysis software (v2.3) 删除长度低于500bp,质量低于QV<80的reads.
6:call snp与indels使用bwa+samtools,当覆盖度>5并且比对质量大于25
7:更复杂的拼接错误使用mate pair文库,借助bwa比对,比对质量>30,没有任何错配和缺失,总共3个文库8
8:光学图谱的拼接:P < 8e-8 to generate draft consensus maps, P < 8e-9 for draft consensus map extension and P < 8e-12 for final merging of the draft consensus maps
9:构建scaffold: RefAligner 将光学图谱拼接的结果与三代结果比对,将之间不矛盾的contig构建scaffold参数使用P < 1e-9 ,其它的细节请参考文章
10:将Hi-C数据与三代组装的contig进行比对,使用的软件为BWA,构建scaffold软件使用HiRise software
11;分析所使用的脚本:(https://github.com/wen-biao/OM-HiC-scaffolding).
posted on 2020-09-21 18:12 王闯wangchuang2017 阅读(130) 评论(0) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 开发者必知的日志记录最佳实践
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具