摘要: 1.决策树原理 决策树:树形结构流程图(漏斗型),模型本身包含一些列逻辑决策。数据分类从根节点开始,根据特征值遍历树上的各个决策节点。 几乎可应用于任何类型的数据建模,且性能不错。但当数据有大量多层次的名义特征或者大量的数值特征时,可能会生成一个过于复杂的决策树。 递归划分/分而治之:利用特征值将数 阅读全文
posted @ 2020-09-01 23:14 生物信息与育种 阅读(1934) 评论(0) 推荐(0) 编辑
摘要: 编写流程时,有一个好的习惯是将流程需要调用的软件、数据库等信息与脚本进行分离,这样可以统一管理流程的软件和数据库等信息,当它们路径改变或者升级的时候管理起来就很方便,而不需要去脚本中一个个寻找再修改。 在shell编程中,我们可以通过source config.txt来获取配置文件config.tx 阅读全文
posted @ 2020-09-01 18:11 生物信息与育种 阅读(500) 评论(0) 推荐(0) 编辑
摘要: 1. 组装算法 一般有基于OLC(Overlap-Layout-Consensus, 先重叠后扩展)和基于DBG(De Brujin Graph)两种组装算法。基于OLC的组装方法适合长序列组装,运行依赖的数据结构需要消耗大量的内存,且运行速度比较慢,错误率高,而DBG组装方法内存消耗相对较低,运算 阅读全文
posted @ 2020-09-01 16:47 生物信息与育种 阅读(7438) 评论(0) 推荐(1) 编辑