摘要: 1.原理的区别 主要区别在于,非加权组平均法(UPGMA)是基于平均链接方法的聚集层次聚类方法,而邻接法(NJ)是基于最小演化准则的迭代聚类法。 UPGMA的假定条件是:在进化过程中,每一世系发生趋异的次数相同,即核苷酸或氨基酸的替换速率是均等且恒定的。 UPGMA生成有根树,而NJ生成无根树。由于 阅读全文
posted @ 2021-03-05 18:08 生物信息与育种 阅读(10378) 评论(0) 推荐(0) 编辑
摘要: 下了一些sra数据库中的公共数据,因为pretech和aspera不稳定,稍微大点的文件经常传断,部分文件我只能通过本地下载再上传。 那么问题来了,sra没有md5校验,我怎么知道我数据的完整性,尤其是通过本地下载的那些数据? 网上查了下是说,sra是自带md5校验的(The SRA archive 阅读全文
posted @ 2021-03-05 11:15 生物信息与育种 阅读(1988) 评论(0) 推荐(0) 编辑
摘要: python写流程控制的时候,有时需要等待运行结果完成才能进行下一步。有几个想法: 一是反复循环判断直到生成结果文件(且文件中有预期结果),低效易出错; 二是用subprocess模块来判断进程结果,较为常用; 三是用drmaa包,功能强大,但使用相对复杂。 这次介绍如何用subprocess来实现 阅读全文
posted @ 2021-03-05 11:03 生物信息与育种 阅读(5191) 评论(0) 推荐(0) 编辑