摘要: 一、数据获取 物种间的基因家族扩张收缩分析一般以蛋白序列来做。目标物种的蛋白序列可以从ncbi、esemble、JGI等数据库获取。 二、数据处理 各个数据库间的注释信息等可能存在差异,获取后需要提取最长蛋白序列,简化id,否则会影响提取同源单拷贝基因等后续分析。关于提取最长蛋白序列,网上脚本很多。 阅读全文
posted @ 2023-03-05 17:33 pd_liu 阅读(3324) 评论(0) 推荐(0) 编辑