使用bioawk对基因组fasta序列ID(染色体/scaffold名称)排序?
需求
已知某基因组序列,染色体或scaffold ID顺序不定,想要对其按数字排序。
原顺序:
想要的排序结果:
实现
使用bioawk,没有的话conda直接安装。
bioawk -c fastx '{print}' old.genome.fa | \
sort -k1,1V | awk '{print ">"$1;print $2}' >new.genome.fa
本文来自博客园,作者:生物信息与育种,转载请注明原文链接:https://www.cnblogs.com/miyuanbiotech/p/14690875.html。若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。