比如一个Fasta文件的内容如下:
seq001|aaa
ATCGGGG
seq002|bbb
AAAATTTT
删除序列名称中“|”后的内容,只保留seq001, seq002这样的名称
点击查看代码
#!/usr/bin/env python
import sys
import pysam
with pysam.FastxFile(sys.argv[1]) as fh:
for r in fh:
new_name = r.name.split('|')[0]
print(">"+new_name)
print(r.sequence)
python rename_fasta.py test.fa > rename.fa