python文本处理--定位motif在fasta文件上的位置,并给出位置信息
#!/usr/bin/python3
#-*- coding:utf-8 -*-
#在序列文件上找出所有的指定motif的位置
dna='ATGCGAGAGAGAGAGAAGTGCTGTGTAGCTGATGCGCTAGTTTCGCGCTAGAGAGTGTAAAATTGGAGAGTGTAGTAGTGTA'
motif='GTGTA'
l=[]
import re
matches=re.finditer('(?=GTGTA)', dna)
for match in matches:
loc=match.start()+1
l.append((loc, loc+len(motif)-1))
print(l)
输出结果:
[(23, 27), (55, 59), (70, 74), (78, 82)]