【Python小试】去除核酸特定长度的接头序列

输入

input.txt

ATTCGATTATAAGCTCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATC
ATTCGATTATAAGCACTGATCGATCGATCGATCGATCGATGCTATCGTCGT
ATTCGATTATAAGCATCGATCACGATCTATCGTACGTATGCATATCGATATCGATCGTAGTC
ATTCGATTATAAGCACTATCGATGATCTAGCTACGATCGTAGCTGTA
ATTCGATTATAAGCACTAGCTAGTCTCGATGCATGATCAGCTTAGCTGATGATGCTATGCA

编码

file = open("input.txt")
output = open("trimmed.txt","w")

for dna in file:
    trimmed_dna = dna[14:] #接头特定长度14
    trimmed_length = len(trimmed_dna) - 1
    output.write(trimmed_dna)

    print("processed sequence with length" + str(trimmed_length))

输出

trimmed.txt

TCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATC
ACTGATCGATCGATCGATCGATCGATGCTATCGTCGT
ATCGATCACGATCTATCGTACGTATGCATATCGATATCGATCGTAGTC
ACTATCGATGATCTAGCTACGATCGTAGCTGTA
ACTAGCTAGTCTCGATGCATGATCAGCTTAGCTGATGATGCTATGCA
posted @ 2020-04-20 23:22  生物信息与育种  阅读(320)  评论(0编辑  收藏  举报