将给定序列翻译成蛋白质序列

利用 dictionary 可以将给定的cDNA序列翻译成蛋白序列

 1 #!/bin/python
 2 # Dictionary protein translation
 3 
 4 my_dna = open("/home/maque/my_dna.txt").read().replace('\n', '') # 利用 str.replace() method 将 '\n' 去掉,这样 my_dna 就是一条单一的字符串
 5 
 6 condon_table = {"TTT":"F", "TTC":"F", "TTA":"L", "TTG":"L",
 7                 "TCT":"S", "TCC":"S", "TCA":"S", "TCG":"S",
 8                 "TAT":"Y", "TAC":"Y", "TAA":"*", "TAG":"*",
 9                 "TGT":"C", "TGC":"C", "TGA":"*", "TGG":"W",
10                 "CTT":"L", "CTC":"L", "CTA":"L", "CTG":"L",
11                 "CCT":"P", "CCC":"P", "CCA":"P", "CCG":"P",
12                 "CAT":"H", "CAC":"H", "CAA":"Q", "CAG":"Q",
13                 "CGT":"R", "CGC":"R", "CGA":"R", "CGG":"R",
14                 "ATT":"I", "ATC":"I", "ATA":"I", "ATG":"M",
15                 "ACT":"T", "ACC":"T", "ACA":"T", "ACG":"T",
16                 "AAT":"N", "AAC":"N", "AAA":"K", "AAG":"K",
17                 "AGT":"S", "AGC":"S", "AGA":"R", "AGG":"R",
18                 "GTT":"V", "GTC":"V", "GTA":"V", "GTG":"V",
19                 "GCT":"A", "GCC":"A", "GCA":"A", "GCG":"A",
20                 "GAT":"D", "GAC":"D", "GAA":"E", "GAG":"E",
21                 "GGT":"G", "GGC":"G", "GGA":"G", "GGG":"G"}  # create a dictionary contains the codon table
22 
23 codon_range = range(0, len(my_dna), 3)  # vary clever step  
24 protein = ""
25 
26 for site in codon_range:
27     codon = my_dna[site:site+3]
28     amino_acid = condon_table[codon]  # codon is a 'key' ina dictionary
29     protein = protein + amino_acid
30 
31 print(protein)

 

posted on 2015-09-17 20:11  OA_maque  阅读(894)  评论(0编辑  收藏  举报

导航