biopython Bio.Alphabet
参考:https://biopython.org/wiki/Alphabet
作用:
1. 记录序列的分子类型(DNA, RNA或蛋白质),
2. 在序列、alignment、motif等中声明预期的字符。
在Biopython 1.78及以后的版本中删除了Bio.Alphabet模块。
#old version
>>> from Bio.Alphabet import IUPAC
>>> d = {a: i for i, a in enumerate(IUPAC.protein.letters)}
>>> d
{'A': 0, 'C': 1, 'D': 2, 'E': 3, 'F': 4, 'G': 5, 'H': 6, 'I': 7, 'K': 8, 'L': 9, 'M': 10, 'N': 11, 'P': 12, 'Q': 13, 'R': 14, 'S': 15, 'T': 16, 'V': 17, 'W': 18, 'Y': 19}
新版本中的Bio.Align.substitution_matrices.load()可达到同样效果。
#new version
>>> from Bio.Align import substitution_matrices
>>> m = substitution_matrices.load("BENNER22")
>>> d = {a: i for i, a in enumerate(m.alphabet)}
>>> d
{'A': 0, 'C': 1, 'D': 2, 'E': 3, 'F': 4, 'G': 5, 'H': 6, 'I': 7, 'K': 8, 'L': 9, 'M': 10, 'N': 11, 'P': 12, 'Q': 13, 'R': 14, 'S': 15, 'T': 16, 'V': 17, 'W': 18, 'Y': 19}