python中实现DNA序列一致性计算
001、
[root@pc1 test01]# ls a.fa test.py [root@pc1 test01]# cat a.fa ## 测试fasta文件 >Rosalind_1 ATCCAGCT >Rosalind_2 GGGCAACT >Rosalind_3 ATGGATCT >Rosalind_4 AAGCAACC >Rosalind_5 TTGGAACT >Rosalind_6 ATGCCATT >Rosalind_7 ATGGCACT [root@pc1 test01]# cat test.py ## 统计程序 #!/usr/bin/env python3 # -*- coding: utf-8 -*- import pysam base = "ACGT" profile = [] in_file = pysam.FastxFile("a.fa") for i in in_file: if not profile: profile = [[0] * len(i.sequence) for j in base] for m,n in enumerate(i.sequence): profile[base.index(n)][m] += 1 list1 = [[] for i in profile[0]] for i in profile: for j in range(len(i)): list1[j].append(i[j]) for i in list1: print(base[i.index(max(i))], end = "") print("") for i,j in enumerate(base): tmp = [str(i) for i in profile[i]] print(j + ":" + "".join(tmp))
[root@pc1 test01]# ls a.fa test.py [root@pc1 test01]# python3 test.py ## 计算结果 ATGCAACT A:51005500 C:00142061 G:11630100 T:15000116
。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2022-09-12 linux 中如何列出当前目录中所有文件及目录的绝对路径
2022-09-12 双端测序中reads1和reads2是什么关系
2022-09-12 linux 系统中 wc命令