python 中序列ID从fasta文件中批量提取序列数据
001、
[root@pc1 test1]# ls a.fa chr.list test.py [root@pc1 test1]# cat a.fa ## 测试fasta文件 >chr1 tttcccggg >chr2 tttggg ccc >chr3 cccttt >chr4 aaaaattt [root@pc1 test1]# cat chr.list ## 序列ID chr2 chr4
[root@pc1 test1]# cat test.py ## 提取程序 #!/usr/bin/env python3 # -*- coding utf-8 -*- in_file = open("a.fa", "r") dict1 = {} for i in in_file: i = i.strip() if i[0] == ">": tmp = i dict1[tmp] = "" else: dict1[tmp] += i in_file.close() in_file2 = open("chr.list", "r") for i in in_file2: i = ">" + i.strip() if i in dict1: print(i) j = dict1[i] while len(j) >= 5: ## 指定每行输出5个碱基 print(j[:5]) j = j[5:] if len(j) != 0: print(j) in_file2.close()
[root@pc1 test1]# python3 test.py ## 提取结果 >chr2 tttgg gccc >chr4 aaaaa ttt
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2020-10-13 linux文件测试语句
2020-10-13 linux 系统中while循环示例
2020-10-13 linux系统中$RANDOM命令
2020-10-13 linux系统中let命令
2020-10-13 linux系统中expr命令
2020-10-13 linux系统中 read命令