python 中实现将fasta文件中碱基以每行指定数目输出
001、测试数据
[root@PC1 test2]# ls a.fa test.py [root@PC1 test2]# cat a.fa ## 测试数据 >OR4F5_ENSG00000186092_ENST00000641515_61_1038_2618 CCCAGATCTCTTCAGTTTTTATGCCTCATTCTGTGAAAATTGCTGTAGTCTCTTCCAGTTATGAAGAAGGTAACTGCAGAGGCTATTTCCTGGAATGAATCAACGAGTGAAACGAATAACTCTATGGTGACTGAATTCATTTTTCTGGGTCTCTCTGATTCTCAGGAACTCCAGACCTTCCTATTTATGTTGTTTTTT >OR4F29_ENSG00000284733_ENST00000426406_20_955_995 AGCCCAGTTGGCTGGACCAATGGATGGAGAGAATCACTCAGTGGTATCTGAGTTTTTGTTTCTGGGACTCACTCATTCATGGGAGATCCAGCTCCTCCTCCTAGTGTTTTCCTCTGTGCTCTATGTGGCAAGCATTACTGGAAACATCCTCATTGTGTTTTCTGTGACCACTGACCCTCACTTAC [root@PC1 test2]# cat test.py ## 转换脚本 #!/usr/bin/python dict1 = {} in_file = open("a.fa", "r") out_file = open("result.fa", "w") for i in in_file: i = i.strip() if i.startswith(">"): key = i dict1[key] = "" else: dict1[key] += i len_perline = 20 ## 指定每行的碱基数目 for key, val in dict1.items(): out_file.write(key + "\n") while len(val) > len_perline: out_file.write(val[:len_perline] + "\n") val = val[len_perline:] out_file.write(val + "\n") in_file.close() out_file.close()
[root@PC1 test2]# python test.py ## 执行程序 [root@PC1 test2]# ls a.fa result.fa test.py [root@PC1 test2]# cat result.fa ## 查看结果 >OR4F5_ENSG00000186092_ENST00000641515_61_1038_2618 CCCAGATCTCTTCAGTTTTT ATGCCTCATTCTGTGAAAAT TGCTGTAGTCTCTTCCAGTT ATGAAGAAGGTAACTGCAGA GGCTATTTCCTGGAATGAAT CAACGAGTGAAACGAATAAC TCTATGGTGACTGAATTCAT TTTTCTGGGTCTCTCTGATT CTCAGGAACTCCAGACCTTC CTATTTATGTTGTTTTTT >OR4F29_ENSG00000284733_ENST00000426406_20_955_995 AGCCCAGTTGGCTGGACCAA TGGATGGAGAGAATCACTCA GTGGTATCTGAGTTTTTGTT TCTGGGACTCACTCATTCAT GGGAGATCCAGCTCCTCCTC CTAGTGTTTTCCTCTGTGCT CTATGTGGCAAGCATTACTG GAAACATCCTCATTGTGTTT TCTGTGACCACTGACCCTCA CTTAC
分类:
python
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2021-06-07 c语言 13-4
2021-06-07 c语言 13-3
2021-06-07 c语言 13-3
2021-06-07 c语言 13 - 3
2021-06-07 c语言中冒泡排序法