python 中实现将fasta文件中碱基以每行指定数目输出

 

001、测试数据

复制代码
[root@PC1 test2]# ls
a.fa  test.py
[root@PC1 test2]# cat a.fa      ## 测试数据
>OR4F5_ENSG00000186092_ENST00000641515_61_1038_2618
CCCAGATCTCTTCAGTTTTTATGCCTCATTCTGTGAAAATTGCTGTAGTCTCTTCCAGTTATGAAGAAGGTAACTGCAGAGGCTATTTCCTGGAATGAATCAACGAGTGAAACGAATAACTCTATGGTGACTGAATTCATTTTTCTGGGTCTCTCTGATTCTCAGGAACTCCAGACCTTCCTATTTATGTTGTTTTTT
>OR4F29_ENSG00000284733_ENST00000426406_20_955_995
AGCCCAGTTGGCTGGACCAATGGATGGAGAGAATCACTCAGTGGTATCTGAGTTTTTGTTTCTGGGACTCACTCATTCATGGGAGATCCAGCTCCTCCTCCTAGTGTTTTCCTCTGTGCTCTATGTGGCAAGCATTACTGGAAACATCCTCATTGTGTTTTCTGTGACCACTGACCCTCACTTAC
[root@PC1 test2]# cat test.py    ## 转换脚本
#!/usr/bin/python

dict1 = {}
in_file = open("a.fa", "r")
out_file = open("result.fa", "w")

for i in in_file:
    i = i.strip()
    if i.startswith(">"):
        key = i
        dict1[key] = ""
    else:
        dict1[key] += i

len_perline = 20                 ## 指定每行的碱基数目

for key, val in dict1.items():
    out_file.write(key + "\n")
    while len(val) > len_perline:
        out_file.write(val[:len_perline] + "\n")
        val = val[len_perline:]
    out_file.write(val + "\n")

in_file.close()
out_file.close()
复制代码

 

复制代码
[root@PC1 test2]# python test.py        ## 执行程序
[root@PC1 test2]# ls
a.fa  result.fa  test.py
[root@PC1 test2]# cat result.fa        ## 查看结果
>OR4F5_ENSG00000186092_ENST00000641515_61_1038_2618
CCCAGATCTCTTCAGTTTTT
ATGCCTCATTCTGTGAAAAT
TGCTGTAGTCTCTTCCAGTT
ATGAAGAAGGTAACTGCAGA
GGCTATTTCCTGGAATGAAT
CAACGAGTGAAACGAATAAC
TCTATGGTGACTGAATTCAT
TTTTCTGGGTCTCTCTGATT
CTCAGGAACTCCAGACCTTC
CTATTTATGTTGTTTTTT
>OR4F29_ENSG00000284733_ENST00000426406_20_955_995
AGCCCAGTTGGCTGGACCAA
TGGATGGAGAGAATCACTCA
GTGGTATCTGAGTTTTTGTT
TCTGGGACTCACTCATTCAT
GGGAGATCCAGCTCCTCCTC
CTAGTGTTTTCCTCTGTGCT
CTATGTGGCAAGCATTACTG
GAAACATCCTCATTGTGTTT
TCTGTGACCACTGACCCTCA
CTTAC
复制代码

 

posted @   小鲨鱼2018  阅读(225)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2021-06-07 c语言 13-4
2021-06-07 c语言 13-3
2021-06-07 c语言 13-3
2021-06-07 c语言 13 - 3
2021-06-07 c语言中冒泡排序法
点击右上角即可分享
微信分享提示