python 实现统计fasta文件每一条序列的长度

 

001、

a、

复制代码
[root@pc1 test1]# ls
a.fa  test.py
[root@pc1 test1]# cat a.fa            ## 测试fasta
>chr1
tttcccggg
>chr2
tttggg
ccc
>chr3
cccttt
>chr4
aaaaattt
[root@pc1 test1]# cat test.py         ## 统计每条序列的长度
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

in_file = open("a.fa", "r")

row = 0
for i in in_file:
        i = i.strip()
        if i[0] == ">" and row >= 1:
                print(id, length)
        if i[0] == ">":
                row += 1
                id = i[1:]
                length = 0
        else:
                length += len(i)
print(id, length)

in_file.close()
复制代码

 

复制代码
[root@pc1 test1]# ls
a.fa  test.py
[root@pc1 test1]# cat a.fa
>chr1
tttcccggg
>chr2
tttggg
ccc
>chr3
cccttt
>chr4
aaaaattt
[root@pc1 test1]# python3 test.py      ## 运算结果
chr1 9
chr2 9
chr3 6
chr4 8
复制代码

 

b、

复制代码
[root@pc1 test1]# ls
a.fa  test.py
[root@pc1 test1]# cat a.fa           ## 测试fasta
>chr1
tttcccggg
>chr2
tttggg
ccc
>chr3
cccttt
>chr4
aaaaattt
[root@pc1 test1]# cat test.py    ## 计算程序
#!/usr/bin/env python3
# -*- coding: utf-8 -*-

in_file = open("a.fa", "r")
dict1 = dict()

for i in in_file:
        i = i.strip()
        if i[0] == ">":
                id = i
                dict1[id] = 0
        else:
                dict1[id] += len(i)
in_file.close()

for i in dict1:
        print(i[1:], dict1[i])
复制代码
复制代码
[root@pc1 test1]# ls
a.fa  test.py
[root@pc1 test1]# cat a.fa
>chr1
tttcccggg
>chr2
tttggg
ccc
>chr3
cccttt
>chr4
aaaaattt
[root@pc1 test1]# python3 test.py     ## 运算结果
chr1 9
chr2 9
chr3 6
chr4 8
复制代码

 。

 

posted @   小鲨鱼2018  阅读(79)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2020-10-13 linux文件测试语句
2020-10-13 linux 系统中while循环示例
2020-10-13 linux系统中$RANDOM命令
2020-10-13 linux系统中let命令
2020-10-13 linux系统中expr命令
2020-10-13 linux系统中 read命令
点击右上角即可分享
微信分享提示