python 中 Bio中SeqIO模块处理fastq数据

 

001、输出fastq的ID

复制代码
[root@PC1 test02]# ls
a.fastq  test.py
[root@PC1 test02]# cat a.fastq    ## 测试fasq数据,一共两个reads
@SRR8442980.988/2
AAGG
+
:FFF
@SRR8442980.1134/1
AAAAAAAATATAATTCCA
+
FFFFFFFFFFFFFFFFFF
[root@PC1 test02]# cat test.py     ## 测试程序
from Bio import SeqIO
temp = SeqIO.parse("a.fastq", "fastq")

for i in temp:
        print(i.id)
[root@PC1 test02]# python3 test.py   ## 执行程序,输出id
SRR8442980.988/2
SRR8442980.1134/1
复制代码

 

002、输出name

复制代码
[root@PC1 test02]# ls
a.fastq  test.py
[root@PC1 test02]# cat a.fastq            ## 测试fastq
@SRR8442980.988/2
AAGG
+
:FFF
@SRR8442980.1134/1
AAAAAAAATATAATTCCA
+
FFFFFFFFFFFFFFFFFF
[root@PC1 test02]# cat test.py           ## 测试程序
from Bio import SeqIO

temp = SeqIO.parse("a.fastq", "fastq")
for i in temp:
        print(i.name)                    ## 输出name
[root@PC1 test02]# python3 test.py   
SRR8442980.988/2
SRR8442980.1134/1
复制代码

 

003、输出碱基序列

复制代码
[root@PC1 test02]# ls
a.fastq  test.py
[root@PC1 test02]# cat a.fastq        ## 测试fastq
@SRR8442980.988/2
AAGG
+
:FFF
@SRR8442980.1134/1
AAAAAAAATATAATTCCA
+
FFFFFFFFFFFFFFFFFF
[root@PC1 test02]# cat test.py          ## 测试程序
from Bio import SeqIO

temp = SeqIO.parse("a.fastq", "fastq")
for i in temp:
        print(i.seq)
[root@PC1 test02]# python3 test.py      ## 输出fastq
AAGG
AAAAAAAATATAATTCCA
复制代码

 

004、输出每个碱基的质量值

复制代码
[root@PC1 test02]# ls
a.fastq  test.py
[root@PC1 test02]# cat a.fastq         ## 测试fastq
@SRR8442980.988/2
AAGG
+
:FFF
@SRR8442980.1134/1
AAAAAAAATATAATTCCA
+
FFFFFFFFFFFFFFFFFF
[root@PC1 test02]# cat test.py         ## 测试程序
from Bio import SeqIO

temp = SeqIO.parse("a.fastq", "fastq")
for i in temp:
        print(i.letter_annotations["phred_quality"])
[root@PC1 test02]# python3 test.py             ## 输出碱基质量值
[25, 37, 37, 37]
[37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37, 37]
复制代码

 

 

posted @   小鲨鱼2018  阅读(359)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2021-06-23 c语言中float关键字和double关键字的区别
2021-06-23 linux 系统如何给软件设置环境变量
2021-06-23 使用detectRUNS包进行ROH检测,计算近交系数实践
2021-06-23 gcta 计算 fst 实践
2021-06-23 PCA 主成分分析实践 gcta软件
2021-06-23 使用admixture软件分析群体组成
2021-06-23 PCA 主成分分析实践 plink软件
点击右上角即可分享
微信分享提示