Nanopore下机数据处理

Nanopore测序下机原始数据为fast5格式(纳米孔原始的电信号文件),测序公司那边只进行了初步的质控,也就是生成了pass_fast5文件夹,其下包含上百条.fast5格式的数据。对于后续的数据分析非常的不方便。现需要将所有.fast5文件合并,并从合并后的fast5文件提取fasta序列。

参考Nanopore分析流程

更多详情见nanopore测序技术专题(八)

一、INSTALLATION

安装ont_fast5_api

pip install ont-fast5-api

安装Poretools

conda install -c bioconda poretools

二、合并fast5文件

single_to_multi_fast5 -i pass_fast5/ -s multi -n 4000 --recursive

三、从fast5文件提取fasta序列

poretools fastq pass_fast5/

四、提取后再合并也是可以的

cd pass_fast5
cat *.fastq
posted @ 2022-09-16 20:41  pd_liu  阅读(648)  评论(0)    收藏  举报