Nanopore下机数据处理
Nanopore测序下机原始数据为fast5格式(纳米孔原始的电信号文件),测序公司那边只进行了初步的质控,也就是生成了pass_fast5文件夹,其下包含上百条.fast5格式的数据。对于后续的数据分析非常的不方便。现需要将所有.fast5文件合并,并从合并后的fast5文件提取fasta序列。
更多详情见nanopore测序技术专题(八)
一、INSTALLATION
pip install ont-fast5-api
conda install -c bioconda poretools
二、合并fast5文件
single_to_multi_fast5 -i pass_fast5/ -s multi -n 4000 --recursive
三、从fast5文件提取fasta序列
poretools fastq pass_fast5/
四、提取后再合并也是可以的
cd pass_fast5
cat *.fastq