fastq-dump 和 fasterq-dump 将sra文件转换为fastq格式的速度对比
001、 默认参数直接对比
[b20223040323@admin1 test02]$ ls SRR3156163.sra SRR3156164.sra [b20223040323@admin1 test02]$ md5sum * ## 两个sra文件完全一致 9e819f5e4499b54fd657163d82d07da9 SRR3156163.sra 9e819f5e4499b54fd657163d82d07da9 SRR3156164.sra [b20223040323@admin1 test02]$ time fastq-dump --split-3 SRR3156163.sra ## 使用fastq-dump,并记录时间 Read 51332776 spots for SRR3156163.sra Written 51332776 spots for SRR3156163.sra real 4m52.519s user 4m35.183s sys 0m19.418s [b20223040323@admin1 test02]$ time fasterq-dump --split-3 SRR3156164.sra ## 使用fasterq-dump,记录时间 spots read : 51,332,776 reads read : 102,665,552 reads written : 102,665,552 real 1m53.699s ## faster-dump速度更快 user 6m20.624s sys 1m4.905s [b20223040323@admin1 test02]$ ls SRR3156163_1.fastq SRR3156163_2.fastq SRR3156163.sra SRR3156164_1.fastq SRR3156164_2.fastq SRR3156164.sra [b20223040323@admin1 test02]$ ll -h 总用量 68G -rw-rw-r-- 1 b20223040323 b20223040323 14G 10月 6 16:49 SRR3156163_1.fastq -rw-rw-r-- 1 b20223040323 b20223040323 14G 10月 6 16:49 SRR3156163_2.fastq -rw-rw-r-- 1 b20223040323 b20223040323 6.6G 10月 6 16:43 SRR3156163.sra -rw-rw-r-- 1 b20223040323 b20223040323 14G 10月 6 16:51 SRR3156164_1.fastq -rw-rw-r-- 1 b20223040323 b20223040323 14G 10月 6 16:51 SRR3156164_2.fastq -rw-rw-r-- 1 b20223040323 b20223040323 6.6G 10月 6 16:43 SRR3156164.sra
002、fasterq-dump的多线程速度测试
[b20223040323@admin1 test02]$ ls SRR3156163.sra SRR3156164.sra [b20223040323@admin1 test02]$ md5sum * 9e819f5e4499b54fd657163d82d07da9 SRR3156163.sra 9e819f5e4499b54fd657163d82d07da9 SRR3156164.sra [b20223040323@admin1 test02]$ time fasterq-dump -e 8 --split-3 SRR3156164.sra ## 8线程 spots read : 51,332,776 reads read : 102,665,552 reads written : 102,665,552 real 0m55.326s user 4m7.720s sys 0m56.322s [b20223040323@admin1 test02]$ time fasterq-dump -e 30 --split-3 SRR3156163.sra ## 30线程 spots read : 51,332,776 reads read : 102,665,552 reads written : 102,665,552 real 0m33.775s ## 速度提高约40% user 5m1.410s sys 1m5.557s
003、其他参数
[b20223040323@admin1 test02]$ ls SRR3156163.sra SRR3156164.sra [b20223040323@admin1 test02]$ time fasterq-dump -e 48 -p --split-3 SRR3156163.sra -O result ## -p显示进度, -O参数指定输出目录, -e线程 join :|-------------------------------------------------- 100% concat :|-------------------------------------------------- 100% spots read : 51,332,776 reads read : 102,665,552 reads written : 102,665,552 real 0m31.166s user 4m37.099s sys 1m7.211s [b20223040323@admin1 test02]$ time fasterq-dump -e 48 -p --split-3 SRR3156164.sra -O result join :|-------------------------------------------------- 100% concat :|-------------------------------------------------- 100% spots read : 51,332,776 reads read : 102,665,552 reads written : 102,665,552 real 0m34.429s user 5m11.478s sys 1m18.067s [b20223040323@admin1 test02]$ ls result SRR3156163.sra SRR3156164.sra [b20223040323@admin1 test02]$ tree -h ## 查看结果结构 . ├── [4.0K] result │ ├── [ 14G] SRR3156163_1.fastq │ ├── [ 14G] SRR3156163_2.fastq │ ├── [ 14G] SRR3156164_1.fastq │ └── [ 14G] SRR3156164_2.fastq ├── [6.6G] SRR3156163.sra └── [6.6G] SRR3156164.sra 1 directory, 6 files
。
参考:
01、https://www.omicsclass.com/article/1917
02、https://www.jianshu.com/p/e9f6e16e2c8a
分类:
生信
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2022-10-06 shell 脚本中 set -e选项的作用
2022-10-06 How to install CPAN modules
2022-10-06 Can't exec "mysql_config": No such file or directory at Makefile.PL line 89.
2022-10-06 perl包的安装
2021-10-06 格式工厂合并视频和音频文件
2021-10-06 IDM下载B站视频多个文件,视频、音频分开如何处理
2021-10-06 截图快捷键