GUPPY 3.1.5 安装
wget https://mirror.oxfordnanoportal.com/software/analysis/ont-guppy-cpu-3.1.5-1.el7.x86_64.rpm
sudo yum install ont-guppy-cpu-3.1.5-1.el7.x86_64.rpm
guppy_basecaller --help
Basecalling
将原始测序文件转换为碱基序列的过程basecalling,也就是将base call出来,生动形象。一代测序是对峰图进行处理,二代测序是将激发出的荧光照片进行处理,nanopore是将变化的电流值转换为碱基。由于每次是检测几个碱基共同的信号值,因此,碱基识别这个过程比较复杂。因此,官方碱基识别的工具经常更新,目前正在使用的是guppy工具,在它前面还有albacore,后面可能还有flappie,中间可能还有其他的。这就是因为这个领域还有很大的提高空间,也是研究的一大方向。还有很多第三方的工具,比如poretools,nanopolish等。不过这个工作还是推荐官方的工具吧,毕竟,机器是人家生产的,更了解一些。而且nanopore的碱基识别还与使用的芯片有关,因为DNA测序每秒过450 bp左右碱基,而RNA测序每秒过70 bp左右碱基,这在识别算法上是完全不同的。
guppy介绍
Guppy是Oxford
Nanopore提供的碱基识别软件,是一款基于命令行的工具包,目前MinKNOW软件中内置了该工具,后面如果有更好的工具,guppy就将被打入冷宫,目前被拍在沙滩上的albacore就是guppy未来的宿命。
guppy主要包括三大功能:
1、碱基识别
这是它的主要功能,Guppy使用神经网络算法(RNN)将电信号数据解读为DNA或RNA的五个标准碱基,即腺嘌呤,鸟嘌呤,胞咳淀,胸腺咳淀和尿密淀。
2、拆分条码数据
如果建库时添加了barcode条形码,那么在序列开端和尾端均有Oxford Nanopore Technologies提供的条形码序列,Guppy数据拆分功能基于识别出的碱基序列。这个原理类似于illumina basecalling中的index拆分。
3、比对
将测序数据与参考序列进行比对,其实这个是调用minimap2做的,而且选项参数都是内置的,无法调整,所以,这个功能还是不要使用了,一个软件还是把自己该做的事情做好。
4、甲基化修饰位点检测
如果某个碱基发生了甲基化修饰,那么在碱基识别过程中就会表现出一些异常信息,这些离群信息有可能就是潜在的甲基化修饰位点,guppy目前也可以进行碱基修饰的检测,不过这个需要学习集,不同物种需要单独的学习集,目前只试验了大肠杆菌,人等模式生物,如果有需要可以尝试进行检测。
提高guppy碱基识别速度
由于fast5文件存储数据量巨大,因此,程序计算量也非常大,guppy提供了两种碱基识别的策略,快速fast模式与hac高度精确模式,鱼和熊掌目前不可兼得,通过选择不同的配置文件来选择。具体看做什么分析,如果要做微生物快速鉴定,选择fast模式,如果要做基因组拼接,可以选择hac精确模式。如果想要快速同时还准确,也有办法,多加钱,有钱能使鬼推磨。购买更好的计算设备,例如多线程,GPU加速等,都可以显著提高碱基识别效率。
Except if you have an application which benefits from a realtime analysis I would recommend to turn the live basecalling off and, indeed, use a more powerful computer (ideally with GPUs) for guppy basecalling. If you turn live basecalling off you should directly get fast5 format, and no raw intermediate. You are not the first to have issues with .raw files, and it is a problem that was only recently fixed. Do you have access to the nanopore community forum? If so, see the following thread: https://community.nanoporetech.com/posts/how-to-convert-raw-to-fa One hour ago, Andrew Goodall posted there some guidelines on how to "recover" the .raw files.
REF
https://medium.com/@kepler_00/nanopore-guppy-3-1-5-gpu-server-mode-on-ubuntu18-with-nvidia-docker-c542f20bb704
https://zhuanlan.zhihu.com/p/91629796
https://esr-nz.github.io/gpu_basecalling_testing/gpu_benchmarking.html