Loading

Aspera下载安装使用

Aspera

Linux

安装

conda 安装

在Linux上安装Aspera,方便的还是直接通过conda进行安装(已经安装了Anaconda),在需要安装的环境下输入以下命令进行安装:

$ conda install -c hcc aspera-cli -y

查看是否安装成功

# 有输出帮助文档则安装成功
$ ascp -h

查找密钥(下面使用会用到)

$ which ascp # 输出下面内容,不同环境不一样,根据自己的来
~/software/miniconda3/envs/test/bin/ascp

binbin后面的内容换成etc/asperaweb_id_dsa.openssh
可以用ls验证一下是否存在。

$ ls ~/software/miniconda3/envs/test/etc/asperaweb_id_dsa.openssh
/home/wwwdj/software/miniconda3/envs/test/etc/asperaweb_id_dsa.openssh

自己安装

(conda 安装好了可以跳过了~)
若是要自己去官网下载软件来安装的话,这是下载命令,链接:

https://ak-delivery04-mul.dhe.ibm.com/sar/CMA/OSA/09cne/0/ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz

上面命令里的下载链接是当前最新版本3.11的,这篇文章发布后,可能会出现新版本。若需要可去官网下载。
下面这个链接包含了各个平台的软件包,不过可能需要注册账号登录才能获取下载链接。

https://www.ibm.com/support/fixcentral/swg/selectFixes?parent=ibm~Other%20software&product=ibm/Other+software/IBM+Aspera+Connect&release=All&platform=All&function=all

以上面那个3.11版本的为例。
下载

$ wget https://ak-delivery04-mul.dhe.ibm.com/sar/CMA/OSA/09cne/0/ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz

解压

$ tar -zxvf ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz

安装

## sh文件上一步解压生成的
$ ./ibm-aspera-connect-3.11.0.5-linux-g2.12-64.sh

设置环境变量

# 把USERNAME 换成自己的linux 账户名
$ echo """export PATH=\"/home/USERNAME/.aspera/connect/bin:\$PATH\" """ >> ~/.bashrc

使之立即生效

$ source ~/.bashrc

查看是否安装成功

# 有输出帮助文档则安装成功
$ ascp -h

基本语法

基本语法如下,[OPTION] 是参数设置,SRC 是远程资源路径,DEST是文件保存路径。若SRC为多个文件,则保存在DEST目录下。

ascp [OPTION] SRC... DEST

以一个例子作为说明

$ ascp  -l 100M -P 33001 -QT -k 2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/004/SRR5760814/SRR5760814.fastq.gz ./test.fq.gz
参数 说明
-l 最大传输速率
-i 密钥地址,自己安装都是:~/.aspera/connect/etc/asperaweb_id_dsa.openssh ,conda安装参照上面内容
-P -P33001,分开合起作用都是一样。设成其他可能会要输密码。Set the TCP port used for fasp session initiation. (Default: 22)
-Q Enable fair transfer policy
-k -k2, 分开合起作用都是一样,异常中断可以重启。Enables fatal transfer restarts.
-T 禁止加密。Disable encryption for maximum throughput.
SRC 位置参数,源文件地址,类似era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/004/SRR5760814/SRR5760814.fastq.gz
DEST ./test.fq.gz, 保存地址

参数啥的,我也没整明白。上面参数及说明参考ebi官网 https://www.ebi.ac.uk/ega/about/ftp-aspera,
更多的参数设置参考 https://download.asperasoft.com/download/docs/ascp/2.7/html/index.html

EBI数据下载

之前aspera是可以下载DDBJ,EBI,NCBI三大数据库的数据的。不过现在,由于NCBI数据迁移至云服务器了,可能不太好使了。DDBJ也是可以的,但不是国内似乎用ddbj的人不怎么用,不过它也不太好用。
三大数据库,若使用apera下载数据的话,现在应是ebi的最好使,它也直接给了apera下载地址。

下面以PRJNA392105(SRP110599 )项目数据为例,演示下载。

ebi 的更直观一些,直接打开网址,输入框输入Accession号就能很容易查到数据了,然后相关信息也很全,下载链接直接就给了。
浏览器输入以下url就可以跳到相应页面(手动在ebi官网输入框输入PRJNA392105查询也可以~)

https://www.ebi.ac.uk/ena/browser/view/PRJNA392105

打开页面后,把网页往下滑一下能看到一下页面(可能刚打开,还没加载完,得等一会儿才能看到)点Download All可以把所有样本的信息给下载了。方便用于批量下载。
image.png

滑动下面的滑动条,能看到FASTQ Aspera,这就是aspera下载链接。若没有看到,可点击右上角的倒三角图样,把fastq_aspera勾选了。其他的信息按自己要求也可以勾选。
image.png

这里就以单个文件为例演示下载。
这是上面图片看到第一个aspera下载链接。

# :前为服务器地址,:后为资源地址
fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz

构建下载命令时,需要在下载链接前加上ebi 给的公共账户名era-fasp(好像是)
如下:

$ ascp -l 100M -P 33001 -QT -k 2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz ./test.fq.gz

取别名

上面的命名,有些参数,基本每次都不会变动的。而每次都要输一遍,又很麻烦,因此可以用alias固定几个参数,取一个别名。

运行以下命令

$ echo "alias ascpp=\"ascp -QT -P33001 -k2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh\"" >> ~/.bashrc
$ source ~/.bashrc

以上命令,利用alias 给ascp添加了几个参数(可自行设定,这里因为-l 可能会经常变动,没加上它),赋给了新的命令 ascpp,原来的ascp也是可以用的。
再次下载数据,命令就简短许多了:

$ ascpp -l 100M era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz ./test.fq.gz
test.fq.gz                                                                                                            100% 1066MB 97.2Mb/s    03:57    
Completed: 1092464K bytes transferred in 237 seconds
 (37695K bits/sec), in 1 file.

DDBJ数据下载

DDBJ虽然不太好用,而且现在也没有提供fastq下载地址,不过可能也有人需要下载,这里简单说一下。
下面是一个下载测试
image.png
看起来下载速度还不错吧。

还是以上面的PRJNA392105(SRP110599 )为例,打开ddbj数据查询网页

https://ddbj.nig.ac.jp/DRASearch/

image.png
在页面 Accession后输入SRP110599,输入PRJNA392105查询不到的。
返回页面如下
image.png

然后,按图点击操作(仅做演示,随意下载。)
image.png

得到链接后类似这样

ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra

链接改一下变成下面这样

anonftp@ascp.ddbj.nig.ac.jp:ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra

下载命令为:

$ ascpp -l 1000M anonftp@ascp.ddbj.nig.ac.jp:ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra ./test.sra

参考

https://www.ebi.ac.uk/ega/about/ftp-aspera
https://download.asperasoft.com/download/docs/ascp/2.7/html/index.html

ps: 欢迎关注

posted @ 2021-01-21 14:52  何物昂  阅读(7098)  评论(2编辑  收藏  举报