从TCGA数据库官网下载数据
TCGA数据库 是 生物信息分析经常需要用到的数据库,今天学习了一下怎么在其官网上下载数据集
以下以下载肾上腺皮质癌患者的miRNA表达数据为例,来讲解具体的过程
第一步,打开TCGA网址:https://portal.gdc.cancer.gov
第二步,点击导航栏最右侧的 Repository,进入仓库
第三步,点击左侧导航栏的 Cases后,找到 Program项目中的 TCGA,再找到 Project 中的ACC
第四步,点击左侧导航栏的 Files后,按照下图所示,分别选择选项
此时,我们会看见我们所选择的筛选条件显示在右侧,并且也能看到一共有80个病例的80个文件。
第五步,将所有的文件添加至购物车
此时右上角的购物车图标就会显示现在的文件数量,我们点击这个图标,进入购物车
第六步,正式开始下载文件啦。
因为文件大小的原因,如果文件大小没有达到限制的大小,那么就可以直接下载,否则就需要下载官方的下载器来下载。
直接下载:点击 Download --> Cart
官方下载器下载:
首先,下载官方下载器:https://gdc.cancer.gov/access-data/gdc-data-transfer-tool;往下拉,找到下载位置,直接下载即可
下载后,我的放置位置如下图,这个很重要
其次,回到TCGA购物车页面,下载目录文件,这个可以直接下载的,然后也要记住放置位置
最后,打开cmd,使用命令行来下载文件就可以了,具体的参考 https://blog.csdn.net/weixin_42512684/article/details/89415482(好累,最后放一张最重要的图,其他的就不写了)
如果gdc-client的保存路径没有配置到环境变量,那么命令行里需要使用绝对路径