于平沙如雪,构广厦万千|

鹿衔草_Yusy

园龄:2年2个月粉丝:1关注:0

批量上传序列到Gisaid数据库

本文演示的是用Gisaid官网自带的Excel宏批量上传毒株信息和序列到Gisaid数据库,需要魔法。

1. 下载GISAID Batch Uploader

找到自己需要上传的病毒类型,我是Flu,在对应的选项卡下面找到Batch Upload,确认一下自己的Excel版本是否支持,然后点击右下角的Download GISAID Batch Upload即可。

下载到本地以后,右键下载的文件,选择属性,在安全下面勾选解除锁定选项,应用,确认,关闭。

此时点开excel文件,点一下启动宏,然后会弹出以下Banner信息。

2. 按照官网说明填写信息

官网具体的说明可以参见下载页面,我在这里简单说明一下,该文件一共有3张表,其中前2张是需要我们填的

Isolates表

  1. 表头标红的除了第一列Isolate_Id(提交后官网返回),其他均为必填项,当然,如果你只上传某个病毒的一个片段序列,则其他片段信息可以不填。

  2. 故必填项分别为:

  • Isolate_Name:毒株名称,自定,请尽量符合规范

  • Subtype:毒株亚型

  • Location:国家信息

  • Host:宿主信息

  • Seq_ID(HA):以HA片段为例,这里填写自定的ID,没有什么具体要求,尽量是数字+字母组合,必须要和第二张表格的FASTA格式第一行的名称对应

  • Originating_Lab_Id:实验室ID,在第三张表里找到自己所在实验室的ID

  • Collection_date:毒株分离日期

Sequences表

推荐在notepad--等编辑器里,将自动换行关闭,然后直接粘贴过来。一个毒株序列分2行,第一行为>ID,第二行为序列,不要掺杂任何空格,序列里也不允许有-,要原始序列,需要注意的是,不允许有移码,不允许有提前终止(2个以上)的密码子。

3. 批量上传

开启魔法(TUN模式哦),在加载项里面执行批量上传的命令

等待一会儿之后,上传成功的序列会填充成绿色,并在第一列和第二列返回Isolate_ID信息,和对应的序列的EPI编号。

最后就可以去GISAID官网,my unreleased files里面查看自己上传的序列了,如果有问题的序列,会出现黄色的警示标志,点进去看一下具体问题再修改一下即可。

本文作者:鹿衔草_Yusy

本文链接:https://www.cnblogs.com/yusy/p/18725106

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   鹿衔草_Yusy  阅读(11)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起