批量上传序列到Gisaid数据库
本文演示的是用Gisaid官网自带的Excel宏批量上传毒株信息和序列到Gisaid数据库,需要魔法。
1. 下载GISAID Batch Uploader
找到自己需要上传的病毒类型,我是Flu,在对应的选项卡下面找到Batch Upload,确认一下自己的Excel版本是否支持,然后点击右下角的Download GISAID Batch Upload即可。
下载到本地以后,右键下载的文件,选择属性,在安全下面勾选解除锁定选项,应用,确认,关闭。
此时点开excel文件,点一下启动宏,然后会弹出以下Banner信息。
2. 按照官网说明填写信息
官网具体的说明可以参见下载页面,我在这里简单说明一下,该文件一共有3张表,其中前2张是需要我们填的
Isolates表
-
表头标红的除了第一列Isolate_Id(提交后官网返回),其他均为必填项,当然,如果你只上传某个病毒的一个片段序列,则其他片段信息可以不填。
-
故必填项分别为:
-
Isolate_Name:毒株名称,自定,请尽量符合规范
-
Subtype:毒株亚型
-
Location:国家信息
-
Host:宿主信息
-
Seq_ID(HA):以HA片段为例,这里填写自定的ID,没有什么具体要求,尽量是数字+字母组合,必须要和第二张表格的FASTA格式第一行的名称对应
-
Originating_Lab_Id:实验室ID,在第三张表里找到自己所在实验室的ID
-
Collection_date:毒株分离日期
Sequences表
推荐在notepad--等编辑器里,将自动换行关闭,然后直接粘贴过来。一个毒株序列分2行,第一行为>ID
,第二行为序列,不要掺杂任何空格,序列里也不允许有-
,要原始序列,需要注意的是,不允许有移码,不允许有提前终止(2个以上)的密码子。
3. 批量上传
开启魔法(TUN模式哦),在加载项里面执行批量上传的命令
等待一会儿之后,上传成功的序列会填充成绿色,并在第一列和第二列返回Isolate_ID信息,和对应的序列的EPI编号。
最后就可以去GISAID官网,my unreleased files里面查看自己上传的序列了,如果有问题的序列,会出现黄色的警示标志,点进去看一下具体问题再修改一下即可。
本文作者:鹿衔草_Yusy
本文链接:https://www.cnblogs.com/yusy/p/18725106
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步