mVISTA 多序列比对叶绿体基因组

mVISTA可对2个或者多个DNA序列进行比较,可以对比对结果进行可视化。

详情请大力戳这里

0 输入文件说明

mVISTA 需要输入的文件有如下几类

必须文件
  • 邮箱
  • fasta格式序列文件(或者GENBANK identifier)
    上传文件不得> 10 Mb
可选文件
  • 比对程序 (一般选第3个即可)
    a. AVID
    b. LAGAN
    c. Shuffle-LAGAN
  • 序列名称(序列名称会显示在结果图片中)
  • 注释文件 (添加注释文件,可显示在结果图片中)
    注释文件格式如下
< 106481 116661 gene1 
106481 106497 utr 
107983 108069 exon 
109884 110033 exon 
111865 112023 exon 

> 39424 42368 gene2 
39424 39820 exon 
41401 42368 exon

> 77817 81088 gene3
77817 78820 utr 
79538 80107 exon

给出基因的起始,终止坐标; '>', '<'表示正负链,外显子用exon表示;UTRs使用utr显示即可。
上述格式文件可以通过 Ensembl genome browser快速导出具体请看http://genome.lbl.gov/vista/mvista/instructions.shtml#pdf

  • 重复序列屏蔽 (是否进行屏蔽,如果否,则选择one-celled/do not mask)
  • 反向互补序列 (如果么有得到同源行较好的结果,可以选择该参数)
  • Regulatory VISTA (rVISTA) access (可用于预测转录因子结合位点,最大文件20k)

1 简单操作

选择3个测试数据进行检验

Step 1 选择比对序列条数

Step 1

Step 2 上传序列以及注释文件并提及即可

Step 2

其中注释文件的格式利用脚本进行转换(脚本进行稍微修改,省下自己写,感谢好人),即注意正负链,以及换行。上传ref的注释文件即可。

2 结果

结果则会得到3中类型文件

  • TxtBrowse: 详细记录比对信息, 保守序列等
  • Vista Browser: 交互的可视化工具
  • PDF: 比对结果可视化
    在表格最下面,有一个链接可调节可视化,保守序列的参数

点击pdf,可查看比对结果,如下所示

其中CNS:保守非编码序列 (conserved non-coding sequences)

欢迎扫码交流

posted @ 2021-01-26 09:41  斩毛毛  阅读(2292)  评论(0编辑  收藏  举报