mVISTA 多序列比对叶绿体基因组
mVISTA可对2个或者多个DNA序列进行比较,可以对比对结果进行可视化。
详情请大力戳这里
0 输入文件说明
mVISTA 需要输入的文件有如下几类
必须文件
- 邮箱
- fasta格式序列文件(或者GENBANK identifier)
上传文件不得> 10 Mb
可选文件
- 比对程序 (一般选第3个即可)
a. AVID
b. LAGAN
c. Shuffle-LAGAN - 序列名称(序列名称会显示在结果图片中)
- 注释文件 (添加注释文件,可显示在结果图片中)
注释文件格式如下
< 106481 116661 gene1
106481 106497 utr
107983 108069 exon
109884 110033 exon
111865 112023 exon
> 39424 42368 gene2
39424 39820 exon
41401 42368 exon
> 77817 81088 gene3
77817 78820 utr
79538 80107 exon
给出基因的起始,终止坐标; '>', '<'表示正负链,外显子用exon表示;UTRs使用utr显示即可。
上述格式文件可以通过 Ensembl genome browser快速导出具体请看http://genome.lbl.gov/vista/mvista/instructions.shtml#pdf
- 重复序列屏蔽 (是否进行屏蔽,如果否,则选择one-celled/do not mask)
- 反向互补序列 (如果么有得到同源行较好的结果,可以选择该参数)
- Regulatory VISTA (rVISTA) access (可用于预测转录因子结合位点,最大文件20k)
1 简单操作
选择3个测试数据进行检验
Step 1 选择比对序列条数
Step 2 上传序列以及注释文件并提及即可
其中注释文件的格式利用脚本进行转换(脚本进行稍微修改,省下自己写,感谢好人),即注意正负链,以及换行。上传ref的注释文件即可。
2 结果
结果则会得到3中类型文件
- TxtBrowse: 详细记录比对信息, 保守序列等
- Vista Browser: 交互的可视化工具
- PDF: 比对结果可视化
在表格最下面,有一个链接可调节可视化,保守序列的参数
点击pdf,可查看比对结果,如下所示
其中CNS:保守非编码序列 (conserved non-coding sequences)