【3】蛋白鉴定软件之Mascot

1.简介

Mascot是非常经典的蛋白鉴定软件,被Frost & Sullivan形容为“质谱数据检索的黄金标准”,更新维护速度也很快(已发布到2.7版New features in Mascot Server 2.7)。but,它是商业软件(国内康昱盛代理),收费。虽然有在线版本,但仅支持少量谱图检索,只能体验一下。大规模的蛋白组搜索必须使用它们的服务器。简述下特点:

  • 支持目前主流的三种检索算法:即2D-PAGE + MALDI的 Peptide Mass Fingerprint (PMF),LC-MS或复杂MALDI的MS/MS Ion Search,以及Sequence Query功能进行分子量和碎片离子信息联合搜库。
  • 特有的基于随机匹配概率的打分方法(另一种是经典的SEQUEST 2次打分算法),支持标准统计显著性检验分析
  • 整合FDR阈值选项及Percolator大规模数据检索质量控制算法
  • 可检索各种类型数据库,包括序列库和谱图库,也可自定义
  • 支持几乎所有常用的质谱仪输出的数据格式
  • 支持Web浏览器,给出概述性和详细的结果报告

mascot官网包含的东西很多,除了产品,它还提供了training的资料,bloghelp文档,对于蛋白质组学入门者而言,可以多浏览了解了解。

2.配置

Mascot服务器蛋白搜库功能
image.png

2.1在线版本

这里主要介绍串联质谱检索方法MS/MS Ions Search。点击进入Perform search

对主要的参数进行配置,比如数据库,物种,酶切,漏切,可变修饰,固定修饰,一二级误差及其单位,肽段价态,上传文件及格式,是否构建反库等。以下是一个简单的配置示例,仅供参考:
image.png

2.2 服务器版本

如果mascot部署已部署在本地服务器(如我们厂搭建在了集群上),需要通过服务器端口对酶、修饰、物种数据库等参数进行配置,然后在Linux环境中运行。mascot配置界面如下:
image.png
image.png
例如对物种数据库进行配置Databasea Maintenance
image.png
当然,如果你已经建好了库,下次可以从中选择继续用就行。建好库的标志就是在MASCOT search status page中显示In use,在Linux中则出现seq.a00, seq.errors , seq.fasta, seq.i00, seq.s00, seq.stats等文件

mascot服务器在Linux中的搭建和配置是比较复杂的,安装和配置指南我提供了一个文件供参考:

链接: https://pan.baidu.com/s/1IXkPqQ5k-Q-Y0bvvDga6mw
提取码: 5m1a

3.运行

3.1 在线版本

上传mgf谱图文件,点击start search即可进行在线检索,但这个检索支持的谱图数非常有限,体验一下即可。
PS:第一次提交不会立即执行,会发送消息到邮件需要你验证,然后再配置运行。

3.2 服务器版本

Linux服务器版本,配置好数据库及其他参数后,可调用以下命令:

nph-mascot.exe 1 -commandline -f test.dat < test.asc

得到mascot鉴定结果,并通过mascot提供的解析脚本export_dat.pl,得到进一步的详细结果:

perl export_dat.pl file=test.dat do_export=1 prot_hit_num=1 prot_acc=1 pep_query=1 pep_rank=1 pep_isbold=1 pep_isunique=1 pep_exp_mz=1 _quant_protein_ratio_type=median _quant_outliers_method=auto _min_precursor_charge=1 _quant_min_num_peptides=2 _quant_unique_pepseq=1 _quant_pep_threshold_type="at least identity" _quant_norm_method=median export_format=CSV _sigthreshold=0.05 _ignoreionsscorebelow=0.05 report=AUTO _server_mudpit_switch=0.000000001 show_same_sets=1 _requireboldred=1 search_master=1 show_header=1 show_decoy=1 show_mods=1 show_params=1 show_format=1 protein_master=1 prot_score=1 prot_desc=1 prot_mass=1 prot_matches=1 prot_cover=1 prot_seq=1 prot_quant=1 peptide_master=1 pep_exp_mr=1 pep_exp_z=1 pep_calc_mr=1 pep_delta=1 pep_start=1 pep_end=1 pep_miss=1 pep_score=1 pep_homol=1 pep_ident=1 pep_expect=1 pep_seq=1 pep_var_mod=1 pep_scan_title=1 pep_quant=1 use_homology=1 > test.csv

4.结果

一般而言,mascot得到的鉴定结果是.dat文件(当然也导出其他格式)。dat源文件比较复杂,常人是看不懂的(截取部分):
image.png
这时就有很多其他软件来对dat进行解析处理或者可视化。

对于官网提供的在线版本,mascot将结果生成了一份在线报告形式,清晰易懂。我这里就对结果不进行过多解释,不明白的地方也可查看help。
image.png

当然,我们也可以将dat文件导入如iQuant软件进行标记定量,或者导入PDV等谱图可视化软件来进行鉴定结果查看。

Ref:
http://www.cloudscientific.com/plus/view.php?aid=11
https://www.bio-equip.com.cn/show1equip.asp?equipid=439471


蛋白质组学鉴定定量系列软件总结:
【1】蛋白鉴定软件之X!Tandem
【2】蛋白鉴定软件之Comet
【3】蛋白鉴定软件之Mascot
【4】蛋白质组学鉴定软件之MSGFPlus
【5】蛋白质组学鉴定定量软件之PD
【6】蛋白质组学鉴定定量软件之MaxQuant

posted @ 2020-08-28 16:39  生物信息与育种  阅读(4498)  评论(1编辑  收藏  举报