【3】蛋白鉴定软件之Mascot
1.简介
Mascot是非常经典的蛋白鉴定软件,被Frost & Sullivan形容为“质谱数据检索的黄金标准”,更新维护速度也很快(已发布到2.7版New features in Mascot Server 2.7)。but,它是商业软件(国内康昱盛代理),收费。虽然有在线版本,但仅支持少量谱图检索,只能体验一下。大规模的蛋白组搜索必须使用它们的服务器。简述下特点:
- 支持目前主流的三种检索算法:即2D-PAGE + MALDI的 Peptide Mass Fingerprint (PMF),LC-MS或复杂MALDI的MS/MS Ion Search,以及Sequence Query功能进行分子量和碎片离子信息联合搜库。
- 特有的基于随机匹配概率的打分方法(另一种是经典的SEQUEST 2次打分算法),支持标准统计显著性检验分析
- 整合FDR阈值选项及Percolator大规模数据检索质量控制算法
- 可检索各种类型数据库,包括序列库和谱图库,也可自定义
- 支持几乎所有常用的质谱仪输出的数据格式
- 支持Web浏览器,给出概述性和详细的结果报告
mascot官网包含的东西很多,除了产品,它还提供了training的资料,blog和help文档,对于蛋白质组学入门者而言,可以多浏览了解了解。
2.配置
Mascot服务器蛋白搜库功能:
2.1在线版本
这里主要介绍串联质谱检索方法MS/MS Ions Search。点击进入Perform search
对主要的参数进行配置,比如数据库,物种,酶切,漏切,可变修饰,固定修饰,一二级误差及其单位,肽段价态,上传文件及格式,是否构建反库等。以下是一个简单的配置示例,仅供参考:
2.2 服务器版本
如果mascot部署已部署在本地服务器(如我们厂搭建在了集群上),需要通过服务器端口对酶、修饰、物种数据库等参数进行配置,然后在Linux环境中运行。mascot配置界面如下:
例如对物种数据库进行配置Databasea Maintenance
当然,如果你已经建好了库,下次可以从中选择继续用就行。建好库的标志就是在MASCOT search status page中显示In use
,在Linux中则出现seq.a00, seq.errors , seq.fasta, seq.i00, seq.s00, seq.stats
等文件
mascot服务器在Linux中的搭建和配置是比较复杂的,安装和配置指南我提供了一个文件供参考:
链接: https://pan.baidu.com/s/1IXkPqQ5k-Q-Y0bvvDga6mw
提取码: 5m1a
3.运行
3.1 在线版本
上传mgf谱图文件,点击start search
即可进行在线检索,但这个检索支持的谱图数非常有限,体验一下即可。
PS:第一次提交不会立即执行,会发送消息到邮件需要你验证,然后再配置运行。
3.2 服务器版本
Linux服务器版本,配置好数据库及其他参数后,可调用以下命令:
nph-mascot.exe 1 -commandline -f test.dat < test.asc
得到mascot鉴定结果,并通过mascot提供的解析脚本export_dat.pl,得到进一步的详细结果:
perl export_dat.pl file=test.dat do_export=1 prot_hit_num=1 prot_acc=1 pep_query=1 pep_rank=1 pep_isbold=1 pep_isunique=1 pep_exp_mz=1 _quant_protein_ratio_type=median _quant_outliers_method=auto _min_precursor_charge=1 _quant_min_num_peptides=2 _quant_unique_pepseq=1 _quant_pep_threshold_type="at least identity" _quant_norm_method=median export_format=CSV _sigthreshold=0.05 _ignoreionsscorebelow=0.05 report=AUTO _server_mudpit_switch=0.000000001 show_same_sets=1 _requireboldred=1 search_master=1 show_header=1 show_decoy=1 show_mods=1 show_params=1 show_format=1 protein_master=1 prot_score=1 prot_desc=1 prot_mass=1 prot_matches=1 prot_cover=1 prot_seq=1 prot_quant=1 peptide_master=1 pep_exp_mr=1 pep_exp_z=1 pep_calc_mr=1 pep_delta=1 pep_start=1 pep_end=1 pep_miss=1 pep_score=1 pep_homol=1 pep_ident=1 pep_expect=1 pep_seq=1 pep_var_mod=1 pep_scan_title=1 pep_quant=1 use_homology=1 > test.csv
4.结果
一般而言,mascot得到的鉴定结果是.dat
文件(当然也导出其他格式)。dat源文件比较复杂,常人是看不懂的(截取部分):
这时就有很多其他软件来对dat进行解析处理或者可视化。
对于官网提供的在线版本,mascot将结果生成了一份在线报告形式,清晰易懂。我这里就对结果不进行过多解释,不明白的地方也可查看help。
当然,我们也可以将dat文件导入如iQuant软件进行标记定量,或者导入PDV等谱图可视化软件来进行鉴定结果查看。
Ref:
http://www.cloudscientific.com/plus/view.php?aid=11
https://www.bio-equip.com.cn/show1equip.asp?equipid=439471
蛋白质组学鉴定定量系列软件总结:
【1】蛋白鉴定软件之X!Tandem
【2】蛋白鉴定软件之Comet
【3】蛋白鉴定软件之Mascot
【4】蛋白质组学鉴定软件之MSGFPlus
【5】蛋白质组学鉴定定量软件之PD
【6】蛋白质组学鉴定定量软件之MaxQuant
本文来自博客园,作者:生物信息与育种,转载请注明原文链接:https://www.cnblogs.com/miyuanbiotech/p/13578358.html。若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。