质谱和蛋白质组学领域简述

从事基于质谱的蛋白质组学信息分析也有一年多时间了,回过头来还是需要缕一缕这个领域的方方面面,温故知新。

简要概述

蛋白质组学(Proteomics)是研究一种细胞乃至一种生物所表达的全部蛋白质的统称。作为系统生物学中的重要组成部分,处于中心法则下游,相比于基因组和转录组学而言,发展比较缓慢。

蛋白质作为生命活动的执行者,表明了生物体正在发生的事件,这种状态是基因最终真实表达的反应,因此将其作为研究对象是非常重要的。

但是呢,蛋白质组学的研究又处于比较尴尬的地位,因为它鉴定和定量的结果相比于基因组而言并不是那么准确,这主要还是工具的局限性决定的。工具是科学研究的基础,试想如果没有测序仪,基因组学会有现在的蓬勃发展吗?

高通量蛋白质组学测序的利器就是质谱仪。如果说测序仪是一把尺,测出基因碱基序列的顺序和长度,那么质谱仪就是一杆秤,称出蛋白质碎裂离子的质量。

近百年来,质谱的发展离不开4次获诺贝尔奖的6大猛男。1906年,汤姆森(J.J.Thomson)由于在气体导电方面的理论和实验研究获得诺贝尔物理学奖,第一台质谱仪就是他发明的,更牛逼的是,他的七个研究助手和他的儿子后来都获得诺贝尔奖。1922年,弗朗西斯·阿斯顿(Francis William Aston)借助自己发明的质谱仪发现了大量非放射性元素的同位素,以及阐明了整数法则,因而被授予诺贝尔化学奖。1989年,沃尔夫冈保罗(Wolfgang Paul)和汉斯·乔治·德赫梅尔特(Hans G. Dehmelt)因共同开发了非磁性四极杆质量过滤器获得诺贝尔物理学奖,为现在所谓的离子阱奠定了基础。质谱领域最近的一次获诺奖是2002年,美国的约翰贝内特芬恩(John B. Fenn)和日本的田中耕一(Koichi Tanaka)因分别发明了电喷雾电离(ESI)和基质辅助激光解吸/电离(MALDI)获得了诺贝尔化学奖,使得通过质谱分析生物大分子成为可能。目前质谱仪的主要电离方式也还是这两种。

学术界

目前比较公认的领域权威是瑞士苏黎世联邦理工大学的Ruedi Aebersold教授和德国马普所的Mathias Mann(曾师从John B. Fenn)。两人几乎同步引领着蛋白质组学发展的方向,干湿实验都有涉及。比如最早的母离子标记定量,Ruedi和Mann分别发明了ICAT和SILAC。后来Ruedi还发明了子离子标记定量iTRAQ和DIA技术,目前已经成为了蛋白质组学主要定量方法。Mann则开发了MaxQuant和Perseus等系列搜库、鉴定、定量和下游数据分析软件。

其实还有很多其他大牛。简单罗列下:
首次用三重四级杆质谱Top-down(自上而下)分析完整蛋白的Richard D. Smith;开发SEQUEST MS/MS数据库搜索软件的John Yates III,今年的美国质谱年会(ASMS)的杰出贡献奖就颁给了他。电子转移解离技术(ETD)的hua Coon;研究Top-down蛋白质组学的Neil Kelleher;研究蛋白质组学定量技术的剑桥大学的Kathryn Lilley;应用生物质谱和蛋白质组学到细胞生物学的Pierre Thibault;开发稳定同位素标记技术的Michael MacCoss;研究基于质谱的结构生物学的Albert Heck;HUPO前任主席,热衷于质谱技术发展及应用的Catherine Costello;领导研发Orbitrap质谱仪的Thermo质谱研发总监Alexander Makarov;哈佛医学院的Steven Gygi教授,长期从事蛋白质组学定量领域,等等。

国内蛋白质组学领域的大牛就比较尴尬了。怎么说呢?没有什么创新性的工作吧,一直都是跟着人家后面走。不过根据二八法则,知名的专家还是有的。最有名的非军事医学科学院院长贺福初院士(还是中将)莫属。其次复旦大学的杨芃原、乔亮;国家蛋白质科学中心(凤凰中心)的秦钧、杨小红等;中科院计算技术研究所的贺思敏、付岩(国产搜库软件pFind开发者),西湖大学的郭天南(Reudi的学生),华科的薛宇(专做修饰),南方医科大学的田瑞军,BGI的刘斯奇等。北大清华都有自己的蛋白质组学平台,但没有很大亮眼的工作。以上团队各自偏向于组学整合、疾病研究或软件开发,整个蛋白质组学在国内还在起步阶段,有很长的路要走。

工业界

质谱仪基本被AB SCIEX、安捷伦、赛默飞、布鲁克等国外企业垄断,四大传统分析仪器制造龙头占有超过70%的质谱仪市场,此外还有waters和岛津等实力公司占据很大份额。尽管目前质谱仪中的很多关键技术已经国产化,但国内产品性能及价格方面仍不敌国外产品,中高端质谱完全依赖进口。

国内目前在做的比较知名的厂商有:郑州的安图生物,北京的博晖创新,江苏的天瑞仪器,北京东西分析,广州禾信仪器等。这些公司产出的仪器偏小型化,在临床检测(如MLADI核酸SNP检测)、微生物检测、代谢物鉴定等方面应用比较多,但分辨率和准确率还远远不够。

困境

质谱数据上游的谱图解析使用的都是与各仪器厂商配套的质谱仪开发的软件,各公司产出的质谱数据格式众多,都不统一。因为都是商业软件,并非开源,比如DDA模式常用的Mascot软件和DIA模式常用的Spectronaut软件等,都被国外仪器厂商所垄断。虽然目前也渐渐开发出免费的开源软件(PS:MaxQuant免费但不开源,而且主要支持Windows),但由于谱图文件格式是厂家决定的,几乎只能支持他们开发的软件或Windows平台处理,这样对大数据处理效率和体验度来说都极不友好。所以这也是蛋白质组学数据分析落后于基因组学数据分析的主要原因之一吧,其实下游的分析和基因组基本上是一个套路。

质谱仪和谱图解析软件等核心的东西都掌握在人家的手上,所以中国蛋白质组学发展还是很受限的。我们的优势似乎仍和几年前的基因组发展一样,砸钱买仪器,然后做大队列研究。蛋白质组学作为后基因组学时代产物,开始慢慢发力,尤其是在精准医疗的推动下,在临床上的研究和应用只会越来越普遍。不过,如今的蛋白组研究还是不如当年基因组研究那么火热和亟需吧。不会再出现第二个华大来和世界玩这种竞赛游戏了。

一孔之见,很多东西还要去完善。

Ref: http://blog.sciencenet.cn/blog-563591-652241.html

posted @ 2019-06-23 19:21  生物信息与育种  阅读(5940)  评论(0编辑  收藏  举报