Journal of Proteome Research | Mining the Proteome Associated with Rheumatic and Autoimmune Diseases(挖掘风湿和自身免疫疾病相关的蛋白组)(解读人:黄旭蕾)
期刊名:JPR
发表时间:(2019年12月)
IF:3.780
单位:Grupo de Investigación de Reumatología (GIR), Unidad de Proteómica, INIBIC − Complejo Hospitalario Universitario de A Coruña, SERGAS, Universidad de A Coruña, A Coruña 15006, Spain
研究对象:风湿和自身免疫疾病
技术:文献挖掘
一、 概述:
近几十年来,骨关节炎和其他风湿性疾病的发病率稳步上升,包括自身免疫性疾病,如类风湿性关节炎、脊椎关节病、系统性红斑狼疮、系统性硬化和干燥综合征。风湿性和自身免疫性疾病(RADs)的特征是关节、肌肉或其他结缔组织的炎症。除了经常经历虚弱的活动性和疼痛外,RAD患者也有更高的风险遭受心血管或感染性事件等共病。鉴于RADs对社会经济的影响,全世界都在致力于这些疾病的广泛研究。本研究基于公开的文献,利用文献挖掘平台来识别与RADs密切相关的“流行”蛋白质。这一结果不仅能系统地对候选蛋白进行排序,从而进行有针对性的蛋白质组学研究,而且还可能进一步深入了解这些疾病的关键致病过程。
二、研究背景:
世界卫生组织(WHO)2010年开展的全球疾病负担研究显示,风湿性和自身免疫性疾病(RADs)在全球范围内的患病率和发病率异常高,占全球残疾年总数的21.3%。人类蛋白质组项目的RAD倡议是在2017年爱尔兰都柏林HUPO国际会议上发起的。该计划的目的是解决RADs中未满足的临床需求,如改进诊断、确定新的药物靶点、建立有针对性的干预措施,以及利用蛋白质组学及其相关组学改进临床管理。在HPP(B/D-HPP)以生物学和疾病为中心的战略框架下,这一倡议的直接科学目标之一是使用所谓的“流行蛋白质”战略和文本挖掘软件,汇编RADs中临床相关蛋白质的优先顺序列表。值得注意的是,关节炎中受影响最严重的组织,如关节软骨、滑膜组织或骨,目前都不包括在人类蛋白质图谱中,尽管这些努力已经开始。此外,现有的蛋白质组学数据仅限于来自肽库的人骨和猪/马滑液。除了缺乏蛋白质组学领域的信息外,这些组织在基因表达数据库(如基因型组织表达(GTEx)门户)中也没有表现出来。最近开发的工具PubPular和PURPOSE,使得系统识别和优先排序与感兴趣主题相关的蛋白质成为可能。
三、实验设计:
四、研究成果:(重点图表展示)
1. 在PURPOSE工具中可将RADs分为自身免疫性疾病(AD)和风湿病(RD),而自身免疫性结缔组织病(ACTDs)完全嵌入两者之间。AD和RD共有近2500种蛋白质,主要参与免疫和炎症过程。ACTDs包括1248个参与免疫和炎症过程的蛋白质。使用PubPular,发现类风湿性关节炎、系统性红斑狼疮和骨关节炎的出版物和相关蛋白数量最高。
图1 风湿病和自身免疫性疾病(RADs)中常见的蛋白质。(A)根据PURPOSE工具,与RADs相关的蛋白质的绝对数量,以及它们所涉及的过程。(B)在人(左)和小鼠模型(右)中,与本研究所包括的七种有代表性的RADs相关的出版物数量。(C)检索出版物中所含蛋白质的数量。OA,骨关节炎;RA,类风湿性关节炎;PsA,银屑病性关节炎;AS,强直性脊柱炎;SLE,系统性红斑狼疮;SSc,系统性硬化;SjS,绍格伦综合征。
2. 使用PubPular的骨关节炎中排名前五位的蛋白质包括Ⅱ型胶原、两种基质金属蛋白酶(MMP-13和-3)和两种aggrecanase(ADAMTS-4和-5)。使用PURPOSE工具,白细胞介素-1β(IL1B)和两种被认为是OA、COMP21和PRG4(也称为润滑素或浅层区蛋白(SZP))的生物标志物的蛋白质也出现了。
在类风湿性关节炎中,前五位的蛋白质在两种工具中只共享肿瘤坏死因子α(TNF)。值得注意的是,PubPular工具定位于Ro(SSB)和La(TRIM21/SSA)自身抗原,它们主要与SjS和SLE相关,是类风湿性关节炎中排名第一的优先蛋白。
银屑病性关节炎和强直性脊柱炎共享一些共同的蛋白质,独立于已经使用的文献挖掘工具。这些包括HLA抗原和IL-23受体(IL23 R),这显然归因于HLA-B27等位基因在SPAS中的发病率增加以及IL23/IL17轴在这些疾病的发病机制中的已知作用。
两个预期的蛋白TRIM21(SSA或Ro蛋白)和SSB(狼疮La蛋白)在系统性红斑狼疮和绍格伦综合征中均排名第一。
图2 根据PubPular和PURPOSE工具,在本研究中包含的七种代表性RAD中,前五种最普遍的蛋白质。
3. 基因本体分析显示,与细胞外基质的组织和分解、胶原分解代谢、骨化以及骨骼系统、软骨或结缔组织的发育相关的过程得到富集。参与细胞外基质组织过程的蛋白质在骨关节炎中高度表达(图3A,粉红色),与在另外两种非常不同的RAD中的表达不同。
图3 在三个有代表性的RAD中用普遍蛋白质构建的功能网络。(A)骨关节炎,(B)类风湿关节炎,和(C)系统性红斑狼疮。为了便于可视化,图中仅显示了使用目的引擎在每种疾病中排名前50位的蛋白质所获得的代表性结果。颜色是指这些蛋白质参与的生物过程:粉红色,细胞外基质组织;红色,细胞因子产生;蓝色,炎症反应;绿色,免疫系统过程
五、文章亮点(结论讨论):
本文所采用的基于文献挖掘工具的策略呈现出极大的优势,例如易用性、实现简单的优先级排序以及收集与感兴趣的主题相关的大量数据。然而,这种方法也有局限性,这是由蛋白质的术语和缩写的多样性引起的,这可能会导致识别上的错误。由于在搜索中几乎没有发现这些错误的身份,这支持了文献挖掘方法作为发现与疾病相关的蛋白质的第一步的有效性,但也强调了在进一步分析特定蛋白质之前需要审查结果。最后,当前文献挖掘方法的另一个本质局限在于其对蛋白质的偏颇,其本质上是因为对它们存在良好的分析,排除了其他非常重要但较少探索的蛋白质。从这个意义上说,有许多蛋白质应该是高度优先考虑的,尽管它们并不受欢迎。考虑到所谓的“循环论证”,在解释结果时应谨慎,因为循环论证实质上表明,关于功能的先验知识偏向于广泛研究的基因或蛋白质。因此,许多预测都是通用的,因此最有可能的候选蛋白质往往是具有许多其他功能的基因/蛋白质。总之,需要进一步有针对性的蛋白质组学方法和工作流程,以便能够分析那些特征性较差的蛋白质,这仍然是HPP倡议面临的一个关键挑战。
阅读人:黄旭蕾