药物数据库

参考文献:
基于因特网的常用化合物活性数据库简介
药物靶点数据库的应用进展_庞晓丛_刘艾林_杜冠华
1、Chembl数据库:

 Chembl数据库是欧洲生物信息研究所(European Bioinformatics Institute,EBI)开发的一个在线的免费数据库,它通过从大量文献中收集各种靶点及化合物的生物活性数据,为药物化学家们提供了一个非常便利的查询靶点或化合物的生物活性数据的平台。目前,该数据库共收集了9414个靶点,156.6万个化合物,共有1200万条生物活性信息。通过该数据库,用户可以快速查询到某个靶点目前以报道的化合物及其活性信息,也可以查询某个化合物在哪些靶点做个生物活性测试及其数据。这些数据都来源于各种已报道的文献,数据较为可靠,且能够溯源,查询到数据的出处。通过该数据库,用户可以节省大量查阅文献和收集化合物数据的时间,快速获取准确的化合物及其生物学数据,进一步加速药物设计和药物开发的速度。

      这里我们将给大家介绍,如果通过Pipeline Pilot来自动获取Chembl数据库中的数据,从而将查询到的靶点或化合物的活性数据直接后续的定量构效关系(QSAR)、药效团、分子对接等药物分析中。

      Chembl数据库通过Web Service,为用户提供了丰富的查询接口,可以进行各种信息的查询:如查询化合物的图像,活性信息,相似搜索,子结构搜索;靶点的活性信息,序列;分析测试的文献信息等。

 

图1 Chembl的化合物的子结构搜索查询语法

 

      通过使用Pipeline Pilot中的XML reader或者是JSON reader组件,我们就可以直接在线地获取Chembl数据库的数据。Chembl化合物查询中,需要将化合物转换成SMILES码,这个转换我们可以使用Molecules to Smiles组件进行转换;同样的,Chembl数据库获取数据中的化合物结构都是SMILES码,我们也可以很方便地利用Pipeline Pilot进行生成对应的化合物结构。

 

图2 Pipeline Pilot进行Chembl的化合物的相似性搜索和根据靶点查询

 

2、CTD数据库

Mount Desert Island Biological Laboratory已经公开了“比较毒物遗传学数据库”(Comparative Toxicogenomics Database,网址是:http://ctd.mdibl.org,)。CTD(比较毒物遗传数据库)构建的目的是促进了解环境化合物对人类健康的影响。CTD首次为全世界的研究人员提供了集中、综合的各种不同类型分子以及来自各种生物体的毒理学数据。

  到目前为止,人们越来越接受这样一个观点:许多疾病都与环境因子和基因的相互作用有关。这个实验室的研究人员整合了来自各种生物的关键数据(例如基因序列、化合物和比较参考),从而提供了一个有关基因-化合物相互反应的比较透视图。这种“透视图”对理解化合物产生毒性的分子机制至关重要。

  这个透视图还在毒性预测方面起到重要作用。已经有研究证明即使是亲缘关系非常近的物种对接触到的化合物也能产生极不相同的反应。CTD提供的数据将促使人们深入了解这些差异的遗传基础。

  CTD在MDIBL建立,这个项目的主要参与者包括MDIBL的James L Boyer博士和John N. Forrest博士以及Carolyn J. Mattingly博士和Glenn T. Colby等。

 

posted @ 2017-04-21 10:52  nkwy2012  阅读(7325)  评论(0编辑  收藏  举报