38、生物数据库
核酸数据库:一级:NCBI---NIH EMBL---ENA DDBJ---NIG (共同组成INSDC) ENsemble JCVI(宏基因组,HMP: Human Microbiome Project)等
二级:wormBase FlyBase Unigene等
蛋白数据库:
一级:蛋白序列数据库
Swisspro(人工注释的蛋白序列数据库)
TREMBL(Translation form EMBL 计算机注释的蛋白序列数据库)
PIR(Protein information Resource 支持基因组学,蛋白组学和系统生物学研究)
###共同组成联合蛋白序列数据库(Uniprot: Universal Protein Rsouce)三个层次的数据库http://www.uniprot.org/
UniParc:收录其所有子库的蛋白序列,量大,粗糙
Uniref: :收录其几个主要数据库,并将重复序列去除
UniProtKB:有详细的注释并与其余数据库有链接,分为UniProtKB/Swiss-Prot UniProtKB/TrEMBL
一级:蛋白结构数据库(PDB,Protein Data Bank),共蛋白结构
世界上唯一生物大分子3D结构数据库。大分子除了蛋白质以外还有核算以及两者的复合物。数据库分为四级,一级结构primary structure:氨基酸序列 ;二级结构Secondary structure :周期性的结构构想,α螺旋,β折叠;三级结构Tertiary structure:整条多肽链的空间结构,3D结构;四级结构Quaternary structure:几个蛋白质分子(亚基)形成的复合体,如四聚体等。http://www.rcsb.org/pdb/home/home.do 例子:3H6X JSmol可视化软件
二级:Pfam数据库http://pfam.xfam.org/
是一个蛋白质结构域家族集合,目前有16712个蛋白质家族。蛋白质有一个或者多个功能区域组成,这些功能区域通常称为结构域。