生物医学大数据:
SRA:Sequence Read Archive (SRA) makes biological sequence data available to the research community to enhance reproducibility and allow for new discoveries by comparing data sets.
其中的reads是短reads,下机后得到的初级数据,是一次数据库,起到store的作用,该数据库最重要的是反应深度测序的reads counts,通过对reads count的检查可以得知高表达序列是哪些。
GEO:GEO is a public functional genomics data repository supporting MIAME-compliant data submissions. Array- and sequence-based data are accepted. Tools are provided to help users query and download experiments and curated gene expression profiles.
起到对蛋白质表达注释情况的整合作用。
Taxonomy:Taxonomy (general) is the practice and science of classification of things or concepts, including the principles that underlie such classification.
常见搜索Human:txid9606[orgn]
Pubmed:医学文献检索
MeSH:存的是分类的term,这些term用于文献检索
My NCBI
美国数据库更倾向于机器注释,欧洲倾向于人注释。
EBI:欧洲的数据库
Uniprot:提供protein的功能和结构信息,这些注释信息是先自动注释,后手工注释。
Human project:它的巨大作用是提供一个Reference genome,这个参考并不需要在物理上是确凿无误的真正意义上的极点值,它的作用是作为其它基因组的参照系,提供其它基因组可以使用的相对位置。
Ensembl:综合了个体基因的不同实验测得的数据,并且根据一定的生物学原则进行整合和修正。
UCSC:综合了个体基因的不同实验测得的数据,但是只是客观的陈述出来,并不做任何判断。