发那个太丢人

导航

 

1、KEGG简介

KEGG 数据库于 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前发展为一个综合性数据库,其中最核心的为 KEGG PATHWAYKEGG ORTHOLOGY 数据库。在 KEGG ORTHOLOGY 数据库中,将行使相同功能的基因聚在一起,称为 Ortholog Groups (KO entries),每个 KO 包含多个基因信息,并在一至多个 pathway 中发挥作用。而在 KEGG PATHWAY 数据库中,将生物代谢通路划分为 6 类,分别为:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems),其中每类又被系统分类为二、三、四层。第二层目前包括有 43 种子 pathway;第三层即为其代谢通路图;第四层为每个代谢通路图的具体注释信息。

KEGG目前含有18个数据库,分为三大类(系统信息、基因组信息、化学信息)

2、KEGG简单探索

首先打开KEGG数据库,你会进入下面这个界面,我们直奔主题,点击KEGG PATHWAY。 

点击进去之后,你看到的界面是下面这样的。 

 
点击cellular process,页面迅速的跳到这部分的二级pathway了,这时你可以看到二级通路下面,更细化的通路。 

再点击三级分类的通路,就可以找到我们想要的pathway map了。比如点击三级分类pathway map 的“cell cycle”,然后就进入了下面这样的界面。 

 

 注意哈,一般默认是人的pathway,如果你像查看其他物种上的pathway,你需要点击下拉三角形,选择你所关心的物种。如下面图中所示哈。

 

3、KEEGG代谢通路图解读

KEGG pathway中有着大量的通路图,以PI3K-Akt signaling pathway(ko04151)为例,里面包含了大量的蛋白等化合物,以及它们之间相互作用的关系。 

 总结:pathway 和 GO富集分析结果的解读,应该从生物学意义的角度出发,P value 和 Q value只是个参考而已,那些不显著的通路也值得解读(从功能注释的角度解读,而不是从富集分析的角度解读)。只要结果可以解释,有意义,不用太迷信P value。

4、代谢通路可视化

以下三个图是主要使用 pathview, KEGGREST和KEGGgraph这三个R包绘制的。我是根据例子教程绘制的,具体原理我还没有弄明白。 

 

原图在KEGG的链接是http://www.genome.jp/kegg-bin/show_pathway?map01100

还有其他一些软件: 
clusterProfiler:https://www.bioconductor.org/packages/devel/bioc/vignettes/clusterProfiler/inst/doc/clusterProfiler.html 
Reactome: http://www.reactome.org/ 
ReactomePA:https://www.bioconductor.org/packages/release/bioc/vignettes/ReactomePA/inst/doc/ReactomePA.html

5、KEGG API

https://www.kegg.jp/kegg/rest/keggapi.html

命名规范:

1)kegg genes

KEGG基因是所有完整基因组(见发布历史)的基因目录的集合,由公共资源生成,主要是NCBI RefSeq和GenBank。通过KOALA tool进行SSDB计算和KO分配(基因注释)。

kegg genes命名规则:<org>:<gene>,其中<org>是三或四个字母的KEGG生物缩写名<gene>是基因标识符通常是NCBI GeneID或INSDC Locus_tag

kegg genes 的来源:

2) Gene Annotation

KEGG基因的注释涉及到KO标识符(K数)的分配。在内部是依据SSDB数据库使用KOALA and GFIT工具。而对外部人员来说是用:

BlastKOALA: automatic KO assignment by BLASTP search

GhostKOALA: automatic KO assignment by GHOSTX search

参考资料

http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=235&highlight=KEGG 
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=330&highlight=KEGG 
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=270&highlight=KEGG 
http://www.omicshare.com/forum/thread-832-1-12.html(GO、PATHWAY富集分析中是否一定需要选择显著富集的通路) 
https://github.com/dgrapov/TeachingDemos/blob/master/Demos/Pathway%20Analysis/KEGG%20Pathway%20Enrichment.md

转载自https://mp.weixin.qq.com/s/pqbMXMkuqEXbLf31PTxGZQ

 

 

posted on 2018-09-12 11:13  发那个太丢人  阅读(8731)  评论(0编辑  收藏  举报