1、KEGG简介
KEGG 数据库于 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前发展为一个综合性数据库,其中最核心的为 KEGG PATHWAY 和 KEGG ORTHOLOGY 数据库。在 KEGG ORTHOLOGY 数据库中,将行使相同功能的基因聚在一起,称为 Ortholog Groups (KO entries),每个 KO 包含多个基因信息,并在一至多个 pathway 中发挥作用。而在 KEGG PATHWAY 数据库中,将生物代谢通路划分为 6 类,分别为:细胞过程(Cellular Processes)、环境信息处理(Environmental Information Processing)、遗传信息处理(Genetic Information Processing)、人类疾病(Human Diseases)、新陈代谢(Metabolism)、生物体系统(Organismal Systems),其中每类又被系统分类为二、三、四层。第二层目前包括有 43 种子 pathway;第三层即为其代谢通路图;第四层为每个代谢通路图的具体注释信息。
KEGG目前含有18个数据库,分为三大类(系统信息、基因组信息、化学信息)
2、KEGG简单探索
首先打开KEGG数据库,你会进入下面这个界面,我们直奔主题,点击KEGG PATHWAY。
点击进去之后,你看到的界面是下面这样的。
点击cellular process,页面迅速的跳到这部分的二级pathway了,这时你可以看到二级通路下面,更细化的通路。
再点击三级分类的通路,就可以找到我们想要的pathway map了。比如点击三级分类pathway map 的“cell cycle”,然后就进入了下面这样的界面。
注意哈,一般默认是人的pathway,如果你像查看其他物种上的pathway,你需要点击下拉三角形,选择你所关心的物种。如下面图中所示哈。
3、KEEGG代谢通路图解读
KEGG pathway中有着大量的通路图,以PI3K-Akt signaling pathway(ko04151)为例,里面包含了大量的蛋白等化合物,以及它们之间相互作用的关系。
总结:pathway 和 GO富集分析结果的解读,应该从生物学意义的角度出发,P value 和 Q value只是个参考而已,那些不显著的通路也值得解读(从功能注释的角度解读,而不是从富集分析的角度解读)。只要结果可以解释,有意义,不用太迷信P value。
4、代谢通路可视化
以下三个图是主要使用 pathview, KEGGREST和KEGGgraph这三个R包绘制的。我是根据例子教程绘制的,具体原理我还没有弄明白。
原图在KEGG的链接是http://www.genome.jp/kegg-bin/show_pathway?map01100
还有其他一些软件:
clusterProfiler:https://www.bioconductor.org/packages/devel/bioc/vignettes/clusterProfiler/inst/doc/clusterProfiler.html
Reactome: http://www.reactome.org/
ReactomePA:https://www.bioconductor.org/packages/release/bioc/vignettes/ReactomePA/inst/doc/ReactomePA.html
5、KEGG API
https://www.kegg.jp/kegg/rest/keggapi.html
命名规范:
1)kegg genes
KEGG基因是所有完整基因组(见发布历史)的基因目录的集合,由公共资源生成,主要是NCBI RefSeq和GenBank。通过KOALA tool进行SSDB计算和KO分配(基因注释)。
kegg genes命名规则:<org>:<gene>,其中<org>是三或四个字母的KEGG生物缩写名,<gene>是基因标识符,通常是NCBI GeneID或INSDC Locus_tag
kegg genes 的来源:
2) Gene Annotation
KEGG基因的注释涉及到KO标识符(K数)的分配。在内部是依据SSDB数据库使用KOALA and GFIT工具。而对外部人员来说是用:
BlastKOALA: automatic KO assignment by BLASTP search
GhostKOALA: automatic KO assignment by GHOSTX search
参考资料
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=235&highlight=KEGG
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=330&highlight=KEGG
http://www.omicshare.com/forum/forum.php?mod=viewthread&tid=270&highlight=KEGG
http://www.omicshare.com/forum/thread-832-1-12.html(GO、PATHWAY富集分析中是否一定需要选择显著富集的通路)
https://github.com/dgrapov/TeachingDemos/blob/master/Demos/Pathway%20Analysis/KEGG%20Pathway%20Enrichment.md
转载自https://mp.weixin.qq.com/s/pqbMXMkuqEXbLf31PTxGZQ