使用R语言查询某物种所有通路及通路内的基因
使用R语言查询某物种所有通路及通路内的基因,这里使用Y书的clusterProfiler包。
这里以人类为例查询所有通路及通路内的基因:
library(R.utils) R.utils::setOption("clusterProfiler.download.method","auto") hsa_kegg <- clusterProfiler::download_KEGG("hsa")
这里使用的是clusterProfiler包内的download_KEGG函数对人类(hsa)通路信息进行下载(注:这里的R.utils::setOption是为了设置下载方式,可以防止一些warnings)。
运行以上代码后会产生以下结果,hsa_kegg是一个列表,里面包含KEGGPATHID2EXTID和KEGGPATHID2NAME,其中每个的内容均为数据框格式。
分别对其进行查看:
其中KEGGPATHID2EXTID的内容为两列的数据框,第一列是KEGG pathway ID,第二列为该pathway内对应基因的ID。
而KEGGPATHID2NAME也是一个两列的数据框,第一列也是KEGG pathway ID,第二列则是该pathway的name。
如此就可以获得人类全部的KEGG pathway ID和pathway name,以及每个pathway内所包含的基因。