KEGG 的数据KEGG 中的pathway 是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI 等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外KEGG 中有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上 KO(或 K)标签
下面就首先来讲一下 KEGG orthology
任找一个代谢通路图,在上方有pathway meue |payhway entry|Show(Hide) description | 这3 个选项,点击 pathway entry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了
在这个页面中的pathwaymap 项中点击按钮状的链接 Ortholog table
就进入了Ortholog table 如下的页面:在这个表中,行与物种对应,3 个字母都是相应物中的英文单词缩写,比如 has 表示 Homo sapiens,mcc 表示 Macaca mulatta;列就表示相应的Ortholog 分类,比如 K00844 就表示生物体内的己糖激酶 hexokinase 这一类序列和功能相似的蛋白质类(酶类)
如上图has 后有3101,3098,3099 这3个条目,它表示在人类细胞中中存在 3 中不同的己糖激酶,它们分别由以上这3组数字代表的基因所编码,这3 组数字应该是这3 个基因的登录号
空白则表示在该物种中不存在这种酶
点击K00844 则这一KO 分类信息及成员列表都可显示出来;点击has则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路
下面我们点击3101,如下:如上图,就是我们常见的一个页面,3101 是KEGG