KEGG 的个人使用经验分享 (neobe110 2010 年 8 月 21 日暑假) 每次上传到百度文库都说相似性太大被变为私有文档,也难怪,之前我有在小木虫、发酵人等处上传。现在上传到百度就是想赚点百度财富以便不至于因没有下载券而对感兴趣的文档干着急却不能下载。所以这次加了点头脚,改动了顺序希望能作为公开文档,毕竟这是我原创的啊! KEGG 的数据库 KEGG,Kyoto encyclopedia of Genes and Genomes ,不多说。KEGG 中的 pathway 是根据相关知识手绘的,这里的手绘的意思可能是指人工以特定的语言格式来确定通路各组件的联系;基因组信息主要是从NCBI 等数据库中得到的,除了有完整的基因序列外,还有没完成的草图;另外 KEGG 中有一个“专有名词”KO(KEGG Orthology),它是蛋白质(酶)的一个分类体系,序列高度相似,并且在同一条通路上有相似功能的蛋白质被归为一组,然后打上 KO(或 K)标签。下面就首先来讲一下 KEGG orthology 。 任找一个代谢通路图,在上方有 pathway meue | payhway entry | Show(Hide) description | 这 3 个选项,点击 pathway entry, 出现了一个页面,这个随时被连接出来的页面相信大家一定再熟悉不过了。在这个页面中的 pathway map 项中点击按钮状的链接 Ortholog table 。就进入了 Ortholog table 如下的页面: 在这个表中,行与物种对应,3 个字母都是相应物中的英文单词缩写,比如has 表示Homo sapiens,mcc 表示Macaca mu latta;列就表示相应的Ortholog 分类,比如K00844 就表示生物体内的己糖激酶hexokinase 这一类序列和功能相似的蛋白质类(酶类)。如上图has 后有3101,3098,3099 这3 个条目,它表示在人类细胞中中存在3 中不同的己糖激酶,它们分别由以上这3 组数字代表的基因所编码,这3 组数字应该是这3 个基因的登录号。空白则表示在该物种中不存在这种酶。 点击K00844 则这一KO 分类信息及成员列表都可显示出来;点击has 则链接到物种(人类)基因组去了;点击P,则显示相应的代谢通路。下面我们点击3101,如下: 如上图,就是我们常见的一个页面,3101 是KEGG 中的基因ID(登录号), H.sapiens表示物种,然后是基因的名称,表达的酶,属于哪个KO 分类以及参与哪些代谢途径;下面还有结构、序列信息等等。所以从 Ortholog table 中可以很容易地知道一张代谢通路上有哪些KO 分类(酶类),并且这些酶类的成员...