撰稿人:黄英武 (解放军306医院) 过涛(清华大学生物信息学研究所) 审稿人:孙之荣(清华大学生物信息学研究所) 1 概述 2生物信息数据库与查询 2
1 基因和基因组数据库 2
2 蛋白质数据库 2
3 功能数据库 2
4 其它数据库资源 3 序列比对和数据库搜索 3
1 序列两两比对 3
2 多序列比对 4 核酸与蛋白质结构和功能的预测分析 4
1 针对核酸序列的预测方法 4
2 针对蛋白质的预测方法 5 分子进化 6 基因组序列信息分析 6
1 基因组序列分析工具 6
2 人类和鼠类公共物理图谱的使用 6
3 SNPs识别 6
4 全基因组比较 6
5 EST序列应用 7 功能基因组相关信息分析 7
1 大规模基因表达谱分析 7
2 基因组水平蛋白质功能综合预测 参考文献 1 概述 当前人类基因组研究已进入一个重要时期,2000年将获得人类基因组的全部序列,这是基因组研究的转折点和关键时刻,意味着人类基因组的研究将全面进入信息提取和数据分析阶段,即生物信息学发挥重要作用的阶段
到 1999年 12月 15日发布的第 115版为止,GenBank中的 DNA碱基数目已达 46亿 5千万,DNA序列数目达到 535万;其中 EST序列超过 339万条; UniGene的数目已达到 7万个;已有 25个模式生物的完整基因组被测序完成,另外的 70个模式生物基因组正在测序当中;到 2000年 1月 28日为止,人类基因组已有 16%的序列完成测定,另外 37
7%的序列已经初步完成;同时功能基因组和蛋白质组的大量数据已开始涌现
如何分析这些数据,从中获得生物结构、功能的相关信息是基因组研究取得成果的决定性步骤
生物信息学是在此背景下发展起来的综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科
生物信息学是内涵非常丰富的学科,其核心是基因