2009 年计算机辅助药物设计和大分子模拟技术暑期培训班 Discovery Studio Tutorials - 1 - 蛋白质结构预测技术简介 简介 蛋白质结构的解析对其功能的理解至关重要。然而,由于技术手段的限制,利用实验方法(主要为X-ray,NMR)解析蛋白质结构投入大、周期长、风险大。对于某些膜蛋白,只利用现有技术条件,其结构甚至无法解析。另一方面,随着分子生物学技术的成熟及高通量测序技术的发展,越来越多的基因序列可以轻松被找到。这造成了现代蛋白质科学中一个奇怪的现象:蛋白质序列数据的累积量及积累速度远远超过蛋白质结构。这种序列与结构间不平衡的现象极大地限制了我们对蛋白质功能及其相关作用机理的理解。所以我们需要一种能够简单、快速且相对准确的技术来确定蛋白质的空间结构。 蛋白质建模技术可以很好的解决上面的问题。该方法利用信息技术的手段,可以直接从蛋白的一级结构(氨基酸序列)预测蛋白质的高级结构(主要为三级结构)。根据最新一届国际建模大赛(CASP)的分类,目前主要的蛋白质建模方法包括两种:基于模板的建模(Template-based Modeling)和自由建模(Free Modeling)。前者又包括两种方法:同源建模法(Homology Modeling)和“穿线法”(Threading)。后者主要以从头计算法(ab initio)为主。所有的建模方法中,以同源建模法(Homology Modeling)使用最为广泛,预测结果的准确性最大。 同源建模的理论基础为蛋白质三级结构的保守性远远超过一级序列的保守性。因此,人们可以通过使用一个或多个已知结构的蛋白(模板蛋白,template)来构建未知结构蛋白(目标蛋白,target)的空间结构。其主要的步骤包括: 1. 搜索用于建模的template(s) 2. 将 target 与 templates 进行比较 3. 将步骤(2)中的比较信息用于建模 Discovery Studio 为用户提供了一整套利用Homology Modeling 方法自动预测蛋白质空间结构的工具。用户只需要提供蛋白质的氨基酸序列就可以轻松完成模型构建及模型可信度评估的工作。DS 的Homology Modeling 主要基于MODELER 程序。目前 MODELER 已成为使用最为广泛,预测最为准确的同源建模工具之一。其主要的建模步骤包括: 1. 使用序列相似性工具 BLAST 或 PSI-BLAST 搜寻目标序列的模板 2. 使用结构比对方法将模板进行比对,叠合 3. 使用序列比对方法将目标序列与模板结构的序列进行比对 4. 使用MODELLER 产生目标序列的模型 5. 模型的评估 本教...