Rosetta 进行大分子建模 Rhiju Das, David Baker Abstract 近年来的进展使接近原子精度的蛋白质预测和设计成为可能。这些进展来自于高精度高计算效率的全原子能量函数和用于搜索极端崎岖势能面的有效采样策略的开发,这两者都由结构预测和设计的测试结果的反馈所推动。Rosetta 程序中统一的能量和运动框架可广泛用于大分子建模的问题中,从微纤结构预测到RNA 折叠再到设计新的蛋白质界面,都易于进行研究和突出区域的改进设计。该方法可创建具有一定有用功能的新颖分子,并可帮助揭示结构实验的结论。本文还介绍并评价了晶体图像分析,NMR 建模以及低分辨率方法等之间的联系。 Contents 介绍 分子建模的关键 能量函数 构象采样 生物分子建模和设计的统一框架 多种问题中的共同要素 多种问题中的相似困难 对于 RNA 和其他均聚物 分子建模是否可以成为实用工具 X 射线晶体衍射中的相位问题 有限数据的高分辨 NMR 结构 高通量技术 从低分辨率映射到高分辨率模型 得到可信的模型 群体大分子建模 INTRODUCTION 生物分子演化出了令人惊叹的本领,那就是它们可以由化学序列指导折叠成唯一的三级结构。仅由序列来预测这些结构,以及设计具有新功能的分子,是生物物理领域中的传统问题。虽然这些难题的普适的解决方案尚未得到,但近年来已经有了长足的进步。在 2004 年,从头蛋白结构建模Rosetta 算法中所用的理论和方法被文献总结,此后,这个方法完成了若干主链精度达到 2Å 的盲预测。本综述的第一个目的,在于阐述四年来,几个基本方法是如何在蛋白质从头结构预测领域的生物分子建模问题中取得广泛成功的。第二个目的是概述未来四年中,这些方法可能会随着大量分析和操作分子体系的科研工作而愈发成熟。在简单介绍 Rosetta 方法的基本组成后,我们介绍这些理论如何推广到解决实际应用中,包括:loop 建模,考虑主链和侧链柔性的蛋白和配体的docking,RNA 折叠等问题。我们最后强调了这些高分辨方法与实验手段的新联系,以及在广泛使用这些混合计算/实验的方法时所出现的问题。 KEY INGREDIENTS OF MOLECULAR MODELING 大分子结构预测和设计基于这样一个前提:观察到的折叠大分子的构象总处在自由能最低的状态。也就是说,结构预测的根本问题是找到给定序列的生物大分子最低能量的结构,而设计则是要找到使目标结构具有最低能量的序列。这两个建模问题的关键在于合理的精确自由能函数和能够定位所研究生...