蛋白质组学的诞生和发展蛋白质组学的诞生和发展,离不开多学科和技术的逐渐交叉融合。这些学科技术包括(但不限于)基因组学、生物化学、分析化学、自动化、基于电磁场的精密质谱仪、信号处理、数理统计和计算机科学。近年来,分子医学、大数据技术和人工智能的发展,进一步加速推动了蛋白质组学的成长,使之在精准医疗领域展示出越来越大的应用潜力。01蛋白质组学的华丽诞生1994年,当27岁的博士研究生马克·威尔金斯(MarcWilkins)在地广人稀的澳大利亚尝试把蛋白质(protein)和基因组(genome)拼成一个新的英语单词蛋白质组(proteome),用以描述基因组编码的所有蛋白质,并将这一单词放在他的博士毕业论文中时,他不会想到,3年后,瑞士苏黎世联邦理工大学的皮特?詹姆斯(PeterJames)在他发表于剑桥大学《生物物理学》季刊的一篇53页的长文中借用了这个概念,并首次提出蛋白质组学(proteomics)一词,系统总结了当时已发表的对生物体内所有蛋白质种类的研究以及该类研究的进展。蛋白质组学不是凭空诞生的一个新学科,而是基于一系列蛋白质的生物化学研究和多肽质谱的研究衍生发展而来的,所有这些相关学科的研究都被串起来,成为这一新学科的基石。威尔金斯更不会想到蛋白质组学会受到如此广泛的关注。1997年,人类基因组计划进行得如火如荼,2001年,《科学》(Science)杂志和《自然》(Nature)杂志分别出版专刊,报道了人类基因组计划草图的完成,兴奋地宣告解读了人类生命的编码。生命科学的中心法则清楚地表明,基因只是遗传编码,在生命活动中真正发挥作用的主要是蛋白质。因此,在《科学》杂志报道人类基因组计划完成的专刊上,华盛顿大学的斯坦利·菲尔茨(StanleyFields)预言蛋白质组学将很快取代基因组学成为生命科学研究的焦点;《自然》杂志的专刊则在显著版面报道了人类蛋白质组学组织(HUPO)的成立,并宣告生命科学正式进入蛋白质组学时代。因为人类基因组计划的巨大成功,蛋白质组学在诞生之初,光环熠熠,世界各国对蛋白质组学予以大量投入,工业界也热情洋溢,不可谓不华丽。现在,回顾蛋白质组学的华丽诞生,我们感情复杂。一方面,基因组学的巨大成功让全世界认识到蛋白质组学毋庸置疑的重要性;另一方面,蛋白质组学直到今天也还没有完全摆脱基因组学的巨大成功映射出的阴影带来的困扰。例如,在相当长一段时间内(直到今天仍然存在),蛋白质组学的别名是“功能基因组学”,因而其常常被列为基因组学的一部分而存在。02基因组学巨大成功背后的阴影人类基因组计划是将基因按照染色体的分布承包给各个研究团队,协同开发技术,分别测序,然后拼装成全基因组。这个化整为零、逐个击破的简单思路取得的成功,是迄今为止全世界不同国家的科学家互相协作、进行超大项目研究的成功典范。早期参与人类蛋白质组计划的研究人员萧规曹随,选择了同样的思路,将蛋白质组按照染色体分组,然后分配给世界各国的参与团队。后来的数据表明,这个复制和迎合基因组学的思路在蛋白质组学领域并未获得同行的一致认可,也没有取得其他生命科学领域的认可。基于染色体的蛋白质组研究确实取得了不少成果,但与巨大的资金和热情投入而急速鼓吹起来的期望值相比,这些成果微小得几乎不能被人们看到。这一段至今尚未完全结束的历程,极大地消费了人们对蛋白质组学的期望和热情。蛋白质组学的华丽诞生在其第一个10年感受到了全球各界的热情,出现了一段时间繁荣的景象:学术界和工业界的大量投入,专业杂志接二连三地涌现,影响因子逐年升高。今天,当我们拥有了高精度质谱仪和比较完善的算法后,回顾历史,我们不得不汗颜地承认:当时很多蛋白质组学研究所产生的数据信息量是非常低的,有些甚至是经不起时间考验的。2014年,《自然》杂志仓促地发表了两篇号称是完成了人类蛋白质组草图的论文,认为其代表了当时蛋白质组学的最好研究。这两项研究在若干种不同人缘样本中对超过17000个蛋白质进行了鉴定,给观望蛋白质组学的大众打了两针兴奋剂。但是后来,蛋白质组研究领域的多位同行对这两篇论文中所使用的数据分析方法提出了质疑,并证明其中有些数据是错误的,从而引发了...