小议计算机科学与技术和生物的关系众所周知,如今的我们正身处一个大数据时代,生活是如此,科学界亦如此
近年来分子生物学的不断深入研究大大地推动了生命科学的发展,也造就了生物信息学从无到有,从有到不断发展壮大
生物信息学是计算机与生命科学结合的一个重要体现
2001 年 2 月,人类基因组工程测序的完成,使生物信息学走向了一个高潮
由于 DNA自动测序技术的快速发展,DNA 数据库中的核酸序列公共数据量以每天 106bp 速度增长,生物信息迅速地膨胀成数据的海洋,数以百计的生物学数据库如雨后春笋般迅速出现和成长
原始的生物信息资源挖掘出来后,生命科学工作者面临着严峻的挑战:数以亿计的 ACGT 序列中包涵着什么信息
基因组中的这些信息怎样控制有机体的发育
基因组本身又是怎样进化的
生物与计算机的高级结合正体现于此,人类从此进入了以生物信息学为中心的后基因组时代
毫无疑问,我们正从一个积累数据向解释数据的时代转变,数据量的巨大积累往往蕴含着潜在突破性发现的可能,计算机与生物学的完美结合将是不断探索生命领域的强大工具
生物信息学的主要研究方向是基因组学-蛋白质组学-系统生物学-比较基因组学
具体说来,计算机与生物的结合大致有以下几个方面
首先,是大规模基因组测序中的信息分析
大规模测序是基因组研究的最基本任务,它的每一个环节都与信息分析紧密相关
从测序仪的光密度采样与分析、碱基读出、载体标识与去除、拼接与组装、填补序列间隙、到重复序列标识、读框预测和基因标注的每一步都是紧密依赖基因组信息学的软件和数据库的
基因组测序技术最早可以追溯到 20 世纪 50 年代,早在 1954 年就已经出现了关于早期测序技术的报导,即 Whitfeld 等用化学降解的方法测定多聚核糖核苷酸序列
1977 年 Sanger 等发明的双脱氧核苷酸末端终止法和 Gilbert 等发明的化学降解法,标志着第一