第八章 基因表达数据分析随着 cDNA微阵列和寡核苷酸芯片(下文没有特别说明时,统称为 DNA微阵列)等高通量检测技术的发展,我们可以从全基因组水平定量或定性检测基因转录产物 mRNA
在本章中,基因表达数据特指基于 DNA微阵列实验得到的反映 mRNA丰度的数据,而不包括基因表达最终产物——蛋白质丰度的数据
由于生物体中的细胞种类繁多,同时基因表达具有时空特异性,因此,基因表达数据与基因组数据相比,要更为复杂,数据量更大,数据的增长速度更快
基因表达数据中蕴含着基因活动的信息,可以反映细胞当前的生理状态,例如细胞是处于正常还是恶化状态、药物对肿瘤细胞是否有效等
对基因表达数据的分析可以获取基因功能和基因表达调控信息,这是生物信息学的重大挑战之一,也是 DNA微阵列能够在生物医学领域中广泛应用的关键原因之一
基因表达数据分析的对象是在不同条件下,全部或部分基因的表达数据所构成的数据矩阵
通过对该数据矩阵的分析,可以回答一些生物学问题,例如,基因的功能是什么
在不同条件或不同细胞类型中,哪些基因的表达存在差异
在特定的条件下,哪些基因的表达发生了显著改变,这些基因受到哪些基因的调节,或者控制哪些基因的表达
哪些基因的表达是细胞状态特异性的,根据它们的行为可以判断细胞的状态(生存、增殖、分化、凋亡、癌变或应激等)等等
对这些问题的回答,结合其它生物学知识和数据有助于阐明基因的表达调控路径和调控网络
揭示基因调控路径和网络是生物学和生物信息学共同关注的目标,是系统生物学 (SystemsBiology)研究的核心内容
目前,对基因表达数据的分析主要是在三个层次上进行: 1 、分析单个基因的表达水平,根据在不同实验条件下,基因表达水平的变化,来判断它的功能,例如,可以根据表达差异的显著性来确定肿瘤分型相关的特异基因
采用的分析方法有统计学中的假设检验等
2、考虑基因组合,将基