分子生物学笔记 第一章基因的结构 第一节基因和基因组 一、基因(gene) 是合成一种功能蛋白或RNA 分子所必须的全部DNA 序列。 一个典型的真核基因包括 ①编码序列—外显子(exon) ②插入外显子之间的非编码序列—内合子(intron) ③5'-端和3'-端非翻译区(UTR) ④调控序列(可位于上述三种序列中) 绝大多数真核基因是断裂基因(split gene),外显子不连续。 断裂基因:在真核蛋白质编码基因中发现的一种编码序列不连续的间断基因,亦即是在其核苷酸序列中间插入有与氨基酸编码无关的DNA 间隔区,使一个基因分隔成若干个不连续的区段。 基因座位(gene locus):指基因在染色体上的位置。经典的或说是传统的是把 locus 定义为基因,亦即是遗传座位(genetic locus)或染色体座位(chromosomal locus)。现在普遍接受的概念是,能够用某种特殊的方法确定的任何一个染色体位置,或者说染色体的一个区段,都可以叫做基因座位或染色体座位。 重叠基因(overlapping gene):核苷酸编码序列彼此重叠的、编码不同蛋白质的两个或多个基因称为重叠基因,又叫嵌套基因(nested gene)。它最早是在大肠杆菌噬菌体中发现的,后来在真核生物中也发现有此类基因。 标记基因(marker gene):指其染色体座位是已知的,并易于根据编码产物或杂交实验检测其存在的一类独特的基因。标记基因可用作绘制新基因座位的参照点。 二、基因组(genome):泛指一个有生命体、病毒或细胞器的全部遗传物质,在真核生物,基因组是指一套染色体(单倍体)DNA。或对真核生物而言,基因组就是指一个生物体的染色体所包含的全部DNA,通常又称为染色体基因组。 一特定生物体的整套(单倍体)遗传物质的总和。 基因组的大小用全部DNA 的碱基对总数表示。 人基因组3X109(30 亿 bp),共编码约 2 万个基因。 每种真核生物的单倍体基因组中的全部DNA 量称为 C 值,与进化的复杂性并不一致(C-valueParadox)。 人类基因组计划(humangenomeproject,HGP) 基因组学(genomics),结构基因组学(structuralgenomics)和功能基因组学(functionalgenomics)。 蛋白质组(proteome)和蛋白质组学(proteomics) 第二节真核生物基因组 一、真核生物基因组的特点: ①真核基因组DNA 在细胞核内处于以核小体为基本单位的染色体结构中。 ②真核基因组中,编码序列只占整个基因组的很小部分(2~3%)。 二、真核基因组中 DNA 序列的分类 (一)、高度重复序列(重复次数>105...