第一章一、基因组1、基因组(genome):生物所具有的携带遗传信息的遗传物质的总和,是指生物细胞中所有的DNA,包括所有的基因和基因间区域。2、基因组学:指以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。基因组学包括3个不同的亚领域结构基因组学(structuralgenomics):以全基因组测序为目标功能基因组学(functionalgenomics):以基因功能鉴定为目标比较基因组学(comparativegenomics)二、基因组序列复杂性1、C值是指一个单倍体基因组中DNA的总量,以基因组的碱基对来表示。每个细胞中以皮克(pg,10-12g)水平表示。C值悖理(矛盾)(C-valueparadox):在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,它们的C值可以相差数10倍乃至上百倍。C值反映了总体趋势上,随着生物结构和功能的复杂性的增加,各分类单元中最小基因组的大小随分类地位的提高而递增。2、序列复杂性单一顺序:基因组中单拷贝的DNA序列重复顺序:基因组中多拷贝的基因序列真核生物基因组DNA组分为非均一性,可分为3种类型:快速复性组分、居间复性组分、缓慢复兴组分三、基因与基因家族1、基因家族:是真核基因组的共同特征,他们来自一个共同的祖先,因基因加倍和趋异,产生了许多在DNA序列上基本一致而略有不同的成员。包括编码RNA的基因和编码蛋白质的基因2、隔裂基因(splitgene):指基因内部被一个或更多不翻译的编码顺序即内含子所隔裂。3、异常结构基因分类重叠基因:编码序列彼此重叠的基因,含有不同蛋白质的编码序列。基因内基因:一个基因的内含子中包含其他基因。反义基因:与已知基因编码序列互补的的负链编码基因,参与基因的表达调控,可以干扰靶基因mRNA转录与翻译。4、假基因:来源于功能基因但已失去活性或者改变原来活性功能的DNA序列.四、基因组特征比较真核生物基因组的特征:复杂性较高的生物基因组结构松弛,在整个基因组范围内分布大量重复顺序(小基因组重复序列较少,大基因组重复序列急剧扩增);含有大量数目不等的线性DNA分子,并且,每个长链DNA都与蛋白质组成染色体结构;含有细胞器基因组(所有真核生物都具有环状的线粒体DNA,植物细胞还含有环状的叶绿体DNA。)原核生物基因组的特征:原核生物基因数目比真核生物少,大小在5Mb以下;原核生物基因组结构更紧凑;(极少重复序列;重复基因的数量远远低于真核生物;不存在内含子,基本都是编码序列,无断裂基因。)第二章一、为何要绘制遗传图与物理图?1)基因组太大,必需分散测序,然后将分散的顺序按原来位置组装,需要图谱进行指导。2)基因组存在大量重复顺序,会干扰排序,因此要高密度基因组图。3)遗传图和物理图各有优缺点,必须相互整合校正。二、基因组测序方法、原理及特点:1.克隆重叠群法(clonecontigmethod,作图法测序):先构建遗传图,再利用几套高度覆盖的大片段基因组文库(BAC、PAC等)获得精细的物理图,选择合适的BAC或PAC克隆测序,利用计算机拼装。BAC内的空洞基本上都可以利用设计引物等手段填补,形成一条完整的BAC序列。然后由相互关联、部分重叠的BAC克隆连成一个大的重叠群(Contig)。优点:通过这种方法得到的基因组数据是最为准确和精细的数据,也是基因组测序的最终目标。缺点:该方法的技术难度较高,尤其大片段基因组文库(BAC)和精细物理图构建是技术性极强的工作;此外,费用相对于鸟枪法要稍高一些,完成整个基因组测序周期也要长些。2.全基因组鸟枪法(whole-genomeshotgunmethod):是随机先将整个基因组打碎成小片段进行测序,最终利用计算机根据序列之间的重叠关系进行排序和组装,并确定它们在基因组中的正确位置。优点:速度快,简单易行,成本较低,可以在较短的时间内通过集中机器和人力的方法获得大量的基因片断。缺点:最终排序结果的拼接组装比较困难,尤其在部分重复序列较高的地方难度较大。此外有许多序列片段难以定位在确切的染色体上,成为游离片断;同时又会有许多地方由于没有足够的覆盖率而形成空缺。这些缺陷最终导致整个基因图...