生物信息学,一、名词解释:1、生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础,应用计算机技术,研究生物学数据的科学。2、相似性(similarity):两个序列(核酸、蛋白质)间的相关性。3、同源性(homology):生物进化过程中源于同一祖先的分支之间的关系。4、同一性(identity):两个序列(核酸、蛋白质)间未发生变异序列的关系。5、序列比对(alignment):为确定两个或多个序列之间的相似性以至于同源性,而将它们按照一定的规律排列。6、生物数据库检索(databasequery,数据库查询):对序列、结构以及各种二次数据库中的注释信息进行关键词匹配查找。7、生物数据库搜索(databasesearch):通过特定序列相似性比对算法,找出核酸或蛋白质序列数据库中与待检序列具有一定程度相似性的序列。二、简答题:1、分子生物学的三大核心数据库是什么?它们各有何特点?GenBank核酸序列数据库;SWISS-PROT蛋白质序列数据库;PDB生物大分子结构数据库;2、简述生物信息学的发生和发展。20世纪50年代,生物信息学开始孕育;20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来;20世纪70年代,生物信息学的真正开端;20世纪70年代到80年代初期,出现了一系列著名的序列比较方法和生物信息分析方;20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库;20世纪90年代后,HGP促进生物信息学的迅速发展。3、生物信息学的主要方法和技术是什么?数学统计方法;动态规划方法;机器学习与模式识别技术;数据库技术及数据挖掘;人工神经网络技术;专家系统;分子模型化技术;量子力学和分子力学计算;生物分子的计算机模拟;因特网(Internet)技术4、常见的DNA测序方法有哪些?各有何技术特点和优缺点?Maxam-GilbertDNA化学降解法:优点:可测完全未知序列及CG富含区;缺点:操作繁琐;Sanger双脱氧链终止法:优点:简便,可测较长片段;缺点:需已知部分序列或加接头;焦磷酸测序:优点:廉价、高通量;缺点:一次测序片段短。5、分子生物学数据库有哪些类型?各有何特点?基因组数据库:基因组测序核酸序列数据库:核酸序列测定一次数据库:蛋白质序列数据库:蛋白质序列测定。生物大分子(蛋白质)三维结构数据库:X-衍射和核磁共振特点:数量少,容量大,更新快二次数据库:上述四类数据库和文献资料为基础构建特点:数量多,容量小,更新慢6、简述NCBIEntrez系统的功能。高级检索系统;查找核酸、蛋白、文献、结构、基因组序列、大分子三维结构、突变数据、探针序列、单核苷酸多态性等数据。7、简述NCBIBLAST的功能和种类。序列相似性比对工具;对核酸:普通blastn,对高度相似序列megablast;对蛋白质:普通blastp,对保守域rpsblast;对人工翻译序列:核酸翻译序列对蛋白质序列blastx,蛋白质对翻译序列tblastn,核酸翻译序列对翻译序列tblastx;其它:基因组blast,基因表达序列搜索GEOblast,序列两两比对……三、论述题:1、什么是生物信息学?生物信息学有哪些主要应用领域?生物分子信息的获取、存贮、分析和利用;以数学为基础,应用计算机技术,研究生物学数据的科学。生物分子数据的收集与管理;数据库搜索及序列比较;基因组序列分析;基因表达数据的分析与处理;蛋白质结构预测。2、生物信息学在医药领域有什么应用?辅助诊断(遗传病,HLA分型);研究药物作用机制,辅助新药物开发和制造。3、人类基因组计划中主要使用的那些生物信息学手段?它们对人类基因组计划发挥了哪些重大作用?单一测序结果判读;contig和chromosome拼接;识别基因区及其调控区;寻找基因相互作用的时空关系;4、试述蛋白质二级结构预测的主要策略和方法。策略:目标:判断每一段中心的残基是否处于a螺旋、b折叠、b转角(或其它状态)之一的二级结构态,即三态。a、理论分析法(从头计算法):通过理论计算(分子力学、分子动力学等)进行结构预测。优点:不需要经验数据,由一级结构推测高级结构缺点:天然和未折叠蛋白间能级差很小(kcal/mol);蛋白质可能的构想空间庞大,针对蛋白质折叠的计算量巨大;计算模型中力场参数不准确。b、统计方法:对已...