生物信息学复习题一、名词解释生物信息学,二级数据库,FASTA 序列格式,genbank 序列格式,Entrez,BLAST,查询序列(query),打分矩阵(scoringmatrix),空位(gap),空位罚分,E 值,低复杂度区域,点矩阵(dotmatrix),多序列比对,分子钟,系统发育(phylogeny),进化树的二歧分叉结构,直系同源,旁系同源,外类群,有根树,除权配对算法(UPGMA),邻接法构树,最大简约法构树,最大似然法构树,一致树(consensustree),bootstrap,开放阅读框(ORF),密码子偏性(codonbias),基因预测的从头分析法,结构域(domain),超家族,模体(motif),序列表谱(profile),PAM 矩阵,BLOSUM,PSI-BLAST,RefSeq,PDB数据库,GenPept,折叠子,TrEMBLMMDB,SCOP,PROSITE,GeneOntologyConsortium,表谱(profile)。二、问答题1)生物信息学与计算生物学有什么区别与联系?2)试述生物信息学研究的基本方法。3)试述生物学与生物信息学的相互关系。4)美国国家生物技术信息中心 NCBI)的主要工作是什么?请列举个以上 NCBI 维护的数据库。5)序列的相似性与同源性有什么区别与联系?6)BLAST 套件的 biastnbiastpbiastxtblastn 和 tbiastx 子工具的用途什么?7)简述 BLAST 搜索的算法。8)什么是物种的标记序列?9)什么是多序列比对过程的三个步骤?10)简述构建进化树的步骤。11)简述除权配对法(UPGMA)的算法思想。12)简述邻接法(NJ)的算法思想。13)简述最大简约法(MP)的算法思想。14)简述最大似然法(ML)的算法思想。15)UPGMA 构树法不精确的原因是什么?16)在 MEGA2 软件中,提供了多种碱基替换距离模型,试列举其中 2 种,解释其含义。17)试述 DNA 序列分析的流程及代表性分析工具。18)如何用 BLAST 发现新基因?19)试述 SCOP 蛋白质分类方案。20)试述 SWISS-PROT 中的数据来源。21)TrEMBL 哪两个部分?22)试述 PSI-BLAST 搜索的 5 个步骤。三、操作与计算题1)如何获取访问号为 U49845 的 genbank 文件?解释如下 genbank 文件的LOCUS 行提供的信息:LOCUSSCU498455028bpDNAiinearPLN21-JUN-19992)利用 Entrez 检索系统,对核酸数据搜索,输入如下信息,将获得什么结果:AF114696:AF114714[ACCN]。3)相比使用 BLAST 套件搜索数据库,BLAST2 工具在结果呈现上有什么优点?4)MEGA2 如何将其它多序列比对格式文件转化为 MEGE 格式的多序列比对文件?5)什么简约信息位...