生物信息学题库 一、名词解释 1、生物信息学:生物分子信息的获取、存贮、分析和利用;以数学为基础,应用计算机技术,研究生物学数据的科学
2、相似性(similarity):相似性是指序列比对过程中用来描述检测序列和目标序列之间相同 DNA碱基或氨基酸残基顺序所占比例的高低
3、同源性(homology):生物进化过程中源于同一祖先的分支之间的关系
4、BLAST(Basic Local Alignment Search Tool):基本局部比对搜索工具,用于相似性搜索的工具,对需要进行检索的序列与数据库中的每个序列做相似性比较
5、HMM 隐马尔可夫模型:是蛋白质结构域家族序列的一种严格的统计模型,包括序列的匹配,插入和缺失状态,并根据每种状态的概率分布和状态间的相互转换来生成蛋白质序列
6、一级数据库:一级数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释(投稿文章首先要将核苷 酸序列或蛋白质序列提 交 到 相应的数据库中) 7、二 级数据库:对原始生物分子数据进行整理、分类的结果 ,是在 一级数据库、实验数据和理论 分析的基础上 针 对特 定 的应用目标而 建 立 的
8、GenBank: 是具有 目录 和生物学注释的核酸序列综 合 公 共 数据库,由 NCBI 构建 和维 护
9、EMBL: EMBL 实验室 : 欧 洲 分子生物学实验室
EMBL 数据库: 是非 盈 利性学术组 织 EMBL 建 立 的综 合 性数据库,EMBL 核酸数据库是欧 洲 最 重 要的核酸序列数据库,它 定 期 地 与美 国 的 GenBank、日 本的 DDBJ 数据库中的数 据进行交 换,并同步 更 新
10、DDBJ: 日 本核酸序列数据库,是亚 洲 唯 一的核酸序列数据库
11、Entrez:是由 NCBI 主 持 的一个数据库检索系统,