电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

第三章序列比对VIP免费

第三章序列比对_第1页
1/45
第三章序列比对_第2页
2/45
第三章序列比对_第3页
3/45
第三章序列比对第一节引言双序列比对的目的:同源物鉴定,功能预测基本假设:1)所有的生物都起源于同一个祖先(物种间序列存在同源关系,同源序列功能往往是相似的)2)序列不是随机产生,而是在进化上不断发生着演变(同源的序列存在高度相似性)3)序列的相似性可以判断序列的同源性,进而可以利用同源物功能的相似性来进行推断序列比对的分类:双序列比对,多序列比对多序列的目的:用于比较基因组研究1)用于描述一组序列(基因家族)之间的相似性关系,以便了解一个基因家族的基本特征,寻找motif,保守区域等。2)可构建HMM模型,搜索更多的同源序列,Pfam,prints,prosite,interPro等3)分析结构用于构建进化树•如果两个序列有一个共同的进化祖先,那么它们是同源的。这里不存在同源性的程度问题。这两条序列之间要么是同源的,要么是不同源的同源性(homology)第二节序列比对的基本概念相似性(similarity)•相似性是指序列比对过程中用来描述检测序列和目标序列之间相同DNA碱基或氨基酸残基顺序所占比例的高低。•当相似程度高于50%时,比较容易推测检测序列和目标序列可能是同源序列;而当相似性程度低于20%时,就难以确定是否具有同源性。直系同源和旁系同源直系同源(orthology)是指不同物种内的同源序列,它们来源于物种形成时的共同祖先基因。旁系同源(paralogy)是指同一物种中,由于基因的复制而产生的几个同源基因。直系同源和旁系同源的图示:1)编辑距离:两条序列对应位置上不同字符的个数2)相似性得分:两条序列对应位置上相同字符的个数相似分数越高,序列越相似,编辑距离越小,序列越相似两条序列长度不一致时:空格(Gap)相似性分数的计算编辑距离(editdistance)相似性得分打分规则就是后面的打分矩阵第三节打分矩阵(替换记分矩阵)•插入和缺失突变:序列比对采用空格(Gap)来处理•替换突变:替换计分矩阵即打分矩阵•(1)核酸打分矩阵设DNA序列所用的字母表为={A,C,G,T}a.等价矩阵(unitarymatrix)b.BLAST矩阵c.转换-颠换矩阵(transition-transversionmatrix)(嘌呤:腺嘌呤A,鸟嘌呤G;嘧啶:胞嘧啶C,胸腺嘧啶T)AATTCCGGAA11000000TT00110000CC00001100GG00000011AATTCCGGAA55-4-4-4-4-4-4TT-4-455-4-4-4-4CC-4-4-4-455-4-4GG-4-4-4-4-4-455AATTCCGGAA11-5-5-5-5-1-1TT-5-511-1-1-5-5CC-5-5-1-111-5-5GG-1-1-5-5-5-511表3.1等价矩阵表表3.3转移矩阵表3.2BLAST矩阵(2)蛋白质打分矩阵•(i)等价矩阵•(ii)遗传密码矩阵(geneticcodematrix,GCM)•(iii)疏水性矩阵(hydrophobicmatrix)•(iv)PAM矩阵(pointacceptedmatrix,PAM)•(v)BLOSUM矩阵(BLOckSUbstitutionMatrix,BLOSUM)jijiRij01其中Rij代表打分矩阵元素i、j分别代表字母表第i和第j个字符。•遗传密码矩阵遗传密码矩阵通过计算一个氨基酸变成另一个氨基酸所需的密码子变化的数目而得到。通常为1或2,只有Met到Tyr为3。•遗传密码矩阵GCM矩阵疏水矩阵RKDEBZSNQGXTHACMPVLIYFWR1010998866655555433333210K1010998866655555433333210D9910108876665555544433321E9910108876665555544433321B8888101088887777666555443Z8888101088887777666555443S667788101010109999887777664N666688101010109999888777664Q666688101010109999888777664G556688101010109999888877665X555577999910101010998888775T555577999910101010998888775H555577999910101010999888775A555577999910101010999888775C4455668888999910109999885M334466888899991010101099887P33446678888899910101099987V3344557778888891010101010987L33335577778888999101010998I33335577778888999101010998Y2233446666777788999910108F1122446666777788889910109W001133444555556777888910PAM&BLOSOM•这类矩阵列出同源蛋白质在进化过程中氨基酸变化的可能性(统计学inference)是基于进化原理的依据,更科学PAM矩阵(pointacceptedmutaion)•基于氨基酸进化的点突变模型如果两种氨基酸替换频繁,说明自然界接受这种替换,那么这对氨基酸替换得分就高PAM矩阵的制作步骤•构建序列相似(大...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

第三章序列比对

您可能关注的文档

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部