第五章多序列比对农业与生物学院张利达zhangld@sjtu
cn什么是多序列比对
•3条或以上的氨基酸(核酸)序列比对;•序列所有残基的相对位置保持不变,将不同序列间相同或相似的残基放入同一列,即尽可能将序列间相同或相似残基上下对齐;•对齐的残基在进化上同源
多序列比对的应用•用于描述一组序列之间的相似性关系,寻找保守区域,了解一个基因家族的基本特征
•用于描述一个同源基因之间的亲缘关系的远近,应用到分子进化分析中
多序列比对的渐进比对过程简单过程:1
先对所有的序列进行两两比对并计算它们相似性得分,并根据相似性分值将它们分成若干组2
然后,逐渐地加上较小相关的序列或者序列组合…,直到得到最终比对结果
渐进法多序列比对——ClustalW/X1
对所有序列两两全局比对(Needleman-Wunsch算法),计算得到一个距离矩阵,该矩阵反映每对序列的关系;2
用距离矩阵构建比对指导树;3
根据指导树的分支顺序,关系最近的两序列开始比对,由近至远,逐步添加序列,直到所有序列全部加入为止
ClustalW/X多序列比对步骤1S1AKRSCDS2TKMRSEDS3AKRSDS4TKRSED•两两全局比对,构建序列距离矩阵6组序列两两全局比对S1S2S3S4S1-S250-S38040-S4666660-4条序列两两比对数:(3)(4)/2=6N条序列两两比对数:(N-1)(N)/2ClustalW/X多序列比对步骤1•两两全局比对,构建序列距离矩阵S1S2S3S4S1-S20
4-序列相似性得分转换成序列距离S1S2S3S4S1-S250-S38040-S4666660-ClustalW/X多序列比对步骤2S2S4S1S3•根据序列关系矩阵,构建指导树(guidetree)1
ClustalW/X生成的指导树表明序列间的距离