多重序列比对及系统发生树的构建 【实验目的】 1、熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识; 2、掌握使用Clustalx进行序列多重比对的操作方法; 3、掌握使用Phylip软件构建系统发生树的操作方法。 【实验原理】 在现代分子进化研究中,根据现有生物基因或物种多样性来重建生物的进化史是一个非常重要的问题。一个可靠的系统发生的推断,将揭示出有关生物进化过程的顺序,有助于我们了解生物进化的历史和进化机制。 对于一个完整的进化树分析需要以下几个步骤:⑴ 要对所分析的多序列目标进行比对(alignment)。 ⑵ 要构建一个进化树(phyligenetic tree)。构建进化树的算法主要分为两类:独立元素法(discrete character methods)和距离依靠法(distance methods)。所谓独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点 ,而 每个酶切位点 的存在与 否 是由几个碱基的状态决定的,也 就 是说 一个序列碱基的状态决定着 它 的酶切位点 状态,当 多个序列进行进化树分析时 ,进化树的拓扑形状也 就 由这 些 碱基的状态决定了)。而 距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝 条 的长 度 代表 着 进化距离。独立元素法包括 最 大 简 约 性法(Maximum Parsimony methods)和最 大 可能性法(Maximum Likelihood methods);距离依靠法包括 除 权 配对法(UPGMAM)和邻 位相 连 法(Neighbor-joining)。⑶ 对进化树进行评 估 ,主要采 用Bootstraping法。进化树的构建是一个统计 学 问题,我们所构建出来的进化树只 是对真 实的进化关系的评 估 或者 模 拟 。如果我们采 用了一个适 当 的方法,那 么 所构建的进化树就 会 接 近 真 实的"进化树"。模 拟 的进化树需要一种数学方法来对其 进行评 估 。不同的算法有不同的适 用目标。一般 来说 ,最 大 简 约 性法适 用于符 合 以下条 件的多序列:i 所要比较 的序列的碱基差 别 小 ,ii 对于序列上的每一个碱基有近 似 相 等 的变 异 率 ,iii 没 有过多的颠 换 /转 换 的倾 向 ,iv 所检 验的序列的碱基数目较 多(大 于几千 个碱基);用最 大 可能性法分析序列则不需以上的诸 多条 件,但 是此 种...