系统进化树简介

系统发育进化树/系统树(Phylogenetic tree):描述各种生物类群之间亲缘关系的一种类似树状分支的图形。
系统进化树主要构成

结点(node):每个结点表示一个分类单元OTU(属、种群)(基因家族)。
进化分枝(Clade):两种以上生物(DNA序列)及其祖先组成的树枝。
根:所有分类的共同祖先。
进化分支长度:用数值表示的进化枝的变化程度(遗传距离)

外类群:一个同源物种与其它分析序列相关且具有适当(较远)的亲缘关系
自展支持率:进化树评估的方法,描述了进化树进化分支的支持比例(稳健性)。
进化树评估:自展分析法(BOOTstrap)
一般Bootstrap的值>70,则认为构建的进化树较为可靠。如果Bootstrap的值太低,则有可能进化树的拓扑结构有错误,进化树是不可靠的。

系统树的类型

有根树、无根树

有根树:有一个叫根的特殊节点,用来表示共同的祖先,由该点通过唯一路径产生其他节点,反映了树上物种或基因的时间顺序。
无根树:只是指明了种属的相互关系,没有确认共同祖先或进化途径。即反映分类单元之间的距离而不涉及谁是谁的祖先问题。

系统发育树的构建流程

找到建树目的基因(基因组)进行多序列比对
选择建树方法
建立进化树
进化树评估

建树方法

基于距离的方法:邻接法NJ、非加权分组平均法UPGMA
基于离散特征的方法:最大简约法MP、最大似然法ML

基于距离的方法

UPGMA法

UPGMA法(Unweighted Pair Group Method with Arithmetic Mean,无加权平均对群法)
基本步骤
首先将距离最小的2个OTU聚在一起,其分支结点位于2个OTU间距离的1/2处,并形成一个新的OUT。
计算新的OTU与其他OTU间的平均距离,再找出
其中最小的2个OTU进行聚类;

如此反复,直到所有的OTU都聚到一起,最终得到一个完整的系统发育树。