一年级一共十二棵树,十二个人种进化树,每人种进化树了几棵列式计算

这个帖子发布于6年零88天前其中嘚信息可能已发生改变或有所发展。

本人是初次涉足分子生物学做噬菌体研究,目前测序了一株噬菌体的基因基因组很小大概有51000个碱基,想做一个噬菌体的进化树bilast一下发现有几株噬菌体的基因和我的噬菌体相似性很高,翻看了相关文献发现文献里的进化树都是用噬菌體中的某一个或两个蛋白质氨基酸的序列做的(并且选择的基因每篇文章都不一样如下图所示
),怎么没有人用全基因组的序列做进化樹这样不是更准确吗?如果用蛋白质做进化树选择什么样基因的蛋白质合适进化树分支点的数字代表什么意思?我是否可以直接拿核苷酸序列进行进化树分析?
如能赐教不胜感激!!!!!!

    不知道邀请谁试试他们

  • 政治敏感、违法虚假信息
}

在介绍软件之前我先简要地叙述一下有关进化树分析的一些方法学问题。

进化树也称种系树英文名叫“Phyligenetic tree”。对于一个完整的进化树分析需要以下几个步骤:

methods)所谓獨立元素法是指进化树的拓扑形状是由序列上的每个碱基/的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时进化树的拓扑形状也就由这些碱基的状态决定了)。而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的进化树枝条的长度代表着進化距离。独立元素法包括最大简约性法(Maximum

⑶ 对进化树进行评估主要采用Bootstraping法。进化树的构建是一个学问题我们所构建出来的进化树只昰对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法那么所构建的进化树就会接近真实的“进化树”。

模拟的进化树需要一种数学方法来对其进行评估不同的算法有不同的适用目标。一般来说最大简约性法适用于符合以下条件的多序列:

i 所要比较的序列的碱基差别小,

ii 对于序列上的每一个碱基有近似相等的变异率

iii 没有过多的颠换/转换的倾向,

iv 所检验的序列的碱基数目较多(大于几芉个碱基);用最大可能性法分析序列则不需以上的诸多条件但是此种方法计算极其耗时。如果分析的序列较多有可能要花上几天的時间才能计算完毕。UPGMAM(Unweighted pair group method with arithmetic mean)假设在进化过程中所有/氨基酸都有相同的变异率也就是存在着一个分子钟。

这种算法得到的进化树相对来说不昰很准确现在已经很少使用。邻位相连法是一个经常被使用的算法它构建的进化树相对准确,而且计算快捷

其缺点是序列上的所有位点都被同等对待,而且所分析的序列的进化距离不能太大。另外需要特别指出的是对于一些特定多序列对象来说可能没有任何一个現存算法非常适合它。最好是我们来发展一个更好的算法来解决它但无疑这是非常难的。我想如果有人能建立这样一个算法的话那他(她)完全可以在Proc.Natl.Acad.Sci.USA.上发一篇高质量的文章。

下面介绍几个软件的使用首先是PHYLIP。其是多个软件的压缩包下载后双击则自动解压。当你解壓后就挥发现PHYLIP的功能极其强大主要包括五个方面的功能软件:

i,和序列数据的分析软件

ii,序列数据转变成距离数据后对距离数据分析的软件。

iii对频率和连续的的软件。

iv把序列的每个碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件

v,按照DOLLO简约性算法对序列进行分析的软件

vi,绘制和修改进化树的软件在此,我主要对前两种功能软件进行说明

我们现在有几个序列如丅:

要对这8个序列进行进化树分析,按照上面的步骤首先用CLUSTALX排列序列,输出格式为 *.PHY:

然后打开软件SEQBOOT,:

D选项无须改变J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute文章上面提到用Bootstraping法对进化树进行评估,所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半剩下的一半序列随机补齐组成一个新的序列。这样一个序列就可以变成了许多序列。一个多序列组也就可以变成许多个多序列组根据某种算法(朂大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。

将生成的许多进化树进行比较按照多數规则(majority-rule)我们就会得到一个最“逼真”的进化树。Jackknife则是另外一种随机选取序列的方法它与Bootstrap法的区别是不将剩下的一半序列补齐,只生荿一个缩短了一半的新序列Permute是另外一种取样方法,其目的与Bootstrap和Jackknife法不同这里不再介绍。R选项让使用者输入republicate的数目所谓republicate就是用Bootstrap法生成的┅个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的republicate当我们设置好条件后,键入Y按回车得到一个文件outfile

Outfile用记事本打开洳下:

打开DNAPARS(最大简约性法)或DNAML(最大可能性法)软件。将刚才生成的outfile文件更名后输入

选项O是让使用者设定一个序列作为outgroup。一般选择一個亲缘关系与所分析序列组很接近的序列作为outgroup(本例子不选outgroup)outgroup选择的好坏将直接影响到最后的进化树的好坏。选项M是输入刚才设置的republicate的數目设置好条件后,键入Y按回车生成两个文件outfile和treefile。

该文件包括了227个进化树Treefile可以用TREEVIEW软件打开同样包含了这227个进化树。

打开CONSENSE软件将刚財生成的treefile文件更名后输入。

我们看出两个树是同样的但在outfile的树上的数字表示该枝条的Bootstrap支持率(除以100.6)。到现在8个序列的进化树分析(朂大简约法)已经完成。

如果要用邻位相连法对这8个序列进行分析的话也首先执行SEQBOOT软件将这8个序列变成100个republicate。然后打开DNADIST软件,把SEQBOOT生成的攵件输入:

选项M键入100生成两个文件outfile和treefile用记事本和TREEVIEW打开后,发现这两个文件都含有100个进化树再将treefile文件更名后输入CONSENSE软件,又得到两个文件outfile囷treefile这就是最后的结果。以上是对DNA序列的分析如果要对蛋白质序列进行分析,PROTDIST、PROTPARS等软件其他软件的用法可以参照PHYLIP的document.。

下面介绍PUZZLE软件咜是用最大可能性的方法来构建进化树的一个软件,并且对树进行bootstrap评估该软件搜寻进化树时用的算法是quartet puzzling,这个算法相对较快但如要分析的序列较多时,也相当耗时另有LINUX版,运行起来相对较快PUZZLE的输入格式为PHYLIP

PHYLO-WIN是LINUX下的一个软件。界面友好极易操作。

编者注:该文在一个word攵件中没有署名,这里写的文章作者是根据word属性中的作者署名 (责任编辑:大汉昆仑王)

}

我要回帖

更多关于 人种进化树 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信