几个进化树相关软件的使用方法

上传人:s9****2 文档编号:493539423 上传时间:2022-09-28 格式:DOC 页数:12 大小:839.50KB
返回 下载 相关 举报
几个进化树相关软件的使用方法_第1页
第1页 / 共12页
几个进化树相关软件的使用方法_第2页
第2页 / 共12页
几个进化树相关软件的使用方法_第3页
第3页 / 共12页
几个进化树相关软件的使用方法_第4页
第4页 / 共12页
几个进化树相关软件的使用方法_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《几个进化树相关软件的使用方法》由会员分享,可在线阅读,更多相关《几个进化树相关软件的使用方法(12页珍藏版)》请在金锄头文库上搜索。

1、几个进化树相关软件的使用方法我在此介绍几个进化树分析及其相关软件的使用和应用范围。这几个软件分别是PHYLIP、PUZZLE、PAUP、TREEVIEW、CLUSTALX和PHYLO-WIN(LINUX)。在介绍软件之前,我先简要地叙述一下有关进化树分析的一些方法学问题。进化树也称种系树,英文名叫“Phyligenetictree;对于一个完整的进化树分析需要以下几个步骤:要对所分析的多序列目标进行排列(Toalignsequence5。做ALIGNMENT的软件很多,最经常使用的有CLUSTALX和CLUSTALW,前者是在WINDOW下的而后者是在DOS下的。要构建一个进化树(Toreco

2、nstrutphyligenetictree)。构建进化树的算法主要分为两类:独立元素法(discretecharactermethods和品E离依靠法(distancemethods。所i胃独立元素法是指进化树的拓扑形状是由序列上的每个碱基/氨基酸的状态决定的(例如:一个序列上可能包含很多的酶切位点,而每个酶切位点的存在与否是由几个碱基的状态决定的,也就是说一个序列碱基的状态决定着它的酶切位点状态,当多个序列进行进化树分析时,进化树的拓扑形状也就由这些碱基的状态决定了)。而距离依靠法是指进化树的拓扑形状由两两序列的进化距离决定的。进化树枝条的长度代表着进化距离。独立元素法包括最大简约性法(M

3、aximumParsimonymethods.)和最大可能性法(MaximumLikelihoodmethods);距离依靠法包括除权配对法(UPGMAM)和邻位相连法(Neighbor-joining)0(3)对进化树进行评估。主要采用Bootstraping法。进化树的构建是一个统计学问题。我们所构建出来的进化树只是对真实的进化关系的评估或者模拟。如果我们采用了一个适当的方法,那么所构建的进化树就会接近真实的“进化树”。模拟的进化树需要一种数学方法来对其进行评估。不同的算法有不同的适用目标。一般来说,最大简约性法适用于符合以下条件的多序列:i所要比较的序列白碱基差别小,ii对于序列上的每一

4、个碱基有近似相等的变异率,iii没有过多的颠换/转换的倾向,iv所检验的序列的碱基数目较多(大于几千个碱基);用最大可能性法分析序列则不需以上的诸多条件,但是此种方法计算极其耗时。如果分析的序列较多,有可能要花上几天的时间才能计算完毕。UPGMAM(Unweightedpairgroupmethodwitharithmeticmean)假设在进化过程中所有核甘酸/氨基酸都有相同的变异率,也就是存在着一个分子钟。这种算法得到的进化树相对来说不是很准确,现在已经很少使用。邻位相连法是一个经常被使用的算法,它构建的进化树相对准确,而且计算快捷。其缺点是序列上的所有位点都被同等对待,而且,所分析的序列

5、的进化距离不能太大。另外,需要特别指出的是对于一些特定多序列对象来说可能没有任何一个现存算法非常适合它。最好是我们来发展一个更好的算法来解决它。但无疑这是非常难的。我想如果有人能建立这样一个算法的话,那他(她)完全可以在Proc.Natl.Acad.Sci.USA上发一篇高质量的文章。卜面介绍几个软件的使用。首先是PHYLIP。其是多个软件的压缩包,下载后双击则自动解压。当你解压后就挥发现PHYLIP的功能极其强大,主要包括五个方面的功能软件:i,DNA和蛋白质序列数据的分析软件。ii,序列数据转变成距离数据后,对距离数据分析的软件。iii,对基因频率和连续的元素分析的软件。iv,把序列的每个

6、碱基/氨基酸独立看待(碱基/氨基酸只有0和1的状态)时,对序列进行分析的软件。v,按照DOLLO简约性算法对序列进行分析的软件。vi,绘制和修改进化树的软件。在此,我主要对前两种功能软件进行说明。我们现在有几个序列如下:Mo3Mo5Mo6Mo7Mo8Mo9Mo12Mo13ATGTATATGTATATGTATATGTATATGTATTCGTACATTACTGCCAGCCACCATGAATCGTACATTACTGCCAGCCACCATGAATCGTACATTACTGCCAGCCACCATGAATCGTACATTACTGCCAGCCACCATGAATCGTACATTACTGCCAGCCACCATGA

7、AATGTATCTCGTACATTACTGCCAGCCACCATGAAATGTATTTCGTACATTACTGCCAGCCACCATGAAATGTATCTCGTACATTACTGCCAGCCACCATGAATATTGCACGGTACCATTATTGTACGGTACCATTATTGTACGGTACCATTATTGTACAGTACCATTATTGTACAGTACCATTATTGTACGGTACCATTATTGTACGGTACCATTATTGTACGGTACCAT要对这8个序列进行进化树分析,按照上面的步骤,首先用CLUSTALX排列序列,输出格式为*.PHY。用记事本打开如下图:文件3编辑(1)搜

8、索帮助GO.|D|2J8501103AfGTftTTTCGfiTCTATTTCGMo6fiTGTATTTCGHo7ATGTATTTCGMoBATGTATTTCG1109ATGTATCTCGNo12ATGTATTTCGMo13ATGTATCTCGTACATTACTCCCAGCCACCATGAATATTGCACGGTACCATTfiCfiTTflCTCCCAGCCACCATGfifiTfiTTCTACGGTACCATTfiCfiTTflCTCCCAGCCACCATGfifiTfiTTCTACGGTACCATTACAiTTflCTCCCAGCCACCftTGAATfiTTGTACAGTACCATTA

9、CATTACTGCCAGCCACCATGAATATTGTACAGTACCATTACATTACTGCCAGCCACCATGAATATTGTACGGTACCftTTACATTACTGCCAGCCACCATGfiATATTGTACGGTACCATTACATTACTGCCAGCCACCATGAATATTGTACGGTACCATJ图中的8和50分别表示8个序列和每个序列有50个碱基。然后,打开软件按路径输入刚才生成的*.PHY文件,并在Randomnumberseed(mustbeodd)的下面输入一个4N+1的数字后,屏幕显示如下:图中的D、J、R、I、O、1、2代表可选择的选项,键入这些字母,程序的

10、条件就会发生改变。D选项无须改变。J选项有三种条件可以选择,分别是Bootstrap、Jackknife和Permute文章上面提到用Bootstraping法对进化树进行评估,所谓Bootstraping法就是从整个序列的碱基(氨基酸)中任意选取一半,剩下的一半序列随机补齐组成一个新的序列。这样,一个序列就可以变成了许多序列。一个多序列组也就可以变成许多个多序列组。根据某种算法(最大简约性法、最大可能性法、除权配对法或邻位相连法)每个多序列组都可以生成一个进化树。将生成的许多进化树进行比较,按照多数规则(majority-rule)我们就会得到一个最“逼真”的进化树。Jackknife则是另

11、外一种随机选取序列的方法。它与Bootstrap法的区别是不将剩下的一半序列补齐,只生成一个缩短了一半的新序列。Permute是另外一种取样方法,其目的与Bootstrap和Jackknife法不同,这里不再介绍。R选项让使用者输入republicate的数目。所谓republicate就是用Bootstrap法生成的一个多序列组。根据多序列中所含的序列的数目的不同可以选取不同的republicate当我们设置好条件后,键入Y接回车。得到一个文件oufileOutfile用记事本打开如下:8H口350AATGTfiTTTGTATTAftCCCCCAAACCCCAATAATTTGGGCCAftC

12、TCTTTT二H口弓ftftTGTftTTTCTftTTAACCCCCAAACCCCAATAATTTGGGTTAftCTCTTTTM06ftfiTGTftTTTGTATTfiACCCCTAATTTGGGTTfiftCTCTTTTNo?ftATGTftTTTCTATTAACCCCCftftftCCCCAATAATTTGGGTTfiftCTCTTTTNoSAATGTATTTGTATTAftCCCCCAAftCCCCAATAftTTTGGGTTfiftCTCTTTTNo9AATGTATTTGTATTAACCCCCftAACGGCAATAATTTGGGTTftftCTCTTTTHo12ftATGTft

13、TTTGTATTAACCCCCAAACCCCAATAATTTGGGTTAftCTCTTTTUo13AATGTftTTTGTATTAACCCCCAAACCCCAATflfiTTTGGGTTAftCTCTTTTS50Mo3TTGTTTAAAACfiTTAAACTITGACGGGATATGGGCAACCCGGGACCAAAT“口5TTGJJTAAfifiCATTftftACTTTGACGGGATATCCCIAACCCGGGACCAAAT“口6TTGTTTAAAACATTAAACTTTGACGGGATATGCGIAACCCGGGACCAAATM口7TTGTTTAAAACATTAAACTTTGACGGG

14、ATATGCGTAACCCGGGACCAAATMoBTTGTTTAAAACATTAAACTTTGACGCGATATGGGTAACCCGGGACCAAATNo9TTGCTTAAAACATTAAACTTTGACGGGATATGGGTAACCCGGGACCAAATI1o12TTGTTTAAAACATTAftftCTTTGACGGGATATGCGTAACCCGGGACCAAATMo13TTGCTTAAAACATTAAACTTTGACGGGATATGGGTAACCCGGGACCAAATSSOI1o3ATGGGTTTTTCGGAAftTTACCTCCCAAGCATfifiATAATTTGGGTACCCTT“口5ATGGGTTTTTCGGAAATTACCTCCCAAGCATAAATAATITGGGTACCCTTMo6ATGGGTTTTTCGGAAATTACCTCCCAAGCATfiAfiTAATTTGGGTACCCTTMo7ATGGGTTTTTCGGAAATTACCTCCCAAGCATAAftTAATTTGCCTACCCTTMoSATGGGTTTTTCGGAAATTACCTCCCAACCATAAATAATTTGGGTACCCTTzloutfile一_Inl刈文件(D编辑口搜索帮助出

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 演讲稿/致辞

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号