系统发育树构建教程(PHYLIP).doc

资源描述

《系统发育树构建教程(PHYLIP).doc》由会员分享，可在线阅读，更多相关《系统发育树构建教程(PHYLIP).doc（5页珍藏版）》请在金锄头文库上搜索。

1、系统发育树构建教程（PHYLIP）PHYLIP网址： http:/evolution.genetics.washington.edu/phylip.html（一）序列的前期准备1 用ENTREZ或SRS搜索同源DNA/蛋白质序列 (same sequence in different organisms)2 用CLUSTALX进行多条序列比对，在output format option选定PHY格式,构建进化树需要这个phy文件。Figure 4.1 用clustalx进行多条序列比对3 解压缩phylip-3.68.exe，得到三个文件夹，doc文件夹里是关于所有PHYLIP子程序的使用说明

2、，exe文件夹里是直接可以使用的各个子程序，src文件夹里是所有程序的源文件。4 打开exe文件夹，双击SEQBOOTt子程序（SEQBOOT是一个利用bootstrap方法产生伪样本的程序），输入刚刚生成的phy文件的路径，点击enter。5 所有PHYLIP程序默认的输入文件名为infile, 输出文件名为outfile。如果在exe文件夹里找不到默认的输入文件，会提示cant find input file “infile”。Figure 4.2 seqboot程序起始界面6 进入程序参数选择页面（Figure 4.3）。第一列中的D、J、%、B、R、W、C、S等代表可选的参数。想改变哪

3、个参数，就键入此参数对应的字母，并点击回车键，对应参数将会发生改变。当我们设置好所有参数后，（这里我们可以不做任何修改），键入Y，按回车。此时程序询问“random numbe r seed? ”，这是询问生成随机数的种子是多少，输入一个4N+1的数，点击回车程序开始运行，输出结果到文件outfile，保存在当前文件夹里。.Figure 4.3 seqboot程序参数选择页面主要参数解释：D: 数据类型，有Molecular sequence、discrete morphology、restriction sites和gene frequencies4个选项。J: 伪样本产生方法，有Boots

4、trap, Jackknife, Permute和rewrite4个选项。B: 自举法窗口大小选择，可任意给定一个整数。R: 产生伪样本的数目。W：输入文件为字符还是权重。S: 输出字符数据还是权重。Figure 4.4 seqboot程序运行过程页面程序默认产生100个伪样本，点击回车关闭seqboot程序后，将outfile更名为seqb, 用写字板打开seqb，可以看到里面是100套多条序列比对结果。（Figure 4.5）Figure 4.5 seqboot运行后输出文件内容（二）最大简约法建树（Maximum Parsimony）1. 打开DNAPARS（PROTPARS，如果序列是

5、蛋白质），将刚才生成的seqb文件名输入。（Figure 4.6）如果上一步输出的outfile文件你忘了更名，将会有警告，询问你如何处理原来的outfile，是替换，还是在原文件后面续写，或结果输出到另一个文件或退出程序。Figure 4.6 dnapars程序起始页面2.改M选项为分析multiple data sets(多个数据，Figure 4.7），其它参数不变，运行将生成两个文件outfile和outtree，将outfile更名为mpfile，将outtree更名为mptree。用写字板打开mpfile（Figure 4.8），用TREEVIEW打开mptree(Figure 4

6、.9)后，可以看到这两个文件都含有100个进化树。Figure 4.7 dnapars程序参数选择页面主要参数解释：U:是否自动寻找自佳树，还是利用使用者所提供的树S: 寻找最佳树的搜寻方式，more thorough或 less thoroughV: 保存多少个树 number of trees to saveJ: 是否更改输入序列的次序，如果选是，会要求输入一个种子，4N+1的数，然后询问打乱次数，随意给一个数，不要太大，以免运行时间过长。O:外群位置，默认不设外群，可以更改为任意一条序列。N:转移和颠换是否全部计算在内。W:位点之间是否权重不同M:是否分析多个数据。由于我们第一步seqb

7、oot产生了100个伪样本，每一步都要更改这个选项。Figure 4.8 outfile（更名为mpfile）用写字板打开Figure 4.9 outtree（更名为mptree）用treeview打开3. 打开CONSENSE（将多个伪样本建成的不同树，根据majority原则，得出一致树）软件，将刚才生成的mptree文件输入。生成两个文件outfile和outtree。Outfile可用记事本打开，outtree可用TREEVIEW打开。将两个文件更名为cmpfile和cmptree，这就是我们采用MP方法，并使用bootstrap检验，最后得到的最优树。（三）最大似然法建树(Maxim

8、um Likelihood )1 打开DNAML(PROTML)软件。将刚才生成的seqb文件输入，更改M选项为分析多个数据，生成两个文件outfile和outtree。将outfile更名为mlfile，将outtree更名为mltree。用记事本和TREEVIEW分别打开，可以看到这两个文件都含有100个进化树。2 打开CONSENSE软件，将刚才生成的mltree文件输入，生成两个文件outfile和outtree。Outfile可用记事本打开，Outtree可用TREEVIEW打开。将两个文件更名为cmlfile和cmltree.。这是我们采用ML方法，并使用bootstrap检验，得

9、到的最优树。（四）距离法建树(Distance Method)1 打开DNADIST(PROTDIST)软件，将刚才生成的seqb文件输入，更改M选项为分析多个数据，运行后生成文件outfile。该文件包含了与输入文件相同的100个replicate，只不过每个伪样本是以两两序列的进化距离来表示，将outfile改名为distfile。（Figure 4.10）Figure 4.10 用DNADIST程序计算出来的序列两两之间的距离2 执行NEIGHBOR软件，这个软件包括了NJ和UPGMA两种建树方法。将上一步生成的distfile输入，更改N，选择建树方法，更改M选项为分析多个数据，生成两

10、个文件outfile和outtree。将其分别更名为njfile/upgmafile和njtree/upgmatree。用记事本和TREEVIEW打开后，可以看到这两个文件都含有100个进化树。3 再将njtree/upgmatree文件输入CONSENSE软件，得到两个文件outfile和outtree。Outfile可用记事本打开，Outtree可用TREEVIEW打开。将两个文件更名为cnjfile/cupgmafile和cnjtree/cupgmatree. 这是我们采用NJ/UPGMA方法，并使用bootstrap检验，得到的最优树。4 执行FITCH软件，将distfile输入，更改M选项为分析多个数据，生成两个文件outfile和outtree。将其分别更名为fmfile和fmtree。用记事本和TREEVIEW打开后，可以看到这两个文件都含有100个进化树。5 再将fmtree文件输入CONSENSE软件，得到两个文件outfile和outtree。Outfile可用记事本打开，Outtree可用TREEVIEW打开。将两个文件更名为cfmfile和cfmtree. 这是我们采用FM方法，并使用bootstrap检验，得到的最优树。1

展开阅读全文

系统发育树构建教程(PHYLIP).doc

最新文档