构建系统进化树的方法步骤

上传人:大米 文档编号:497916744 上传时间:2023-10-13 格式:DOCX 页数:11 大小:19.31KB
返回 下载 相关 举报
构建系统进化树的方法步骤_第1页
第1页 / 共11页
构建系统进化树的方法步骤_第2页
第2页 / 共11页
构建系统进化树的方法步骤_第3页
第3页 / 共11页
构建系统进化树的方法步骤_第4页
第4页 / 共11页
构建系统进化树的方法步骤_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《构建系统进化树的方法步骤》由会员分享,可在线阅读,更多相关《构建系统进化树的方法步骤(11页珍藏版)》请在金锄头文库上搜索。

1、构建系统进化树的方法步骤1. 建树前的准备工作1.1相似序列的获得一一BLASTBLAST是目前常用的数据库搜索程序,它是Basic Local Alignment Search Tool的缩写, 意为“基本局部相似性比对搜索工具”(Altschul et al.,199062;199763)。国际著名 生物信息中心都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列 和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序 列片段。首先登录到提供BLAST服务的常用网站,比如国内的CBI、美国的NCBI、欧洲的EBI和日本 的DDBJ。这些网

2、站提供的BLAST服务在界面上差不多,但所用的程序有所差异。它们都有 一个大的文本框,用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行,以 ”符号开始,后面是序列的名称、说明等,其中“”是必需的,名称及说明等可以是任 意形式,换行之后是序列)粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可 以开始搜索了。如果是DNA序列,一般选择BLASTN搜索DNA数据库。这里以 NCBI 为例。登录 NCBI 主页-点击 BLAST-点击 Nucleotide-nucleotide BLAST (blastn)-在Search文本框中粘贴检测序列-点击BLAST!-点击Form

3、at-得到result of BLASToBLASTN结果如何分析(参数意义):gi|28171832|gb|AY155203.1| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete sequenceScore = 2020 bits (1019), Expect = 0.0Identities = 1382/1497 (92%), Gaps = 8/1497 (0%)Strand = Plus / PlusQuery: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggcccttt

4、cgggggt 60 | | |Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc-ggggt 58Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120| | | | |Sbjct: 59 acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118Score :指的是提交的序列和搜索出的序列之间的分值,越高说明越相似;Expect:比对的期望值。比对越好,e

5、xpect越小,一般在核酸层次的比对,expect小于1e-10, 就比对很好了,多数情况下为0;Identities:提交的序列和参比序列的相似性,如上所指为1497个核苷酸中二者有1382 个相同;Gaps: 一般翻译成空位,指的是对不上的碱基数目;Strand:链的方向,Plus / Minus意味着提交的序列和参比序列是反向互补的,如果是Plus / Plus则二者皆为正向。1.2序列格式:FASTA格式由于EMBL和GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数 据格式。FASTA格式又称为Pearson格式,该种序列格式要求序列的标题行以大于号“”

6、开头,下一行起为具体的序列。一般建议每行的字符数不超过60或80个,以方便程序处理。 多条核酸和蛋白质序列格式即将该格式连续列出即可,如下所示: E.coli1 aaattgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa61 gtcgaacggt aacaggaaga agcttgcttc tttgctgacg agtggcggac AY631071 Jiangella gansuensis YIM 0021 gacgaacgct ggcggcgtgc ttaacacatg caagtcgagc ggaaaggccc tt

7、tcgggggt61 actcgagcgg cgaacgggtg agtaacacgt gggtaacctg ccttcagctc tgggataagc其中的为Clustal X默认的序列输入格式,必不可少。其后可以是种属名称,也可以 是序列在Genbank中的登录号(Accession No.),自编号也可以,不过需要注意名字不能太 长,一般由英文字母和数字组成,开首几个字母最好不要相同,因为有时Clustal X程序只 默认前几位为该序列名称。回车换行后是序列。将检测序列和搜索到的同源序列以FASTA 格式编辑成为一个文本文件(例:C:tempjc.txt),即可导入Clustal X等程

8、序进行比对建 树。2. 构建系统树的相关软件和操作步骤构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。鉴于以上对于 构建系统树的评价,结合本实验室实际情况,以下主要介绍N-J Tree构建的相关软件和操 作步骤。2.1用Clustal X构建N-J系统树的过程(1) 打开Clustal X程序,载入源文件.File-Load sequences- C:tempjc.txt.(2) 序列比对Alignment - Output format options - V Clustal format; CLUSTALW sequence numbers: ONAlignment -

9、 Do complete alignment(Output Guide Tree file, C:tempjc.dnd; Output Alignment file, C:tempjc.aln;) Align waiting等待时间与序列长度、数量以及计算机配置有关。(3) 掐头去尾File-Save Sequence asFormat: O CLUSTALGDE output case: LowerCLUSTALW sequence numbers: ONSave from residue: 39 to 1504 (以前后最短序列为准)Save sequence as: C:tempjc-a

10、.alnOK将开始和末尾处长短不同的序列剪切整齐。这里,因为测序引物不尽相同,所以比对后序列 参差不齐。一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。 剪切后的文件存为ALN格式。(4) File-Load sequences-Replace existing sequences?-Yes- C:tempjc-a.aln 重新载入剪切后的序列。(5) Trees-Output Format OptionsOutput Files : V CLUSTAL format tree V Phylip format tree V Phylip distance matrixBo

11、otstrap labels on: NODECLOSETrees-Exclude positions with gapsTrees-Bootstrap N-J Tree :Random number generator seed(1-1000) : 111Number of bootstrap trails(1-1000): 1000SAVE CLUSTAL TREE AS: C:tempjc-a.njbSAVE PHYLIP TREE AS: C:tempjc-a.njbphbOK waiting等待时间与序列长度、数量以及计算机配置有关。在此过程中,生成进化树文件*.njbphb, 可以

12、用TreeView打开查看。(6) Trees-Draw N-J TreesSAVE CLUSTAL TREE AS: C:tempjc-a.njSAVE PHYLIP TREE AS: C:tempjc-a.njphSAVE DISTANCE MATRIX AS: C:tempjc-a.njphdstOK 此过程中生成的报告文件*.nj比较有用,里面列出了比对序列两两之间的相似度,以及转 换和颠换分别各占多少。(7) TreeViewFile-Open-C:tempjc-a.njbphbTree- phylogram(unrooted, slanted cladogram, Rectangu

13、lar cladogram 多种树型)Tree- Show internal edge labels (Bootstrap value)(显示数值)Tree- Define outgroup f ingroup outgroup f OK(定义外群)Tree- Root with outgroup通常需要对进化树进行编辑,这时首先要Edit-Copy至PowerPoint上,然后Copy至Word 上,再进行图片编辑。如果直接Copy至Word则显示乱码,而进化树不能正确显示。2.2 Mega 建树虽然Clustal X可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Mega因为 操作

14、简单,结果美观,很多研究者选择用它来建树。(1) 首先用Clustal X进行序列比对,剪切后生成C:tempjc-a.aln文件;(同上)(2) 打开BioEdit程序,将目标文件格式转化为FASTA格式,File-Open- C:tempjc-a.aln,File-Save As- C:temp jc-b.fas;(3) 打开Mega程序,转化为mega格式并激活目标文件,File-Convert To MEGA Format- C:temp jc-b.fas f C:temp jc-b.meg,关闭 Text Editor 窗口-。you want to save your change

15、s before closing?-Yes);Click me to activate a data file- C:tempjc-b.meg-OK-(Protein-coding nucleotide sequence data?-No);Phylogeny-Neighbor-Joining(NJ)Distance Options-Models-Nucleotide: Kimura 2-parameter;d: Transitions+Transversions;Include Sites-0Pairwise DeletionTest of Phylogeny-QBootstrap; Replications 1000; Random Seed 64238OK;开始计算一得到结果;(4) Image-Copy to Clipboard-粘贴至 Word 文档进行编辑。此外,Subtree中提供了多个命令可以对生成的进化树进行编辑,Mega窗口左侧提供了很多 快捷键方便使用;View中则给出

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号