构建系统进化树的方法步骤

上传人:汽*** 文档编号:498456725 上传时间:2023-03-10 格式:DOCX 页数:10 大小:20.84KB
返回 下载 相关 举报
构建系统进化树的方法步骤_第1页
第1页 / 共10页
构建系统进化树的方法步骤_第2页
第2页 / 共10页
构建系统进化树的方法步骤_第3页
第3页 / 共10页
构建系统进化树的方法步骤_第4页
第4页 / 共10页
构建系统进化树的方法步骤_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《构建系统进化树的方法步骤》由会员分享,可在线阅读,更多相关《构建系统进化树的方法步骤(10页珍藏版)》请在金锄头文库上搜索。

1、构建系统进化树的方法步骤1 .建树前的准备工作1.1 相似序列的获得一一BLASTBLAST是目前常用的数据库搜索程序,它是Basic Local Alignment Search Tool的缩写,意为“基本局部相似性比对搜索工具”(Altschul et al.,199062;199763)。国际著名生物信息中心都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为内核向两端延伸,以找出尽可能长的相似序列片段。首先登录到提供 BLAST服务的常用网站,比如国内的CBI、美国的NCBk欧洲的EBI和日本的DDBJ这些网站提供的

2、BLAST服务在界面上差不多,但所用的程序有所差异。它们都有 一个大的文本框,用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行,以“”符号开始,后面是序列的名称、 说明等,其中“”是必需的,名称及说明等可以是任 意形式,换行之后是序列)粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可以开始搜索了。如果是 DNA歹U, 一般选择 BLASTNft索DNA数据库。这里以 NCBI 为例。登录 NCBI 主页-点击 BLAST-点击 Nucleotide-nucleotide BLAST (blastn)- 在Search文本框中粘贴检测序列-点击 BLAST!-点击 F

3、ormat-得到result ofBLASTBLASTN吉果如彳S分析(参数意义):gi|28171832|gb|AY155203.1| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete sequenceScore = 2020 bits (1019), Expect = 0.0Identities = 1382/1497 (92%), Gaps = 8/1497 (0%)Strand = Plus / PlusQuery: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccct

4、ttcgggggt 60 | | |Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc-ggggt 58Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120 | | | | |Sbjct: 59 acacgagcggcgaacgggtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118Score :指的是提交的序列和搜索出的序列之间的分值,越高说明越相似;Expect :比对的期望值。比对

5、越好,expect越小,一般在核酸层次的比对,expect小于1e-10 , 就比对很好了,多数情况下为0;Identities :提交的序列和参比序列的相似性,如上所指为 1497个核甘酸中二者有1382个相同;Gaps: 一般翻译成空位,指的是对不上的碱基数目;Strand :链的方向,Plus / Minus意味着提交的序列和参比序列是反向互补的,如果是Plus/ Plus则二者皆为正向。1.2 序列格式:FASTAB式由于EMB次口 GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数据格式。FASTA格式又称为Pearson格式,该种序列格式要求序列的标题行

6、以大于号“”开头,下一行起为具体的序列。一般建议每行的字符数不超过60或80个,以方便程序处理。多条核酸和蛋白质序列格式即将该格式连续列出即可,如下所示:E.coli1 aaattgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa61 gtcgaacggt aacaggaaga agcttgcttc tttgctgacg agtggcggacAY631071 Jiangella gansuensis YIM 0021 gacgaacgct ggcggcgtgc ttaacacatg caagtcgagc ggaaaggccc

7、 tttcgggggt61 actcgagcgg cgaacgggtg agtaacacgt gggtaacctg ccttcagctc tgggataagc其中的为Clustal X默认的序列输入格式,必不可少。其后可以是种属名称,也可以是序列在 Genbank中的登录号(Accession No.),自编号也可以,不过需要注意名字不能太长,一般由英文字母和数字组成,开首几个字母最好不要相同,因为有时 Clustal X程序只 默认前几位为该序列名称。回车换行后是序列。将检测序列和搜索到的同源序列以FASTA格式编辑成为一个文本文件(例:C:tempjc.txt) ,即可导入Clustal

8、X等程序进行比对建树。2.构建系统树的相关软件和操作步骤构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。鉴于以上对于构建系统树的评价,结合本实验室实际情况,以下主要介绍N-J Tree构建的相关软件和操作步骤。2.1 用Clustal X 构建N-J系统树的过程(1)打开Clustal X 程序,载入源文件.File-Load sequences- C:tempjc.txt.(2)序列比对Alignment - Output format options - V Clustal format ; CLUSTALWsequence numbers: ONAlignment -

9、 Do complete alignment(Output Guide Tree file, C:tempjc.dnd ; Output Alignment file, C:tempjc.aln ;) Align f waiting 等待时间与序列长度、数量以及计算机配置有关。(3)掐头去尾File- Save Sequence as Format: O CLUSTALGDE output case: LowerCLUSTALW sequence numbers: ONSave from residue: 39 to 1504 (以前后最短序列为准 )Save sequence as: C:t

10、empjc-a.alnOK将开始和末尾处长短不同的序列剪切整齐。这里,因为测序引物不尽相同,所以比对后序列参差不齐。一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。剪切后的文件存为 ALN格式。(4) File-Load sequences-Replace existing sequences?-Yes- C:tempjc-a.aln重新载入剪切后的序列。(5) Trees-Output Format OptionsOutput Files : V CLUSTALformat tree V Phylip format tree V Phylip distance matr

11、ix Bootstrap labels on: NODECLOSETrees-Exclude positions with gapsTrees-Bootstrap N-J TreeRandom number generator seed(1-1000) : 111Number of bootstrap trails(1-1000): 1000SAVE CLUSTAL TREE AS: C:tempjc-a.njbSAVE PHYLIP TREE AS: C:tempjc-a.njbphbOK f waiting 等待时间与序列长度、数量以及计算机配置有关。在此过程中,生成进化树文件*.njbp

12、hb ,可以用TreeView打开查看。(6) Trees-Draw N-J TreesSAVE CLUSTAL TREE AS: C:tempjc-a.njSAVE PHYLIP TREE AS: C:tempjc-a.njphSAVE DISTANCE MATRIX AS: C:tempjc-a.njphdstOK此过程中生成的报告文件 *.nj比较有用,里面列出了比对序列两两之间的相似度,以及转 换和颠换分别各占多少。(7) TreeViewFile-Open-C:tempjc-a.njbphbTree- phylogram(unrooted, slanted cladogram , R

13、ectangular cladogram 多种树型)Tree- Show internal edge labels (Bootstrap value)(显示数值)Tree- Define outgroup -ingroup outgroup - OK(定义外群)Tree- Root with outgroup通常需要对进化树进行编辑,这时首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再进行图片编辑。如果直接Copy至Word则显示乱码,而进化树不能正确显示。2.2 Mega 建树虽然Clustal X 可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Meg

14、a因为操作简单,结果美观,很多研究者选择用它来建树。(1)首先用Clustal X 进行序列比对,剪切后生成C:tempjc-a.aln 文件;(同上)(2)打开BioEdit程序,将目标文件格式转化为FASTAB式,File-Open- C:tempjc-a.aln ,File-Save As- C:temp jc-b.fas ;(3)打开Mega程序,转化为 mega格式并激活目标文件,File-Convert To MEGA Format- C:temp jc- b.fas f C: temp jc-b.meg , 关闭 Text Editor 窗口 -(Do you want to s

15、ave your changes before closing?-Yes);Click me to activate a data file- C:tempjc-b.meg-OK- (Protein-coding nucleotide sequence data?-No);Phylogeny-Neighbor-Joining(NJ)Distance Options-Models-Nucleotide: Kimura 2-parameter;V d: Transitions+Transversions;Include Sites- O Pairwise DeletionTest of Phylogeny- O Bootstrap; Replications 1000; Random Seed 64238OK开始计算得到结果;(4)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 演讲稿/致辞

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号