构建系统进化树的详细步骤

上传人:l**** 文档编号:134988648 上传时间:2020-06-10 格式:DOC 页数:12 大小:56KB
返回 下载 相关 举报
构建系统进化树的详细步骤_第1页
第1页 / 共12页
构建系统进化树的详细步骤_第2页
第2页 / 共12页
构建系统进化树的详细步骤_第3页
第3页 / 共12页
构建系统进化树的详细步骤_第4页
第4页 / 共12页
构建系统进化树的详细步骤_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《构建系统进化树的详细步骤》由会员分享,可在线阅读,更多相关《构建系统进化树的详细步骤(12页珍藏版)》请在金锄头文库上搜索。

1、构建系统进化树的详细步骤1. 建树前的准备工作 1.1 相似序列的获得BLAST BLAST是目前常用的数据库搜索程序,它是Basic Local Alignment Search Tool的缩写,意矚慫润厲钐瘗睞枥庑赖賃軔朧。为“基本局部相似性比对搜索工具”(Altschul et al.,199062;199763)。国际著名生物信息中心聞創沟燴鐺險爱氇谴净祸測樅。都提供基于Web的BLAST服务器。BLAST算法的基本思路是首先找出检测序列和目标序列之间相似性程度最高的片段,并作为核向两端延伸,以找出尽可能长的相似序列片段。 首先登录到提供BLAST服务的常用,比如国的CBI、美国的NC

2、BI、欧洲的EBI和日本的DDBJ。这些提供的BLAST服务在界面上差不多,但所用的程序有所差异。它们都有一个大的文本框,用于粘贴需要搜索的序列。把序列以FASTA格式(即第一行为说明行,以“”符号开始,后面是序列的名称、说明等,其中“”是必需的,名称及说明等可以是任意形式,换行之后是序列)粘贴到那个大的文本框,选择合适的BLAST程序和数据库,就可以开始搜索了。如果是DNA序列,一般选择BLASTN搜索DNA数据库。这里以NCBI为例。登录NCBI主页-点击BLAST-点击Nucleotide-nucleotide BLAST (blastn)-在Search文本框中粘贴检测序列-点击BLA

3、ST!-点击Format-得到result of BLAST。 残骛楼諍锩瀨濟溆塹籟婭骒東。BLASTN结果如何分析(参数意义): gi|28171832|gb|AY155203.1| Nocardia sp. ATCC 49872 16S ribosomal RNA gene, complete 酽锕极額閉镇桧猪訣锥顧荭钯。sequence Score = 2020 bits (1019), Expect = 0.0 Identities = 1382/1497 (92%), Gaps = 8/1497 (0%) Strand = Plus / Plus 彈贸摄尔霁毙攬砖卤庑诒尔肤。Quer

4、y: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggaaaggccctttcgggggt 60 謀荞抟箧飆鐸怼类薔點鉍杂。| | | Sbjct: 1 gacgaacgctggcggcgtgcttaacacatgcaagtcgagcggtaaggcccttc-ggggt 58 厦礴恳蹒骈時盡继價骚卺癩龔。Query: 61 actcgagcggcgaacgggtgagtaacacgtgggtaacctgccttcagctctgggataagc 120 茕桢广鳓鯡选块网羈泪镀齐鈞。| | | | | Sbjct: 59 acacgagcggcgaacgg

5、gtgagtaacacgtgggtgatctgcctcgtactctgggataagc 118 鹅娅尽損鹌惨歷茏鴛賴縈诘聾。Score :指的是提交的序列和搜索出的序列之间的分值,越高说明越相似; Expect:比对的期望值。比对越好,expect越小,一般在核酸层次的比对,expect小于1e-10,籟丛妈羥为贍偾蛏练淨槠挞曉。就比对很好了,多数情况下为0; Identities:提交的序列和参比序列的相似性,如上所指为1497个核苷酸中二者有1382个相同; Gaps:一般翻译成空位,指的是对不上的碱基数目; Strand:链的方向,Plus / Minus意味着提交的序列和参比序列是反向

6、互补的,如果是Plus / 預頌圣鉉儐歲龈讶骅籴買闥龅。Plus则二者皆为正向。 1.2 序列格式:FASTA格式 由于EMBL和GenBank数据格式较为复杂,所以为了分析方便也出现了十分简单的FASTA数据格式。FASTA格式又称为Pearson格式,该种序列格式要求序列的标题行以大于号“”开头,下一行起为具体的序列。一般建议每行的字符数不超过60或80个,以方便程序处理。多条核酸和蛋白质序列格式即将该格式连续列出即可,如下所示:E.coli 1 aaattgaaga gtttgatcat ggctcagatt gaacgctggc ggcaggccta acacatgcaa 渗釤呛俨匀谔

7、鱉调硯錦鋇絨钞。61 gtcgaacggt aacaggaaga agcttgcttc tttgctgacg agtggcggac 铙誅卧泻噦圣骋贶頂廡缝勵罴。AY631071 Jiangella gansuensis YIM 002 1 gacgaacgct ggcggcgtgc ttaacacatg caagtcgagc ggaaaggccc tttcgggggt 擁締凤袜备訊顎轮烂蔷報赢无。61 actcgagcgg cgaacgggtg agtaacacgt gggtaacctg ccttcagctc tgggataagc 贓熱俣阃歲匱阊邺镓騷鯛汉鼉。 其中的为Clustal X默认的

8、序列输入格式,必不可少。其后可以是种属名称,也可以是序列在Genbank中的登录号(Accession No.),自编号也可以,不过需要注意名字不能太长,一般由英文字母和数字组成,开首几个字母最好不要相同,因为有时Clustal X程序只默认前几位为该序列名称。回车换行后是序列。将检测序列和搜索到的同源序列以FASTA格式编辑成为一个文本文件(例:C:tempjc.txt),即可导入Clustal X等程序进行比对建树。 2. 构建系统树的相关软件和操作步骤 坛摶乡囂忏蒌鍥铃氈淚跻馱釣。构建进化树的主要步骤是比对,建立取代模型,建立进化树以及进化树评估。鉴于以上对于构建系统树的评价,结合本实验

9、室实际情况,以下主要介绍N-J Tree构建的相关软件和操作步骤。 蜡變黲癟報伥铉锚鈰赘籜葦繯。2.1 用Clustal X构建N-J系统树的过程 (1) 打开Clustal X程序,载入源文件. File-Load sequences- C:tempjc.txt. (2) 序列比对 Alignment - Output format options - ? Clustal format; CLUSTALW sequence numbers: ON 買鲷鴯譖昙膚遙闫撷凄届嬌擻。Alignment - Do complete alignment (Output Guide Tree file,

10、C:tempjc.dnd;Output Alignment file, C:tempjc.aln;) Align ? waiting 綾镝鯛駕櫬鹕踪韦辚糴飙钪麦。等待时间与序列长度、数量以及计算机配置有关。 (3) 掐头去尾 File-Save Sequence as Format: ? CLUSTAL GDE output case: Lower CLUSTALW sequence numbers: ON Save from residue: 39 to 1504 (以前后最短序列为准) Save sequence as: C:tempjc-a.aln OK 将开始和末尾处长短不同的序列剪切

11、整齐。这里,因为测序引物不尽相同,所以比对后序列参差不齐。一般来说,要“掐头去尾”,以避免因序列前后参差不齐而增加序列间的差异。剪切后的文件存为ALN格式。 驅踬髏彦浃绥譎饴憂锦諑琼针。(4) File-Load sequences-Replace existing sequences?-Yes- C:tempjc-a.aln 猫虿驢绘燈鮒诛髅貺庑献鵬缩。重新载入剪切后的序列。 (5) Trees-Output Format Options Output Files : ? CLUSTAL format tree ? Phylip format tree ? Phylip distance m

12、atrix Bootstrap labels on: NODE 锹籁饗迳琐筆襖鸥娅薔嗚訝摈。CLOSE Trees-Exclude positions with gaps Trees-Bootstrap N-J Tree :構氽頑黉碩饨荠龈话骛門戲鷯。Random number generator seed(1-1000) : 111 Number of bootstrap trails(1-1000): 1000 SAVE CLUSTAL TREE AS: C:tempjc-a.njb SAVE PHYLIP TREE AS: C:tempjc-a.njbphb OK ? waiting 輒

13、峄陽檉簖疖網儂號泶蛴镧釃。等待时间与序列长度、数量以及计算机配置有关。在此过程中,生成进化树文件*.njbphb,可以用TreeView打开查看。 尧侧閆繭絳闕绚勵蜆贅瀝纰縭。(6) Trees-Draw N-J Trees SAVE CLUSTAL TREE AS: C:tempjc-a.nj SAVE PHYLIP TREE AS: C:tempjc-a.njph SAVE DISTANCE MATRIX AS: C:tempjc-a.njphdst OK 识饒鎂錕缢灩筧嚌俨淒侬减攙。此过程中生成的报告文件*.nj比较有用,里面列出了比对序列两两之间的相似度,以及转换和颠换分别各占多少。

14、凍鈹鋨劳臘锴痫婦胫籴铍賄鹗。(7) TreeView File-Open-C:tempjc-a.njbphb Tree- phylogram(unrooted, slanted cladogram,Rectangular cladogram多种树型) Tree- Show internal edge labels (Bootstrap value)(显示数值) 恥諤銪灭萦欢煬鞏鹜錦聰櫻郐。Tree- Define outgroup ? ingroup outgroup ? OK(定义外群) 鯊腎鑰诎褳鉀沩懼統庫摇饬缗。Tree- Root with outgroup 通常需要对进化树进行编辑,

15、这时首先要Edit-Copy至PowerPoint上,然后Copy至Word上,再进行图片编辑。如果直接Copy至Word则显示乱码,而进化树不能正确显示。 2.2 Mega建树 硕癘鄴颃诌攆檸攜驤蔹鸶胶据。虽然Clustal X可以构建系统树,但是结果比较粗放,现在一般很少用它构树,Mega因为操作简单,结果美观,很多研究者选择用它来建树。 阌擻輳嬪諫迁择楨秘騖輛埙鵜。(1) 首先用Clustal X进行序列比对,剪切后生成C:tempjc-a.aln文件;(同上) (2) 打开BioEdit程序,将目标文件格式转化为FASTA格式, 氬嚕躑竄贸恳彈瀘颔澩纷釓鄧。File-Open- C:tempjc-a.aln, File-Save As- C:temp jc-b.fas; (3) 打开Mega程序,转化为mega格式并激活目标文件, File-Convert To MEGA Form

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号