bioedit多序列比较的实际应用

上传人:san****019 文档编号:70305966 上传时间:2019-01-16 格式:PPT 页数:99 大小:7.48MB
返回 下载 相关 举报
bioedit多序列比较的实际应用_第1页
第1页 / 共99页
bioedit多序列比较的实际应用_第2页
第2页 / 共99页
bioedit多序列比较的实际应用_第3页
第3页 / 共99页
bioedit多序列比较的实际应用_第4页
第4页 / 共99页
bioedit多序列比较的实际应用_第5页
第5页 / 共99页
点击查看更多>>
资源描述

《bioedit多序列比较的实际应用》由会员分享,可在线阅读,更多相关《bioedit多序列比较的实际应用(99页珍藏版)》请在金锄头文库上搜索。

1、第四章 多序列比较的实际应用,多序列比较就是把两条以上可能有系统进化关系的序列进行比较的方法。目前对多序列比较的研究还在不断前进中,现有的大多数算法都基于渐进比较的思想,在序列两两比较的基础上逐步优化多序列比较的结果。进行多序列比较后可以对比较结果进行进一步处理,尤其是在寻找基因和致力于发现新蛋白的努力中,人们习惯于把新的序列同已知功能的蛋白序列作比较。,由于这些比较通常都希望能够推测新蛋白的功能,不管它们是双重比较还是多序列比较,都可以回答大量的其它的生物学问题。例如:在搜集的比较序列中,可以看出隐含于蛋白之中的物种进化关系,以便于更好地理解蛋白的进化。研究一个家族中的相关蛋白的差异,分析进

2、化压力和生物秩序对于功能相关的蛋白进化影响。研究完多序列比较中的高度保守区域,我们可以对蛋白质的整个结构进行预测,并且猜测这些保守区域对于维持三维结构的重要性。,分析一群相关蛋白质时,很有必要了解比较正确的构成。发展用于多序列比较的程序是一个很有活力的研究领域,绝大多数方法都是基于渐进比较(progressive alignment)的概念。渐进比较的思想依赖于使用者用作比较的序列之间确实存在的生物学上的或者更准确地说是系统发生学上的相互关联。,与上一章的关系,1、对数据库比较,比较结果未知; 2、比较后寻找到一组相似序列; 3、构建进化树,第一节渐进比较方法,1. CLUSTAL W CLU

3、STAL W算法是一个最广泛使用的多序列比较程序,在任何主要的计算机平台上都可以免费使用。这个程序基于渐进比较的思想,将得到的一系列序列输入,对于每两个序列进行双重比较并且计算结果。基于这些比较,计算得到一个距离矩阵,反映了每对序列的关系,然后,基于邻近加入方法,这个矩阵被用来计算出一个系统发生辅助树。,这个辅助树,加权后可以证实极相近的序列,然后以双重比较极相近的序列开始,为组建比较提供基础,重新比较下一个加入的比较序列,依次类推。如果加入的序列较多,那么毫无疑问,必须加入空位以适应序列的差异,但是加入空位必须接受空位开放罚分和空位扩展罚分。,在绝大多数情况下,使用者不会在比较时加入结构信息

4、,但是空位开放补偿利用了可以出现在-螺旋或-折叠末端的特殊残基以及空位罚分所偏好的残基。已经存在的空位的扩展原则很简单,只是要在那些极有可能在结构中形成弯曲的位点扩展空位,这些空位扩展罚分计算是由位置决定的。,为了介绍CLUSTAL W的使用,考察一下从四种不同物种来源的matrix metalloproteinase 9 preproprotein蛋白(Homo sapiens,Paralichthys olivaceus,Rattus norvegicus,Bos taurus)。将下列蛋白序列放入一个独立的文件中。,gi|14786152|ref|XP_029934.1| matrix

5、metalloproteinase 9 preproprotein Homo sapiens MSLWQPLVLVLLVLGCCFAAPRQRQSTLVLFPGDLRTNLTDRQLAEEYLYRYGYTRVAEMRGESKSLGPALLLLQKQLSLPETGELDSATLKAMRTPRCGVPDLGRFQTFEGDLKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYSRDADIVIQFGVAEHGDGYPFDGKDGLLAHAFPPGPGIQGDAHFDDDELWSLGKGVVVPTRFGNADGAACHFPFIFEGRSYSACTTDGRSDGL

6、PWCSTTANYDTDDRFGFCPSERLYTQDGNADGKPCQFPFIFQGQSYSACTTDGRSDGYRWCATTANYDRDKLFGFCPTRADSTVMGGNSAGELCVFPFTFLGKEYSTCTSEGRGDGRLWCATTSNFDSDKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYRFTEGPPLHKDDVNGIRHLYGPRPEPEPRPPTTTTPQPTAPPTVCPTGPPTVHPSERPTAGPTGPPSAGPTGPPTAGPSTATTVPLSPVDDACNVNIFDAIAEIGNQLYLFKDGKYWRFSEGRGSRPQGP

7、FLIADKWPALPRKLDSVFEERLSKKLFFFSGRQVWVYTGASVLGPRRLDKLGLGADVAQVTGALRSGRGKMLLFSGRRLWRFDVKAQMVDPRSASEVDRMFPGVPLDTHDVFQYREKAYFCQDRFYWRVSSRSELNQVDQVGYVTYDILQCPED gi|15718389|dbj|BAB68366.1| gelatinase Paralichthys olivaceus MRCCALAVCLVLVIVQDGWSLPLRSISVTFPGDILKNVTDTDLAETYLKRFGYLDKMHRSGFQSMVSTAKALKMMQRQMGLKE

8、TGKLDKSTLEAMKQPRCGVPDVANYQTFEGDLKWDHNDVTYRTLNYSPDMESSLIDDAFARAFKVWSDVTPLTFTRLYEGTADIMISFGKADHGDPYPFDGRNGLLAHAYPPGEGVQGDAHFDDDEHWTLGNGPAVKTLYGNADGAMCHFPFTFEGKSYTSCTTDGRTDNLPWCATTADYSRDGKYGFCPSELLYTVGGNADGAKCVFPFVFLEKEYDSCTKEGRSDGYRWCATTANFDQDQKYGFCPSRDTAVFGGNSEGEPCHFPFVFLGKEYDSCTSEGREDGKLWCSTTDNYDEDA

9、KWGFCDDEGYSLFLVAAHEFGHALGLDHSNIREALMYPMYTYVEDFSLHKDDIEGIQYLYGRGTGPDPTPPQPTSTTTTPNPTEEPEPTTPQPVDPTRDACKLTKFDTITMIENELHFFENGNYWKMPSRGDGGLKGPFSLSERWPALPAVIDSAFEDLLTKNMYFFSGNRFWVYTKEGVLGPRSIEKLGLPTSIQKVEGALQRGKGKVLLFTEESFWKFDLKSQKMDKGYPKSTDYVFGGVPNDAHDVFQYKGHMYFCRDSFYWRMNSRRQVDRVGYVKYDLLKCSDSY gi|135919

10、93|ref|NP_112317.1| matrix metalloproteinase 9 (gelatinase B, 92-kDa type IV collagenase) Rattus norvegicus MNPWQPLLLVLLALGYSFAAPHQRQPTYVVFPRDLKTSNLTDTQLAEDYLYRYGYTRAAQMMGEKQSLRPALLMLQKQLSLPQTGELDSETLKAIRSPRCGVPDVGKFQTFEGDLKWHHHNITYWIQSYTEDLPRDVIDDSFARAFAVWSAVTPLTFTRVYGLEADIVIQFGVAEHGDGYPFDGKDGLLAHA

11、FPPGPGIQGDAHFDDDELWSLGKGAVVPTYFGNANGAPCHFPFTFEGRSYLSCTTDGRNDGKPWCGTTADYDTDRKYGFCPSENLYTEHGNGDGKPCVFPFIFEGHSYSACTTKGRSDGYRWCATTANYDQDKLYGFCPTRADVTVTGGNSAGEMCVFPFVFLGKQYSTCTGEGRSDGRLWCATTSNFDADKKWGFCPDQGYSLFLVAAHEFGHALGLDHSSVPEALMYPMYHYHEDSPLHEDDIKGIQHLYGRGSKPDPRPPATTAAEPQPTAPPTMCPTAPPMAYPTGGPTVAPTGAP

12、SPGPTGPPTAGPSEAPTESSTPVDNPCNVDVFDAIADIQGALHFFKDGRYWKFSNHGGSQLQGPFLIARTWPALPAKLNSAFEDPQSKKIFFFSGRKMWVYTGQTVLGPRSLDKLGLGSEVTLVTGLLPRRGGKALLISRERIWKFDL KSQKVDPQSVTRLDNEFSGVPWNSHNVFHYQDKAYFCHDKYFWRVSFHNRVNQVDHVAYVTYDLLQCP gi|467621|emb|CAA55127.1| matrix metalloproteinase 9 Bos taurus MSPLQPLVLALLVLACCS

13、AVPRRRQPTVVVFPGEPRTNLTNRQLAEEYLYRYGYTPGAELSEDGQSLQRALLRFQRRLSLPETGELDSTTLNAMRAPRCGVPDVGRFQTFEGELKWHHHNITYWIQNYSEDLPRAVIDDAFARAFALWSAVTPLTFTRVYGPEADIVIQFGVREHGDGYPFDGKNGLLAHAFPPGKGIQGDAHFDDEELWSLGKGVVIPTYFGNAKGAACHFPFTFEGRSYSACTTDGRSDDMLWCSTTADYDADRQFGFCPSERLYTQDGNADGKPCVFPFTFQGRTYSACTSDGRSDGYRWCATTA

14、NYDQDKLYGFCPTRVDATVTGGNAAGELCVFPFTFLGKEYSACTREGRNDGHLWCATTSNFDKDKKWGFCPDQGYSLFLVAAHEFGHALGLDHTSVPEALMYPMYRFTEEHPLHRDDVQGIQHLYGPRPEPEPRPPTTTTTTTTEPQPTAPPTVCVTGPPTARPSEGPTTGPTGPPAAGPTGPPTAGPSAAPTESPDPAEDVCNVDIFDAIAEIRNRLHFFKAGKYWRLSEGGGRRVQGPFLVKSKWPALPRKLDSAFEDPLTKKIFFFSGRQVWVYTGASLLGPRRLDKLGLGPEVAQV

15、TGALPRPEGKVLLFSGQSFWRFDVKTQKVDPQSVTPVDQMFPGVPISTHDIFQYQEKAYFCQDHFYWRVSSQNEVNQVDYVGYVTFDLLKCPED,这四种输入序列放在一个单独的文件中,作成7种可以接受的格式中的一种, ClustalW currently supports 7 multiple sequence formats. These are: NBRF/PIR EMBL / UniProtKB/Swiss-Prot Pearson (Fasta) GDE ALN/ClustalW GCG/MSF RSF,然后进入http:/www.ebi.ac

16、.uk/clustalw/ 站点,将需要比较的序列输入工具程序中 ,在图4.1中的“序列输入窗口”输入或粘贴需要比较的序列,也可以在“文件输入窗口”将含有需要比较序列的文件名输入Clustalw运行程序中,进行多序列比较。,结果输出可以在网页中获得,也可以通过电子邮件发到用户的信箱。 通过改变输出结果下拉菜单,用户可以根据需要获得多种形式的输出结果。用户在执行多序列比较时有很多选择的自由,用户可以设定空位开放和扩展的罚分,指出在组建辅助树时分歧到什么程度证明可以跳过一个序列,选择一个分值矩阵(BLOSUM或PAM),并且可以选择当一个亲水残基出现(或缺失)在一个特异位点时,是否要执行特异性罚分,如果需要,要罚多少分。 程序会在屏幕上显示构建辅助树的过程,然后开始真正的多序列比较。,G 7 P -2 9 D -1 -1 7 E -2 0 2 6 N 0 -2 2 0 6 H -2 -2 0 0 1 10 Q -2 -1 0 2 0 1 6 K -2 -1 0 1 0 -1 1 5 R -2 -2 -1 0

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号