核酸序列相似性分析

上传人:jiups****uk12 文档编号:56955061 上传时间:2018-10-17 格式:PPT 页数:53 大小:2.26MB
返回 下载 相关 举报
核酸序列相似性分析_第1页
第1页 / 共53页
核酸序列相似性分析_第2页
第2页 / 共53页
核酸序列相似性分析_第3页
第3页 / 共53页
核酸序列相似性分析_第4页
第4页 / 共53页
核酸序列相似性分析_第5页
第5页 / 共53页
点击查看更多>>
资源描述

《核酸序列相似性分析》由会员分享,可在线阅读,更多相关《核酸序列相似性分析(53页珍藏版)》请在金锄头文库上搜索。

1、第2章 核酸序列分析,2.1 GenBank数据格式 2.2 序列数据库检索 2.3 核酸序列相似性分析 2.4 核酸的多序列比对 2.5 构建进化树 2.6 核酸序列的预测与鉴定 2.7 核酸序列的酶切位点分析,2.1 GenBank数据格式,24,3) Click “Search”,1) Select “nucleotide”,2) Enter “U49845”,GenBank数据格式,长度,分子类型,来源,更新日期,登录号,24,作者,标题,生物,杂志,表2.1 GenBank分类码,26,PRI ROD MAM VRT INV PLN BCT VRL PHG SYN UNA EST P

2、AT STS GSS HTG HTC,primate sequences - - - - - - - - - - - - - - - - - - - - - - - - - - rodent sequences - - - - - - - - - - - - - - - - - - - - - - - - - - - other mammalian sequences - - - - - - - - - - - - - - - - - - - other vertebrate sequences - - - - - - - - - - - - - - - - - - - - invertebr

3、ate sequences - - - - - - - - - - - - - - - - - - - - - - - plant, fungal, and algal sequences - - - - - - - - - - - - - - - bacterial sequences - - - - - - - - - - - - - - - - - - - - - - - - - - viral sequences - - - - - - - - - - - - - - - - - - - - - - - - - - - - - bacteriophage sequences - - -

4、 - - - - - - - - - - - - - - - - - - - synthetic sequences - - - - - - - - - - - - - - - - - - - - - - - - - - unannotated sequences - - - - - - - - - - - - - - - - - - - - - - - EST sequences (expressed sequence tags) - - - - - - - - patent sequences - - - - - - - - - - - - - - - - - - - - - - - -

5、- - - - STS sequences (sequence tagged sites) - - - - - - - - - - - GSS sequences (genome survey sequences) - - - - - - - High-throughput genomic sequences - - - - - - - - - - - - - High-throughput cDNA sequencing - - - - - - - - - - - - - - -,灵长类序列 啮齿类序列 其他哺乳动物序列 其他脊椎动物序列 无脊椎动物序列 植物/真菌/藻类序列 细菌序列 病毒

6、序列 噬菌体序列 合成序列 未注释序列 表达序列标签序列 专利序列 序列标签位点序列 基因组探查序列 高通量基因组序列 高通量cDNA序列,Features(特性表),coding sequences(编码序列),翻译产物,GenBank data format (4/4),核苷酸序列,2.2 序列数据库检索,33,All Databases下拉菜单提供了分类提取数据的功能。,用“序列号”提取核苷酸数据,1)选择Nucleotide,2)输入“AF310622”,3)Click,提取结果(1/2),提取结果(2/2),用“序列号”提取蛋白质数据,1)选择Protein,2)输入“P15172”

7、,3)Click,提取结果(1/2),提取结果(2/2),Practice,请大家回去把刚才讲过的内容练习一遍。,2.3 核酸序列相似性分析,38,对一个新测定的核酸序列的序列数据,可以通过使用不同的关键词从数据库中检索有用的信息,还可以做以下的工作:单条序列的序列特征分析;序列的双重比对和数据库检索;多序列比对;通过多序列比对分析序列的模块;构建进化树。,2.3.1 相似性搜索,39,同源性(homology):指两条序列在进化上相关(来自于共同祖先),是一种已经发生的进化事件。取值:Yes or No,需要通过相关分析才能得出结论。 例如:对bHLH转录因子序列的系统发生分析时,如果用不同

8、建树方法得到的树形一致并且自举检验值高于50%时,认为序列之间有同源性。相似性(similarity):只是指两条序列之间的简单相似。取值:0 100%,只需通过BLAST(或类似的程序)进行估算。,“同源”不一定“相似”,39,人、猫、鲸和蝙蝠的前肢骨骼具有同源性。,1)BLAST,40,BLAST: basic local alignment search tool基本局部比对搜索工具,Basic BLAST(5种),Specialized BLAST(8种),Click here,Basic BLAST,40,blastn,blastp,Basic BLAST,核酸序列 Nucleoti

9、de sequence,蛋白质序列 Protein sequence,核酸序列 Nucleotide sequences,蛋白质序列 Protein sequences,blastn,blastp,tblastn,blastx,tblastx,查询序列 Query sequence,数据库序列 Database sequences,Basic BLAST,blastn: 用核酸序列检索核酸序列数据库blastp: 用蛋白质序列检索蛋白质序列数据库blastx: 把核酸序列翻译成蛋白质序列后检索蛋白质序列数据库(查询序列以所有6种读码框翻译后再进行比较)tblastn: 用蛋白质序列检索核酸序列

10、数据库(数据库中的核酸序列以所有6种读码框翻译后与查询序列比较)tblastx: 把核酸序列翻译成蛋白质序列后检索核酸序列数据库(查询序列和数据库序列都以所有6种读码框翻译后再进行比较),6种读码框,5 - TCT TCC TCA AAA TAA AGA AGT ATG GTA ATC - 3Frame +1 TCT TCC TCA AAA TAA AGA AGT ATG GTA ATCFrame +2 T CTT CCT CAA AAT AAA GAA GTA TGG TAA TCFrame +3 TC TTC CTC AAA ATA AAG AAG TAT GGT AAT CFrame -

11、1 GAT TAC CAT ACT TCT TTA TTT TGA GGA AGA Frame -2 G ATT ACC ATA CTT CTT TAT TTT GAG GAA GA Frame -3 GA TTA CCA TAC TTC TTT ATT TTG AGG AAG A,3 - AGA AGG AGT TTT ATT TCT TCA TAC CAT TAG 5,Specialized BLAST,(1)blastn,41,Click here.,blastn的界面与相关数据库,41,2) Select database.,3) Click “BLAST”.,Paste your s

12、equence here (Word, Text or FASTA format),Blastn databases,41,请参考表2.5的说明,Example 2-1,44,使用blastn对下面的序列进行相似性检索。,AAAAGAAAAGGTTAGAAAGATGAGAGATGATAAAGGGTCCATTTGAGGTTAGGTAATATGGTTTGGTATC CCTGTAGTTAAAAGTTTTTGTCTTATTTTAGAATACTGTGATCTATTTCTTTAGTATTAATTTTTCCTTC TGTTTTCCTCATCTAGGGAACCCCAAGAGCATCCAATAGAAGCTGTG

13、CAATTATGTAAAATTTTCAACTG TCTTCCTCAAAATAAAGAAGTATGGTAATCTTTACCTGTATACAGTGCAGAGCCTTCTCAGAAGCACAGA ATATTTTTATATTTCCTTTATGTGAATTTTTAAGCTGCAAATCTGATGGCCTTAATTTCCTTTTTGACAC TGAAAGTTTTGTAAAAGAAATCATGTCCATACACTTTGTTGCAAGATGTGAATTATTGACACTGAACTTA ATAACTGTGTACTGTTCGGAAGGGGTTCCTCAAATTTTTTGACTTTTTTTGTATGTGTGTTTT

14、TTCTTTT TTTTTAAGTTCTTATGAGGAGGGGAGGGTAAATAAACCACTGTGCGTCTTGGTGTAATTTGAAGATTGCC CCATCTAGACTAGCAATCTCTTCATTATTCTCTGCTATATATAAAACGGTGCTGTGAGGGAGGGGAAAAG CATTTTTCAATATATTGAACTTTTGTACTGAATTTTTTTGTAATAAGCAATCAAGGTTATAATTTTTTTT AAAATAGAAATTTTGTAAGAAGGCAATATTAACCTAATCACCATGTAAGCACTCTGGATGATGGATTCCA CAAAACTT

15、GGTTTTATGGTTACTTCTTCTCTTAGATTCTTAATTCATGAGGAGGGTGGGGGAGGGAGGTG GAGGGAGGGAAGGGTTTCTCTATTAAAATGCATTCGTTGTGTTTTTTAAGATAGTGTAACTTGCTTAAAT TTCTTATGTGACATTAACAAATAAAAAAGCTCTTTTAATATTAGATAA,使用blastn的步骤,2) Select “nr/nt”.,3) Click “BLAST”.,Paste your sequence here (Word, Text or FASTA format),搜索参 数设定,搜索参数设定,可以在此输 入生物名称,搜索参数设定,可以在此设定E值,可以选择不使用过滤器,可以选择不同打分矩阵,搜索参数设定,初学者一般不更改设 定而选用默认设置, 直接点击BLAST,Wait for a while ,Blastn result (1/4),44,Blastn result (2/4),45,比对分值 颜色代码,Blastn result (3/4),

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号