第3讲 生物信息学序列分析生物信息学常用软件及其使用

上传人:豆浆 文档编号:52879218 上传时间:2018-08-26 格式:PPT 页数:49 大小:2.35MB
返回 下载 相关 举报
第3讲 生物信息学序列分析生物信息学常用软件及其使用_第1页
第1页 / 共49页
第3讲 生物信息学序列分析生物信息学常用软件及其使用_第2页
第2页 / 共49页
第3讲 生物信息学序列分析生物信息学常用软件及其使用_第3页
第3页 / 共49页
第3讲 生物信息学序列分析生物信息学常用软件及其使用_第4页
第4页 / 共49页
第3讲 生物信息学序列分析生物信息学常用软件及其使用_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《第3讲 生物信息学序列分析生物信息学常用软件及其使用》由会员分享,可在线阅读,更多相关《第3讲 生物信息学序列分析生物信息学常用软件及其使用(49页珍藏版)》请在金锄头文库上搜索。

1、第三讲 生物信息学常用软件 及其使用,一、DNA 序列片断拼接 (电子基因克隆),获得感兴趣的EST,在dbEST数据库中找出EST的最有途径是寻找同源序列,标准:长度100bp,同源性50%以上、85%以下。 然后将检出序列组装为重叠群(contig),以此重叠群为被检序列,重复进行BLAST检索与序列组装,延伸重叠样系列,重复以上过程,直到没有更多的重叠EST检出或者说重叠群序列不能继续延伸,有时可获得全长的基因编码序列。 再与GeneBank核酸数据库进行相似性检测,假如有精确匹配基因,将EST序列数据据EST六种阅读框翻译成蛋白质,接着与蛋白质序列数据库进行比较分析。,Vector N

2、TI 5.2 中的contig ExpressContig Express软件:Sequencer软件: ftp:/ Chromas软件: http:/.au/chromas230.exe,限制性核酸内切酶(restriction endonuclease)识别DNA的特异序列,并在识别位点或其周围切割双链DNA的一类内切酶。即一类能识别双链DNA分子中特异核苷酸序列的DNA水解酶。是细菌内存在的保护性酶。分为I、II、III三类。,(一)定义:,其中的II类限制性核酸内切酶是重组DNA技术中的重要工具酶。 II类酶识别序列特点为回文结构,大多为 46 bp 回文结构(palindrome s

3、equence), 如EcoRI 识别序列: 5GAATTC 3 5GGATCC 3 3CTTAAG 5 3CCTAGG 5,限制性核酸内切酶命名,Smith和Nathame命名原则(1973) 属名 + 种名 + 株名 + 流水例如: 流感噬血杆菌d株 (Haemophilus influengae d) Hind Hind Hind Hind ,常用的限制性核酸内切酶酶切序列,限制酶 识别序列及切口 限制酶 识别序列及切口 Alu AG/CT Hind A/AGCTT TC/GA TTCGA/A BamH G/GATCC Sal G/TCGAC CCGAG/G CAGCT/G Bgl A/

4、GATCT Sma CCC/GGG TCTAG/A GGG/CCC EcoR G/AATTC CTTAA/G,sticky end 5 3 5 3 5 3 EcoR GAATTC G AATTC CTTAAG CTTAA G 3 5 3 5 3 5blunt end 5 3 5 3 5 3 Sma CCCGGG CCC GGG GGGCCC GGG CCC 3 5 3 5 3 5,利用NEB Lab在线免费软件分析: http:/ 等其他商业软件均能分析。 以DNAClub为例说明。,四、PCR 引物设计 (包括杂交探针设计),(一)引物设计的原则 引物要跟模板紧密结合; 引物与引物之间不能有

5、稳定的二聚体或发夹结构存在; 引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。,引物长度(primer length), 产物长度(product length), 序列Tm值 (melting temperature), G值(internal stability), 引物二聚体及发夹结构(duplex formation and hairpin), 错误引发位点(false priming site), 引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。,(二)引物设计需要考虑的因素,(三)引物设计要点,一般引物的长度为15-30

6、bp,常用的长度为18-24bp,过长或过短都不合适。 引物3端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其它三种碱基的错误引发效率相对小一些。 引物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。 引物所对应模板序列的Tm值最好在72左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。,G值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标。 一般情况下,在Oligo 5.0软件的G值窗口中,引物的G值最好呈正弦曲线形状,即5端和中间部分G值较高,而3端G值相对较低,且不要超过9(G值为负

7、值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。 其原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整合,因此5端与中间段的G值应较高,而3端G值影响DNA聚合酶对模板DNA的解链,过高则不利于这一步骤。,可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,最好没有错误引发位点,如此可以保证不出非目的产物的假带。 引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带,且会降低引物浓度从而导致PCR正常反应不能进行。 对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,

8、常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。,推荐使用自动搜索软件(商业软件): Primer Premier 5.0 推荐使用引物评价软件(商业软件) :Oligo 6网址:http:/,(四)、引物设计软件的使用,OLIGO 6.0 PCR 引物设计,设计引物的免费在线软件Primer3, 网址: http:/frodo.wi.mit.edu/primer3,我的评价: 是非常优秀的设计引物的软件! 是真正的“免费的午餐”! 天上会掉下“馅饼”的?会的!,以一条序列为例,说明其使用方法,五、质粒绘图软件,Winplas (商业软件)pDRAW32软件(商业软件)

9、,其网址:http:/hjem.get2net.dk/acaclone,可以看到演示版和有关信息Vector NTI (商业软件),Winplas 2.6 质粒构建,Plasmid processor 其免费下载的网址 http:/ http:/www.hytti.uku.fi/%7Eoikari/plasmid.htmlDMUP beta 其免费下载的网址 http:/ http:/ processor质粒作图软件是压缩软件,需要先将其解压到一个目录下(不需安装即可直接应用),然后才能应用。(压缩文件是网络传输的最常用文件,目的是为了传输方便); 1)在资源管理器中双击Plasmid.exe

10、 文件(553kb),进入作图的界面; 2)点filenew,在出来的对话框中填上Plasmid name和length,比如分别填 pBR322和4322(bp)(注意不能填4.322kb,否则软件不认识)。点击OK,进入下一个界面,上面是一个圆,标着pBR322和4322bp。 3)点daterestriction site加酶切位点,填酶的名称及定位; 4)点DatemultipleGenes,填基因名称(如E6),位点在500至890处,还是在此对话框中,选择右下角的style选所加基因的格式是箭头还是长的圆弧等格式(根据喜好),选厚薄度(thichness),然后点击此对话框右上部分

11、的Add Gene,在点击done,于是基因就加上了。基因和酶切位点可反复加多次。,5)但本软件缺陷之处上多克隆位点不能直接加,只能通过点daterestriction site加酶切位点,在此对话框中加多克隆酶切位点(如加HinIII, EcoRI,BstI时,点daterestriction site加酶切位点,出现对话框后,HinIII, location比如填1,Add site; Eco R I填3,Add site; Bst填5Add site;然后点击OK. 在圆上将位点15处用鼠标往旁边分别一拖,就可看见这三个位点了。,质粒作图的在线软件PlasMapper2.0,http:/

12、wishart.biology.ualberta.ca/PlasMapper,六、进化树分析软件,MEGA4.0:免费分子进化遗传分析软件免费下载地址: http:/Vector NTI:商业软件,Vector NTI Suit 同源比较主窗口,Vector NTI Suit 同源比较进化树,七、序列的同源性分析软件,Blast ClustalW,Blast简介,BLAST 是由美国国立生物技术信息中心(NCBI) 开发的一个基于序列相似性的数据库搜索程序。 BLAST是“局部相似性基本查询工具”(Basic Local Alignment Search Tool)的 缩写。 http:/ww

13、w.ncbi.nlm.nih.gov/BLAST/(网络版),主要的blast程序,举例说明使用过程,p1MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTV

14、TKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADST QA,Clustwal W简介和使用 进行核酸或蛋白质的多序列的比较 网址: http:/www.ebi.ac.uk/clustalw http:/www.ddbj.nig.ac.jp/search/clustalw-e.html,八、ORF Finder (核酸编码蛋白质区域分析软件),www.ncbi.nlm.nih.gov/gorf,目前,在国际上,一些优秀的软件根据功能归类被集中在一个网页上,极大地方便了使用。 http:/bioinformatics.weizamann.ac.il/gdp/gdp.html,在国内,很多生物信息学软件来源信息(包括不少免费下载的软件)都可以生物软件网上获得。 http:/www.bio- http:/,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号