生物学信息分析

上传人:mg****85 文档编号:56380856 上传时间:2018-10-12 格式:PPT 页数:81 大小:6.52MB
返回 下载 相关 举报
生物学信息分析_第1页
第1页 / 共81页
生物学信息分析_第2页
第2页 / 共81页
生物学信息分析_第3页
第3页 / 共81页
生物学信息分析_第4页
第4页 / 共81页
生物学信息分析_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《生物学信息分析》由会员分享,可在线阅读,更多相关《生物学信息分析(81页珍藏版)》请在金锄头文库上搜索。

1、相关生物信息学分析及软件的使用,基因工程下游技术实习,实验目的,了解相关的生物信息学数据库(NCBI数据库等)和掌握数据库检索方法,学会相关软件的使用,并利用生物信息学软件根据研究目的和对象设计引物。,方法,根据酶或基因的名称(GenBank登录号)找到需要的基因的核苷酸序列,根据序列和PCR的目的设计获得该基因的CDS的引物(注意引物设计时引物酶切位点)。,目的基因序列的检索,主要数据库介绍,Genebank EMBL DDBJ,Genebank Genebank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护

2、的。 NCBI的网址是:http:/www.ncbi.nlm.nih.gov,EMBL核酸序列数据库 由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过通过因特网上的序列提取系统(SRS)服务完成。 数据库网址是:http:/www.ebi.ac.uk/embl/,DDBJ数据库 日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。 DDBJ的网址是:http:/www.ddbj.nig.ac.jp/,NCBI介绍:NCBI建立在1988年,作为一种公共分子生物学信息

3、资源, 而创建的公开数据库。 NCBI的计划:1.基本研究;2.数据库;3.软件的开发;4.教育和训练,现在我们以查找甘薯异戊烯氯喹异构酶(Ipomoea batatas isopentenyl diphosphate isomerase ,ipi)的 编码序列为例,介绍如何从中在线获取所需要的核酸序列,应用举例,1.进入,2.选择数据库,3.查询关键词,4.开始查询,显示格式,符合条件的记录数,每页显示数目,相关记录 点击进入,Genbank格式的序列记录,FASTA格式的序列记录,基因表达的 ORF分析,aagcaagacg ccaagggcca aggctggctg caagaagcaa

4、 agaggaacga acactgtgaa 61 tatcccaatg tcgatgatgg cttctgttca aatctgtcgg agattctctc ccctagtcgc 121 ccggccggcg atttactctg ccaattcttc attcctctca ccagtctctt tcgcctcttc 181 ttctctttca attatgccga tccgcctccg ctgcagagct tcagtacact ctgtccgcgc 241 cgcctccacc atgggggaca ccatcactga tgccaacatg gatgctgtcc agcgccgcc

5、t 301 catgtttgac gacgagtgta ttttggtgga tgagaatgac cgtgttgttg gtcatgatac 361 caagtataat tgtcatctta tggagaagat tgaatctgag aatctgcttc acagagcttt 421 cagtgttttc ttatttaatt caaactatga gttgcttctt cagcaacgat ctgcgacaaa 481 ggtcaccttc cctttggtgt ggactaacac ctgctgcagc catcctctgt accgggagtc 541 tgagttgatt gaa

6、gagaatg ctcttggtgt gaggaatgct gcacaaagaa agcttcttga 601 tgaactgggg attcctgcag aggatgtccc agttgatgaa ttcacaacat tgggccgtat 661 cctgtataaa gcaccttctg atgggagatg gggagagcat gaacttgatt atcttctctt 721 cattgtgagg gatgttggca tgcacccaaa cccggatgag gttgcagatg ttaaatatgt 781 gaatagggaa cagctgaaag agatcttgag g

7、aaagcaaat gctggagagg atggtataaa 841 gctttcccct tggttcagat tagtcgtcga aaatttcttg ttcaaatggt gggatcatgt 901 cgagaaaggc accctaatgg aagctgcaga tatgaaaacc attcacaagt tggcctaaac 961 agccattggc tgagcttttg ttaaaccctt acatctacca ttcacttaac tgagcaaaaa 1021 tatattctat ggtcttctgc ttagtttcat gcttcatgct tgaactttc

8、a agttttatgt 1081 tacttttggc tgttaggaac tagtaatata tgtgaacttg ctatcaaaaa aaaaaaaaaa 1141 aaaaaaaaaa aaaaa /,基因表达的ORF分析,利用计算机和互联网,对核酸序列的所有相位进行搜索可以很快地获得结果。国际互联网上的分析资源有:http:/www.ncbi.nlm.nih.gov/gorf/查找);http:/expasy.hcuge.ch/www/dna.html(将翻译为蛋白质)。,核酸序列的 比对分析,对核酸序列的首要分析是联网进行序列的同源性分析,以便能够利用最新的数据库反映该序列是

9、否是已知序列以及与已知序列同源性的高低。典型的分析是采用NCBI的BLAST软件对GENBANK中的非冗余数据库(non-redundant database,nr)进行查询。该数据库是对GENBANK、EMBL和DDBJ中去除所有相同核酸序列进行整合后所得到的最为全面的已知基因数据库,其中还包括了部分基因组的序列。,运行时联网至:http:/www.ncbi.nlm.nih.gov/BLAST 按照提示进行查询。,ggggtcgagt ccgcgtccac ccgcgagtac aaccttcttg cagctcctcc gtcgccggtc 61 cacacccgcc accagttcgc

10、 catggatgac gatatcgctg cgctcgtcgt cgacaacggc 121 tccggcatgt gcaaggccgg cttcgcgggc gacgatgctc cccgggccgt cttcccctcc 181 atcgtgggcc gccctaggca ccagggtgtg atggtgggta tgggtcagaa ggactcctac 241 gtgggcgacg aggcccagag caagagaggc atcctgaccc tgaagtaccc cattgaacac 301 ggcattgtca ccaactggga cgatatggag aagatttg

11、gc accacacttt ctacaatgag 361 ctgcgtgtgg cccctgagga gcaccctgtg ctgctcaccg aggcccctct gaaccctaag 421 gccaaccgtg aaaagatgac ccagatcatg tttgagacct tcaacacccc agccatgtac 481 gtagccatcc aggctgtgtt gtccctgtat gcctctggtc gtaccactgg cattgtgatg 541 gactccggag acggggtcac ccacactgtg cccatctatg agggttacgc gctccc

12、tcat 601 gccatcctgc gtctggacct ggctggccgg gacctgacag actacctcat gaagatcctg 661 accgagcgtg gctacagctt caccaccaca gctgagaggg aaatcgtgcg tgacattaaa 721 gagaagctgt gctatgttgc cctagacttc gagcaagaga tggccactgc cgcatcctct 781 tcctccctgg agaagagcta tgagctgcct gacggtcagg tcatcactat cggcaatgag 841 cggttccgat

13、gccccgaggc tctcttccag ccttccttcc tgggtatgga atcctgtggc 901 atccatgaaa ctacattcaa ttccatcatg aagtgtgacg ttgacatccg taaagacctc 961 tatgccaaca cagtgctgtc tggtggcacc accatgtacc caggcattgc tgacaggatg 1021 cagaaggaga ttactgccct ggctcctagc accatgaaga tcaagatcat tgctcctcct 1081 gagcgcaagt actctgtgtg gattggt

14、ggc tctatcctgg cctcactgtc caccttccag 1141 cagatgtgga tcagcaagca ggagtacgat gagtccggcc cctccatcgt gcaccgcaaa 1201 tgcttctagg cggactgtta ctgagctgcg ttttacaccc tttctttgac aaaacctaac 1261 ttgcgcaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa /,点击,点击,PCR引物设计,PCR基本原理,Mg2+,3-,C,-3,3-,-5,T,T,A,A,G,G,G,C,A,T,A,G,T,A,G,G,C

15、,5-,3-,-5,T,A,-3,5-,T,T,A,A,G,G,G,C,A,T,A,G,T,A,C,5-,因此,引物设计是整个工作的基础和关键。,引物设计的原则,1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38bp 2. 引物3端出现3 个以上的连续碱基,特别是GGG 或CCC,引物设计的原则,3.引物3端的末位碱基对Taq 酶的DNA 合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A 的错配效率明显高于其他3 个碱基。 4. 5端序列对PCR 影响不太大,因此常用来引进修饰位点或标记物。 5.引物二聚体或发夹结构也可能导致PCR 反应失败。,引物二聚体,Mg2+,C,G,T,A,T,T,A,A,G,G,G,C,A,T,T,A,A,G,G,G,C,A,T,A,G,G,C,G,A,A,T,Mg2+,-3,-3,3-,5-,-5,DNA 聚合酶,引物二聚体,Mg2+,C,G,T,A,T,T,A,A,G,G,G,C,A,T,T,A,A,G,G,G,C,A,T,A,G,G,C,G,A,A,T,Mg2+,-3,-3,3-,5-,-5,DNA 聚合酶,引物二聚体,Mg2+,C,G,T,A,T,T,A,A,G,G,G,C,A,T,T,A,A,G,G,G,C,A,T,A,G,G,C,G,A,A,T,Mg2+,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号