核酸序列分析课件

上传人:s9****2 文档编号:570098424 上传时间:2024-08-01 格式:PPT 页数:138 大小:9.17MB
返回 下载 相关 举报
核酸序列分析课件_第1页
第1页 / 共138页
核酸序列分析课件_第2页
第2页 / 共138页
核酸序列分析课件_第3页
第3页 / 共138页
核酸序列分析课件_第4页
第4页 / 共138页
核酸序列分析课件_第5页
第5页 / 共138页
点击查看更多>>
资源描述

《核酸序列分析课件》由会员分享,可在线阅读,更多相关《核酸序列分析课件(138页珍藏版)》请在金锄头文库上搜索。

1、核酸序列分析核酸序列分析核酸序列分析课件 核酸序列分析是生物信息学应用中的一个重核酸序列分析是生物信息学应用中的一个重要方面,一般包括:要方面,一般包括:DNA碱基组成、密码子的偏碱基组成、密码子的偏向、内部重复序列、特殊位点(限制性位点及转向、内部重复序列、特殊位点(限制性位点及转录、翻译和表达调控相关信号)、编码区分析、录、翻译和表达调控相关信号)、编码区分析、一二级结构等。一二级结构等。核酸序列分析课件第一节第一节 核酸序列的检索核酸序列的检索第二节第二节 核酸序列的基本分析核酸序列的基本分析第三节第三节 核酸序列的电子延伸核酸序列的电子延伸第四节第四节 基因的电子表达、定位分析基因的电

2、子表达、定位分析第五节第五节 基因识别基因识别第六节第六节 核酸序列的提交核酸序列的提交核酸序列分析课件一、一、 Entrez检索系统检索系统 (http:/www.ncbi.nlm.nih.gov/sites/gquery?itool=toolbar)二、二、 SRS 检索系统检索系统 (http:/srs.ebi.ac.uk)第一节第一节 核酸序列的检索核酸序列的检索三、三、DBGET/LinkDB检索检索核酸序列分析课件 通过软件,如通过软件,如BioEdit (http:/www.mbio.ncsu.edu/BioEdit/)、DNAMAN (http:/ 核酸序列的基本分析核酸序列的

3、基本分析一、一、 分子质量、碱基组成、碱基分布分子质量、碱基组成、碱基分布核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件二、二、 序列变换序列变换核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件三、限制性内切酶分析三、限制性内切酶分析 REBASE(Restriction Enzyme Database)限制酶数据库)限制酶数据库 (http:/)核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件1. 测序峰图的查看测序峰图的查看 澳大利亚澳大利亚Conor McCarthy开发的开发的Chromas.exe程序,程序,且且BioEdit软件和软

4、件和DNAMAN软件都可以查看。软件都可以查看。四、克隆测序的分析四、克隆测序的分析核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件2. 核酸测序载体序列的识别与去除核酸测序载体序列的识别与去除核酸序列分析课件核酸序列分析课件核酸序列分析课件 测序克隆被宿主菌核酸序列污染,或目的克隆来测序克隆被宿主菌核酸序列污染,或目的克隆来自于宿主菌,可通过自于宿主菌,可通过Blastn直接对直接对GenBank或或EMBL数据库进行相似性分析进行判断。数据库进行相似性分析进行判断。核酸序列分析课件RepBase重复序列数据库重

5、复序列数据库http:/www.girinst.org/server/RepBase/五、重复序列分析五、重复序列分析核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件cDNA文库文库EST较长较长cDNA全长全长cDNA第三节第三节 核酸序列的电子延伸核酸序列的电子延伸核酸序列分析课件1.5Kb500bp500bp500bp500bp核酸序列分析课件基本过程:基本过程:1. 通过通过Blast搜索搜索GenBank的的EST数据库,选择与待数据库,选择与待分析的序列具有较高同源性的分析的序列具有较高同源性的EST匹

6、配序列;匹配序列;2. 将匹配序列和待分析的序列装配产生新序列;将匹配序列和待分析的序列装配产生新序列;3. 以新序列作为待分析的序列重复上述过程,直至没以新序列作为待分析的序列重复上述过程,直至没有新的匹配序列,从而生成最后的新序列。有新的匹配序列,从而生成最后的新序列。核酸序列分析课件http:/blast.ncbi.nlm.nih.gov/Blast.cgi核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件第四节第四节 基因的表达、定位分析基因的表达、定位分析原理:原理:将待分析序列与将待分析序列与EST数据库进行序列对库检索,数据库进行序列对库检索,然后用与待分析核酸序列

7、具有高同源性的然后用与待分析核酸序列具有高同源性的EST序序列所对应的组织来源列所对应的组织来源进行推断而得到该基因的组进行推断而得到该基因的组织表达谱。织表达谱。一、基因的电子表达图谱分析一、基因的电子表达图谱分析核酸序列分析课件基本步骤:基本步骤:1. 通过通过Blast搜索搜索GenBank的的EST数据库,选择与待数据库,选择与待分析的序列具有最高同源性比分的分析的序列具有最高同源性比分的EST序列;序列;2. 从从NCBI的的UniGene数据库进行检索,得到相应的数据库进行检索,得到相应的UniGene号;号;3. 可通过参与形成可通过参与形成UniGene Cluster的序列的

8、组织的序列的组织/细细胞来源间接反映待分析序列在哪种组织中表达。胞来源间接反映待分析序列在哪种组织中表达。核酸序列分析课件核酸序列分析课件http:/www.ncbi.nlm.nih.gov/unigene核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件二、基因的电子定位分析二、基因的电子定位分析v通过序列标签位点(通过序列标签位点(STS)定位)定位v通过通过UniGene/RH技术定位技术定位v利用基因组序列定位利用基因组序列定位核酸序列分析课件利用利用NCBI的电子的电子PCR资源资源(http:/www.ncbi.nlm.nih.gov/

9、sutils/e-pcr/forward.cgi)1. 1. 利用利用STSSTS数据库进行定位数据库进行定位核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件进入进入NCBI的电子的电子PCR资源资源(http:/www.ncbi.nlm.nih.gov/sutils/e-pcr/forward.cgi)输入待分析的序列输入待分析的序列根据提供的根据提供的STS信息进行定位信息进行定位步步 骤:骤:核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件 获得待分析序列对应的获得待分析序列对

10、应的UniGene编号,而大部分编号,而大部分UniGene序列已经具有明确的定位信息,可以得序列已经具有明确的定位信息,可以得到待分析序列的基因定位。到待分析序列的基因定位。2. 2. 利用利用UniGeneUniGene数据库进行定位数据库进行定位核酸序列分析课件http:/www.ncbi.nlm.nih.gov/unigene核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件 v将待分析序列输入基因组数据库进行同源性检索;将待分析序列输入基因组数据库进行同源性检索;v得到确定的基因组序列后点击得到确定的基因组

11、序列后点击“Genome view”观察观察基因组结构;基因组结构;v点击红色标记所指示的染色体列表中选择对应的染点击红色标记所指示的染色体列表中选择对应的染色体及区域;色体及区域;v浏览器中将显示详细的基因定位结果。浏览器中将显示详细的基因定位结果。3.3.利用基因组序列进行定位利用基因组序列进行定位核酸序列分析课件BLAST搜索数据库进行基因定位搜索数据库进行基因定位核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件通过基因组数据库定位通过基因组数据库定位-NCBI基因组数据库基因组数据库核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列

12、分析课件核酸序列分析课件核酸序列分析课件基因定位基因定位核酸序列分析课件核酸序列分析课件核酸序列分析课件拟南芥基因组数据库拟南芥基因组数据库-基因定位基因定位核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件酵母基因组数据库酵母基因组数据库-基因定位基因定位核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件v步骤:步骤:获取目的序列;获取目的序列;预测可能的编码区和非编码区;预测可能的编码区和非编码区; 通过相关的数据以提高基因识别的准确性(数通过相关的数据以提高基因识别的准确性(数据库搜索);据库搜索); 利用生物信息学资源分析序列的功能。利用生物

13、信息学资源分析序列的功能。第五节第五节 基因识别基因识别v策略:策略: 先寻找并去掉重复的和复杂性较性较低的序列,再先寻找并去掉重复的和复杂性较性较低的序列,再寻找基因及相关调控区域。寻找基因及相关调控区域。核酸序列分析课件exon introexonexon53增强子增强子非翻译区非翻译区非翻译区非翻译区GC(-100)CAAT(-70)ATGTATA(-30)TAA/TAG/TGA帽位点帽位点(+1)终止终止位点位点polyA真核基因结构模式图真核基因结构模式图核酸序列分析课件v基因组外显子识别基因组外显子识别从基因组从基因组DNADNA序别中识别出完整的蛋白质编码序列,序别中识别出完整的

14、蛋白质编码序列,即外显子部分。即外显子部分。外显子与内含子之间无绝对区分;同一基因不同发育外显子与内含子之间无绝对区分;同一基因不同发育时空,外显子组成不相同;假基因的存在降低预测的时空,外显子组成不相同;假基因的存在降低预测的准确率。准确率。vESTEST策略的基因鉴定策略的基因鉴定电子克隆最主要的途径是从电子克隆最主要的途径是从ESTEST直接寻找新基因。确直接寻找新基因。确定目的定目的ESTEST,构建包含,构建包含ESTEST的重叠群,再进行的重叠群,再进行ORFORF的判的判定及蛋白结构域等功能域的识别。定及蛋白结构域等功能域的识别。一、生物信息学识别基因的两种途径一、生物信息学识别

15、基因的两种途径核酸序列分析课件v编码区是由核糖体翻译成蛋白质的编码区是由核糖体翻译成蛋白质的DNA序列序列 原核基因:编码区是一段不包含终止子的连续序列。原核基因:编码区是一段不包含终止子的连续序列。 真核基因:编码区是由内含子隔开的若干个可读框架。真核基因:编码区是由内含子隔开的若干个可读框架。二、编码区的分析二、编码区的分析核酸序列分析课件v终止密码子(终止密码子(TGA、TAA或或TAG)数量较少;)数量较少;vORF达到一定的长度;达到一定的长度;v密码子使用的偏好性,第密码子使用的偏好性,第3个碱基个碱基G/C出现的频率较高;出现的频率较高;v与已知基因比较有序列相似性;与已知基因比

16、较有序列相似性;v与模板序列的模式相匹配可能指示功能性位点的位置。与模板序列的模式相匹配可能指示功能性位点的位置。编码区的统计特征:编码区的统计特征:核酸序列分析课件 转录起始点、核糖体结合位点、起始密码子、转录起始点、核糖体结合位点、起始密码子、RNA剪接位点、终止密码子、剪接位点、终止密码子、poly(A)位点等。位点等。编码区的一些信号:编码区的一些信号:核酸序列分析课件 分析与基因表达调控相关的信息、各种功能位分析与基因表达调控相关的信息、各种功能位点及基因转录调控元件。点及基因转录调控元件。vDNA序列上特殊的片段,是蛋白质因子作用的序列上特殊的片段,是蛋白质因子作用的位点,是与基因

17、转录、翻译有关的信号序列。位点,是与基因转录、翻译有关的信号序列。v通过模式识别及生物信息软件分析。通过模式识别及生物信息软件分析。 三、非编码区的分析三、非编码区的分析核酸序列分析课件启动子启动子启动子启动子启动子启动子转录区转录区终止子终止子外显子外显子内含子内含子基因的一般结构基因的一般结构TATA box起始序列起始序列(TATAT/AAT/A)(C/TC/TCAA/GA/G)转录因子结合区转录因子结合区CCAATGC 核酸序列分析课件真核生物启动子真核生物启动子30bp,TATA box80bp,CAAT box80bp 110bp,GCCACACCC或或GGGCCGGGTATA盒使

18、转录精确地起始盒使转录精确地起始CAAT盒和盒和GC盒控制转录的起始频率盒控制转录的起始频率核酸序列分析课件http:/www.epd.isb-sib.ch 核酸序列分析课件http:/www-bimas.cit.nih.gov/molbio/proscan/ 核酸序列分析课件核酸序列分析课件http:/www-bimas.cit.nih.gov/molbio/signal/ 信号肽信号肽核酸序列分析课件核酸序列分析课件AuthorsSequinBankItSequence dataGenBankAccession number7 daysDraftrecord第六节第六节 核酸序列的提交核酸

19、序列的提交核酸序列分析课件BankItvBankIt是是NCBI提供的一个在线提交序列的工具。由一提供的一个在线提交序列的工具。由一系列表单,包括联络信息、发布要求、引用参考信息、系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。序列来源信息、以及序列本身的信息等。v用户提交序列后,会从电子邮件收到自动生成的数据条用户提交序列后,会从电子邮件收到自动生成的数据条目,目,Genbank的新序列编号,以及完成注释后的完整的新序列编号,以及完成注释后的完整的数据记录。的数据记录。核酸序列分析课件v用户还可以在用户还可以在BankIt页面下修改已经发布序列的信息。页面

20、下修改已经发布序列的信息。vBankIt适合于独立测序工作者提交少量序列,而不适适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列,合大量序列的提交,也不适合提交很长的序列,EST序列和序列和GSS序列也不用序列也不用BankIt提交。提交。核酸序列分析课件sequin 1. 大量的序列提交可以由大量的序列提交可以由Sequin程序完成。程序完成。 2. 能方便的编辑和处理复杂注释。能方便的编辑和处理复杂注释。 3. 提交来自系统进化、种群和突变研究的提交来自系统进化、种群和突变研究的 序列,可以加入比对的数据。序列,可以加入比对的数据。 4. 用于序列的分析,用

21、于序列的分析,FASTA或或ASN.1格式。格式。核酸序列分析课件http:/www.ncbi.nlm.nih.gov/guide/核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件核酸序列分析课件在线提交序列过程1.登陆BankIt页面 http:/www.ncbi.nlm.nih.gov/BankIt2.填写表单内容3.确认表单内容4.等待电子邮件返回信息核酸序列分析课件RNA analysishttp:/rna.tbi.univie.ac.at/核酸序列分析课件核酸序列分析课件核酸序列分析课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号