真核生物基因结构预测分析-he

上传人:ji****en 文档编号:107695805 上传时间:2019-10-20 格式:PDF 页数:87 大小:5.61MB
返回 下载 相关 举报
真核生物基因结构预测分析-he_第1页
第1页 / 共87页
真核生物基因结构预测分析-he_第2页
第2页 / 共87页
真核生物基因结构预测分析-he_第3页
第3页 / 共87页
真核生物基因结构预测分析-he_第4页
第4页 / 共87页
真核生物基因结构预测分析-he_第5页
第5页 / 共87页
点击查看更多>>
资源描述

《真核生物基因结构预测分析-he》由会员分享,可在线阅读,更多相关《真核生物基因结构预测分析-he(87页珍藏版)》请在金锄头文库上搜索。

1、真核生物基因结构的预测分析 1 2 基因组序列基因组序列 cDNA序列序列 编码区预测编码区预测 Codon bias GC Content 限制性酶切位点限制性酶切位点 基因结构分析基因结构分析 选择性剪切选择性剪切 转录调控因子转录调控因子 序列比对序列比对 功能注释功能注释 KEGG GO 系统发育树系统发育树 蛋白质序列蛋白质序列 翻翻 译译 蛋白质理化性质蛋白质理化性质 二级结构预测二级结构预测 结构域分析结构域分析 重要信号位点分析重要信号位点分析 三级结构预测三级结构预测 基因组功能分析基因组功能分析 基因预测基因预测 DNADNA序列中编码区的鉴定序列中编码区的鉴定 预测方法的

2、依据预测方法的依据: : 编码统计学:编码区序列同非编码区序列相比,有编码统计学:编码区序列同非编码区序列相比,有 不同的特点,存在一些非随机的特点不同的特点,存在一些非随机的特点 GC GC 含量含量 密码子偏倚性密码子偏倚性 (CODON FREQUENCY)(CODON FREQUENCY) 第三个碱基组成第三个碱基组成 基因结构基因结构/ /统计学方法统计学方法 比较比较/ /同源性同源性 原核生物基因结构原核生物基因结构 Gene structure of prokaryoteGene structure of prokaryote 编码区 启动子Promoter 转录起始位点(TS

3、S) transcriptional start site 非翻译区 untranslated region, UTR 转录区transcribed region 起始密码子 initiation codon 终止密码子 termination codon 53 转录终止位点(TTS) Transcription termination site RBS 5 转录区transcribed region 起始密码子 initiation codon 终止密码子 termination codon 3 外显子exon 切除和拼接位点 Resection and splice sites 内含子 i

4、ntron 真核生物基因结构 Gene structure of eukaryota 转录起始位点(TSS) transcriptional start site 非翻译区 untranslated region, UTR 转录终止位点(TTS) Transcription termination site 启动子Promoter HMM?一种统计分析模型,现成为信号处理的一个重要方向,成 功用于语音识别、行为识别、文字识别以及故障诊断等领域。 HMM 描述了模型中各隐含状态的转换概率 基因组序列基因组序列 ATGCGTGCAGTCACCAGCAGTCAGTCG Introns Exon 隐含

5、状态隐含状态 用于基因预测的隐马尔可夫模型 Hidden Markov Models ,HMM ATGCGTGCAGTCACCAGCAGTCAGTCG 基因组序列基因组序列 特定状态碱基对的概率取决于它前面碱基对的状态 向另一种状态的转换概率取决于转换信号的出现(剪切位 点) 和/或 在特定隐藏状态的碱基对平均数量 (即内含 子或外显子大小). IntronsExon P= 0.5 P= 0.8 基因组序列基因组序列 ATGCGTGCAGTCACCAGCAGTCAGTCG 用于基因预测的隐马尔可夫模型用于基因预测的隐马尔可夫模型 生物信息学的内容生物信息学的内容 8 1、开放阅读框的识别、开放

6、阅读框的识别 开放阅读框(open reading frame, ORF) 是一段起始密码子和终止密码子之间的碱基序列 ORF 是潜在的蛋白质编码区 CAAT box GC box AATAAA Enhancer TATA boxExon Intron GGCTCAATCTTATAATAAT 9 Program used to search ORFProgram used to search ORF ORF Finder http:/www.ncbi.nlm.nih.gov/gorf/gorf.html NCBI通用 BestORF 例子1: 水稻6PGDH基因进化分析的结果表明其 可能来源于

7、内共生 (基因结构分析表明其没有内含子). 例子2:NHX基因 52 2)启动子序列分析: 什么是启动子? 启动子序列,一般在TSS之前2000bp, 了解哪个位点是TSS(Transcription Strart Site),哪个是 起始ATG? TSSATGTATA promoter 53 2)启动子序列分析: 所以,我们必须得到TSS的位置. 如何通过生物信息学方法确定TSS? 首先截取包括ATG之前3000bp和基因的序列采用以下两 种方法 1)软件预测,如Softberry; 2)搜索EST数据库; 54 分析的目的: 2)首先找到ATG前面约3000: 如何通过生物信息学方法确定T

8、SS? 以AF486280为例. 首先要找到包含AF486280的基因组序列. 55 2)首先截取ATG之前3000bp序列 以AF486280为例.首先要找到包含AF486280的基因组序列. 56 57 58 59 Map viewer-该基因在染色体上的形象定位该基因在染色体上的形象定位 60 Promoter Scan http:/www-bimas.cit.nih.gov/molbio/proscan/ 62 选择性剪接选择性剪接(Alternative splicing)分析分析 指从一个mRNA前体中通过不同的剪接方式(选择不同的剪接位点组合)产生不同的mRNA 剪接异构体的过程

9、,而最终的蛋白产物会表现出不同或者是相互拮抗的功能和结构特性, 或者,在相同的细胞中由于表达水平的不同而导致不同的表型。 若可变剪接产生的mRNA编码框不同:a.可在同一细胞中产生多种蛋白质。b.在不同细胞中 有不同的剪接方式,表现出组织特异性。c.在不同发育时期或不同条件下采取不同剪接方 式,表达不同蛋白。 选择性剪接是调控基因表达的重要机制 了解不同物种、细胞、发育阶段、环境压力下基因的调控表达机制 选择性剪接的类型选择性剪接的类型 63 5端选择性剪接位点 恒定外显子 可变外显子 外显子遗漏 内含子保留 互斥外显子 3端选择性剪接位点 64 查询选择性剪接相关的网站查询选择性剪接相关的网

10、站 http:/www.ebi.ac.uk/astd/main.html 综合综合 http:/splicenest.molgen.mpg.de/综合综合 http:/rulai.cshl.edu/new_alt_exon_db2/综合综合 http:/prosplicer.mbc.nctu.edu.tw/ http:/www.bit.uq.edu.au/altExtron 人人 http:/www.cse.ucsc.edu/kent/intronerator/altsplice.html线虫线虫 http:/www.tigr.org/tdb/e2k1/ath1/altsplicing/spl

11、icing_variations.shtml拟南芥拟南芥 从已知基因的功能推测剪接机制从已知基因的功能推测剪接机制 选择性剪接查询:选择性剪接查询:ASTD数据库数据库(Service!) 65 http:/www.ebi.ac.uk/astd/main.html 输入基因名称输入基因名称 选择物种类型选择物种类型 ASTD数据库检索结果:基因描述信息 66 导出序列文件导出序列文件 ASTD数据库检索结果:选择性剪接的数据库检索结果:选择性剪接的mRNA 67 十十 一一 种种 选选 择择 性性 剪剪 切切 产产 物物 ASTD数据库检索结果:表达的组织特异性 68 在不同组织中各在不同组织

12、中各 种选择性剪接体种选择性剪接体 的表达差异的表达差异 十一种不同的选十一种不同的选 择性剪接产物择性剪接产物 69 基因结构分析基因结构分析 开放读码框开放读码框 GENSCAN GENOMESCAN CpG岛岛CpGPlot 启动子启动子/转录起始位点转录起始位点PromoterScan 转录终止信号转录终止信号POLYAH 密码子偏好分析密码子偏好分析CodonW mRNA剪切位点剪切位点 NETGENE2 Spidey 选择性剪切选择性剪切ASTD 基因结构分析常用软件基因结构分析常用软件 课堂练习 练习两种预测剪切位点的软件的使用, NetGene2和Spidey。 70 71 2

13、)启动子序列分析: 所以,我们必须得到TSS的位置. 如何通过生物信息学方法确定TSS? 首先截取包括ATG之前3000bp和基因的序列采用以下两 种方法 1)软件预测,如Softberry; 2)搜索EST数据库; 72 分析的目的: 2)首先找到ATG前面约3000: 如何通过生物信息学方法确定TSS? 以AF486280为例. 首先要找到包含AF486280的基因组序列. 73 74 75 76 Map viewer-该基因在染色体上的形象定位该基因在染色体上的形象定位 77 Promoter Scan http:/www- bimas.cit.nih.gov/molbio/prosca

14、n/ 序列序列模体的查找和可视化模体的查找和可视化工具工具 (Motif)序列中局部的保守区域或一组序列中 共有的一段序列模式 MEME FIMO 限制性限制性核酸内切酶位点核酸内切酶位点分析分析 Vector NTI (需要购买) Services/Applications/Cloning/vector-nti-software.html?CID=fl-bioinformatics Webcutter(网络版) http:/rna.lundberg.gu.se/cutter2/ 只要进行基因工程利用必须用到各种限制性内切酶 如 GGATCC BamHI 82 进行酶切位点分析的时候,对于构建

15、载体,我们需要知进行酶切位点分析的时候,对于构建载体,我们需要知 道的信息是你的序列中有道的信息是你的序列中有/没有某个酶的位点?没有某个酶的位点? 为什么?为什么? 如果答案是“有”,是什么情况?“没有”又是什么情如果答案是“有”,是什么情况?“没有”又是什么情 况?况? Plasmid vector Sac I XbaI Hind III Hind IIIXba I Cloning site SacI 重复序列重复序列的的查找查找 REPFINDE m 研究主要集中在核苷酸序列的存储、分类、 检索和分析等方面 新基因的发现 非蛋白编码区生物学意义的分析 基因组整体功能及其调节网络的系统把握 基因组演化与物种演化 基因组分析基因组分析 生物信息学的内容生物信息学的内容 85 实习一实习一基因组数据注释和功能分析基因组数据注释和功能分析 实习二实习二真核生物基因结构的预测分析真核生物基因结构的预测分析 实习三实习三芯片的基本数据处理和分析芯片的基本数据处理和分析 实习四实习四蛋白质结构与功能分析蛋白质结构与功能分析 实习五实习五蛋白质组学数据分析蛋白质组学数据分析 实习六实习六系统生物学软件实习系统生物学软件实习 课程内容课程内容 基因组学基因组学 转录组学转录组学 蛋白质组学蛋白质组学 系 统 生 物 学 系 统 生 物 学 Thanks! 86 87

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 电子/通信 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号