文档详情

第二十五章基因结构分析的基本策略

m****
实名认证
店铺
PPT
2.35MB
约78页
文档ID:570502390
第二十五章基因结构分析的基本策略_第1页
1/78

目目 录录第二十五章第二十五章基因结构分析的基本基因结构分析的基本策略策略Basic strategy for analyzing gene structure 目目 录录主要内容:主要内容:第一节第一节 基因序列结构的生物信息学检索和比基因序列结构的生物信息学检索和比对对 分析分析第二节第二节 基因转录起始点的鉴定基因转录起始点的鉴定第三节第三节 启动子的结构及功能分析启动子的结构及功能分析第四节第四节 编码序列结构分析编码序列结构分析 目目 录录第一节第一节 基因序列结构的生物信息学基因序列结构的生物信息学检索和比对分析检索和比对分析 目目 录录•就就是是在在数数据据库库中中对对基基因因序序列列或或DNADNA序序列列进进行行 比比对对分分析析,,以以其其能能够够推推测测出出其其结结构构、、功功能能及及在在进化上的联系进化上的联系. .•比对方法:比对方法: 1. 1. 双重比对双重比对 2. 2. 多序列比对多序列比对序列比对目的:序列比对目的:•判断两个或多个序列间是判断两个或多个序列间是否具有足够的相似性否具有足够的相似性从而判断二者之间是否具从而判断二者之间是否具有同源性有同源性直接的数量关系直接的数量关系进化上曾具有共同祖先进化上曾具有共同祖先•基因或基因或DNADNA序列比对序列比对 目目 录录序列比对的结果:序列比对的结果:•取代取代•插入插入•缺失缺失Mouse:GGKDSCQGDSGGPVVCNG----QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAANCrayfish: GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV--缺失?缺失?保守序列保守序列保守序列:保守序列:•可能是共同进化的标志可能是共同进化的标志•可能并不代表功能的重要性可能并不代表功能的重要性插入?插入?•当两个序列非常相似时,是否一定当两个序列非常相似时,是否一定说明它们具有相似的功能?说明它们具有相似的功能? 目目 录录•NCBI数据库数据库NCBI首先创建首先创建GenBank数据库数据库 •于于19911991年年开开发发了了Entrez数数据据库库检检索索系系统统,,该该系系统统整整合合了了GenBank、、EMBL、、PIR和和SWISS-PROT等等数数据据库库的的序序列列信信息息以以及及MEDLINEMEDLINE有有关关序序列列的的文文献献信信息息,,并并通通过过相相关关链链接接,,将将他他们们有机地结合在一起有机地结合在一起•NCBI还还提提供供了了其其他他数数据据库库,,包包括括在线人人类类孟孟德德尔尔遗遗传传( (OMIM))、、三三维维蛋蛋白白结结构构的的分分子子模模型型数数据据库库((MMDB))、、人人类类基基 因因 序序 列列 集集 成成 (( UniGene)) 、、 人人 类类 基基 因因 组组 基基 因因 图图 谱谱((GMHG)、生物门类()、生物门类(Toxonomy)) 等数据库等数据库 目目 录录 目目 录录1. 1. 各种数据库的介绍各种数据库的介绍(1) Nucleotide•该数据库由国际核苷酸序列数据库成员美国该数据库由国际核苷酸序列数据库成员美国国立卫生研究院国立卫生研究院GenBank、日本、日本DNADNA数据库数据库( (DDBJ) )和英国和英国Hinxton Hall的欧洲分子生物学的欧洲分子生物学实验室数据库实验室数据库( (EMBL)三部分数据组成)三部分数据组成•三个组织每天交换各自数据库中的新增序列三个组织每天交换各自数据库中的新增序列实现数据共享实现数据共享 目目 录录(2) Genome•即即基基因因组组数数据据库库,,提提供供了了多多种种基基因因组组、、完完全全染染色体、重叠序列图谱以及一体化基因物理图谱色体、重叠序列图谱以及一体化基因物理图谱(3) Structures•即结构数据库或称分子模型数据库即结构数据库或称分子模型数据库( (MMDB) ),包,包含来自含来自X X线晶体学和三维结构的实验数据线晶体学和三维结构的实验数据•NCBI已已经经将将结结构构数数据据交交叉叉链链接接到到书书目目信信息息、、序序列列数数据据库库和和NCBI的的Taxonomy中中运运用用NCBI的的3D结结构构浏浏览览器器和和Cn3D,,可可以以很容易地从很容易地从Entrez获得分子的分子结构间相互作用的图像获得分子的分子结构间相互作用的图像 目目 录录(4) Taxonomy•即生物学门类数据库,可以按生物学门类进行检即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等索或浏览其核苷酸序列、蛋白质序列、结构等(5) PopSet•包含研究一个人群、一个种系发生或描述人群包含研究一个人群、一个种系发生或描述人群变化的一组组联合序列变化的一组组联合序列•PopSet既包含了核酸序列数据又包含了蛋白质既包含了核酸序列数据又包含了蛋白质序列数据序列数据 目目 录录(7) (7) 文献数据库文献数据库•PubMed::生物医药科学的检索系统生物医药科学的检索系统 •OMIM::孟孟德德尔尔遗遗传传学学数数据据库库是是人人类类基基因因和和基基因疾病的目录数据库因疾病的目录数据库•其他:书目,杂志,文章引用匹配等其他:书目,杂志,文章引用匹配等•该该数数据据库库包包括括原原文文信信息息、、图图片片和和参参考考信信息息,,同同时时还还可可以以链链接接到到Entrez系系统统MEDLINE数数据据库中相关文献和序列信息库中相关文献和序列信息 目目 录录2. NCBI数据库检索数据库检索 •在检索框中输入检索词,检索词间默认逻辑关在检索框中输入检索词,检索词间默认逻辑关系为系为AND,检索规则基本同,检索规则基本同PubMed •可可以以通通过过下下拉拉菜菜单单选选择择记记录录的的显显示示格格式式,,通通常常选选择择GenBank Report格式或格式或FASTA Report格式。

格式•当当选选择择GenBank Report格格式式后后,,屏屏幕幕显显示示较较完完整整的的基基因因记记录录,,包包括括::基基因因位位点点( (Locus))、、基基因因定定义义( (Definition))、、基基因因存存取取号号( (Accession))、、 核核酸酸编编号号( (NID ))、、关关键键词词( (Keywords))、、 来来源源( (Source))、、组组织织分分类类( (Organism) )、、参参考考文文献献( (Reference) )、、 著著者者( (Author))、、题题目目( (Title))、、期期刊刊( (Journal))、、Medline存存取取号号( (Medline)) 、、 序序 列列 特特 征征 ( (Features)) 、、 基基 因因 ( (Gene)) 、、CDS((cDNA))、、等等位位基基因因( (Allele)) 对对等等的的肽肽( (Mat-Peptide ))、、计算碱基数计算碱基数( (Base Count)、原序列)、原序列( (Origin)•而而FASTA Report格式仅包括检出序列的简要特征描述。

格式仅包括检出序列的简要特征描述 目目 录录例如:人例如:人EPOEPO基因序列检索基因序列检索•输入关键词,选择合适的程序输入关键词,选择合适的程序 目目 录录•向下拉寻找符合目标的条目向下拉寻找符合目标的条目 目目 录录•点击此条打开连接点击此条打开连接 目目 录录•向下拉寻找关注的内容向下拉寻找关注的内容 目目 录录•凡是连接的地方都可以点击查看凡是连接的地方都可以点击查看•可以直接拷贝保存相关内容可以直接拷贝保存相关内容 目目 录录•Entrez:: 是一个用以整合是一个用以整合NCBI数据库中信数据库中信息的搜寻和检索工具息的搜寻和检索工具 3. 3. NCBI数据库搜索工具数据库搜索工具 •BLAST::是是一一个个NCBINCBI开开发发的的序序列列相相似似搜搜索索程程序序,,还还可可作作为鉴别基因和遗传特点的手段为鉴别基因和遗传特点的手段 •NCBI提提供供的的附附加加软软件件工工具具有有::开开放放阅阅读读框框寻寻觅觅器器((ORF Finder)),,电电子子PCR,,和和序序列列提提交交工工具具,,Sequin和和BankIt •Entrez的的一一个个强强大大和和独独特特的的特特点点是是检检索索相相关关的的序序列列,,结结构构,,和和参参考考文献的能力文献的能力    目目 录录•Entrez: 目目 录录•BLAST: 目目 录录•BLAST程序程序程序程序 数据库数据库 查询查询 内容内容Blastp 蛋白质蛋白质 蛋白质蛋白质 使用取代矩阵寻找较远的关系:使用取代矩阵寻找较远的关系: 可以进行可以进行SEG过滤过滤Blastn 核苷酸核苷酸 核苷酸核苷酸 寻找较高分值的匹配,对较远关系寻找较高分值的匹配,对较远关系 不太适用不太适用Blastx 核苷酸核苷酸 蛋白质蛋白质 对于新的对于新的DNA序列和序列和ESTs的分析极的分析极 (翻译)(翻译) 为有用为有用Tblastn 蛋白质蛋白质 核苷酸核苷酸 对于寻找数据库中没有标注的编码对于寻找数据库中没有标注的编码 (翻译)(翻译) 区极为有用区极为有用Tblastx 核苷酸核苷酸 核苷酸核苷酸 对于分析对于分析EST极为有用极为有用 (翻译)(翻译) (翻译)(翻译) 目目 录录点击核酸序列点击核酸序列blast,在框内输入序列:,在框内输入序列: 目目 录录选择搜索条件:选择搜索条件: 目目 录录选择特殊程序:选择特殊程序: 目目 录录比较两个序列之间的相似性:比较两个序列之间的相似性: 目目 录录 以上仅简介了以上仅简介了NCBI相关数据库及工相关数据库及工具软件关于其他数据库及软件工具等信息见具软件关于其他数据库及软件工具等信息见书中第二十五章表书中第二十五章表1-51-5。

目目 录录第二节第二节 基因转录起始点的鉴定基因转录起始点的鉴定 目目 录录主要内容:主要内容:一、基因转录起始点的序列特征一、基因转录起始点的序列特征二、基因转录起始点的序列分析二、基因转录起始点的序列分析 目目 录录一、基因转录起始点的序列特征一、基因转录起始点的序列特征 TATA box CAAT box GC box 增强子增强子 顺式作用元件顺式作用元件 结构基因结构基因-GCGC---CAAT---TATA转录起始点转录起始点1. 1. 真核基因及其调控元件真核基因及其调控元件 目目 录录II 型启动子的型启动子的TSS::•没有明确的保守序列没有明确的保守序列•有有一一种种趋趋势势,,即即mRNA 的的第第一一个个碱碱基基是是A,,其侧翼碱基倾向于是嘧啶其侧翼碱基倾向于是嘧啶•与与mRNA第一个碱基对应的位置标记为第一个碱基对应的位置标记为-1-1区区•-3 ~ +5-3 ~ +5区域被称作起始子区域被称作起始子 ( (initiator) )2. 2. 转录起始点(转录起始点(TSS))+10+20Start site-10-20-30-40+1ATGATG-3+5Initiator Py2CAPy5 目目 录录二、基因转录起始点的序列分析二、基因转录起始点的序列分析思考:思考:•转转录录起起始始点点 ( (TSS) )位位于于基基因因编编码码序序列列的的5 5 端端•基基因因编编码码区区是是指指能能体体现现在在多多肽肽链链中中的的核核苷苷酸酸序列序列•多肽链是以多肽链是以mRNA为模板经翻译合成的为模板经翻译合成的因此,因此,分析鉴定分析鉴定TSS的方法都是以的方法都是以cDNA为切入点为切入点 目目 录录1. 1. cDNA克隆测序克隆测序AAAAAnAAAAAnAAAAAnmRNA反转录酶AAAAAnOligo (dT)15-18TTTTT15-18cDNA第一链CCCCCTTTTT15-18cDNA第一链nCCCCnGGGGcDNA第二链克隆扩增,5端测序分析反转录酶的末端转移酶活性Oligo (dG)15-18mRNA与线性载体相连接要求:cDNA的5端完整无缺 目目 录录2. 2. cDNA末端快速扩增技术末端快速扩增技术( (RACE) )•传统的传统的RACE::AAAAAnmRNAAAAAAnTTTTT15-18cDNAmRNA-53-反转录酶Oligo (dT)15-18末端转移酶dGTPTTTTT15-18nGGGGG锚定PCR扩增TTTTT15-18nGGGGGnCCCCC锚定引物特异引物PCR产物 目目 录录•Deep-RACE:: 用寡核苷酸替代mRNA的5′端帽结构以及发光标记巢氏PCR引物实现高通量鉴定转录起始点 AAAAAn5-p 帽mRNA牛小肠磷酸酶 (CIP)AAAAAn5-帽烟草酸焦磷酸酶 (TAP) AAAAAn5-将5-RACE adaptor (寡核苷酸)加到脱帽RNA分子上AAAAAn5-RACE adaptor (寡核苷酸)反转录酶10nt 随机引物 目目 录录5-RACE adaptor5-RACE adaptor5-RACE adaptor5-RACE adaptor长短不同的cDNA随机引物用10nt随机引物与5-RACE引物进行PCR扩增5-RACE adaptor5-RACE adaptor5-RACE adaptor5-RACE adaptorPCR产物随机引物以5’-RACE引物和5’端甩尾的基因特异性反向引物进行巢氏PCR 5-RACE adaptor以5’-RACE发光标记引物对PCR混合物直接进行一次性测序分析基因转录起始点 目目 录录3.3.连续分析基因转录起始点连续分析基因转录起始点 •在RACE的基础上,通过在转录本5 ′端引入一个特殊的II型限制性核酸内切酶识别位点,实现了基因5 ′端短片段串联连接产物一次测序分析多个基因转录起始点的目的•主要有两种方法:主要有两种方法:•5 ′端连续分析基因表达(5 ′ -end serial analysis of gene expression, 5 ′ SAGE)•帽分析基因表达(cap analysis gene expression, CAGE) 目目 录录(1) 5 ′ SAGE•5′SAGE是在PCR过程中将MmeI酶切位点引物cDNA的5′端,通过酶切和连接获得不同短片段重复序列,并对重复序列进行测序获得大量片段序列信息 •不同序列的短片段代表不同基因的转录起始点 (TSS) MmeI:•是一种特殊的II型限制性核酸内切酶•识别的序列不是回文结构,而是不对称的DNA序列5′-TCCRAC-3′(R代表G或A)•在识别位点下游18~20碱基处切开双链DNA 目目 录录GpppAAAAAAAAnmRNA用BAP和TAP处理AAAAAAAAnp在RNA的5端加上寡核苷酸帽AAAAAAAAn5XhoIMmeI反转录酶RT5AAAAAAAAn5cDNAPCRBiotin-标记引物随机引物55BiotinMmeI酶切消化520 mer5Biotin亲和素用亲和素-生物素,可以将5-端片段与其他片段分离开 目目 录录520 mer连接5Biotin5Biotin520 merPCR扩增55Biotin5Biotin5XhoI酶切消化自身连接串联体测序分析 目目 录录(2) CAGECAGE与5′SAGE非常相似所不同的是:•CAGE不 需 要 在 RNA上 加 接 头 , 而 是 用oligo(dT)引物先进行第一链cDNA的合成•然后通过捕获帽结构,将含有MmeI和另一内切酶位点如XmaJI的linker加到单链全长cDNA的3′末端 目目 录录AAAAAAnCapmRNA反转录酶Oligo (dT)15~18AAAAAAnCapTTTTTTTncDNA捕获5-帽结构单链linker连接TTTTTTTnBiotincDNA第二链的合成TTTTTTTnAAAAAAnMmeIXmaJIMmeI酶切亲和素20 mer用亲和素-生物素,可以将5-端片段与其他片段分离开 目目 录录连接第二个linkerXbaIXmaJIXmaJI, Xbal酶切消化PCR(用linker1和linker2作引物)Linker 1Linker 2纯化,串联连接,克隆20 merXmaJI和XbaI是同尾酶:XmaJI:C^CTAGGXbaI: T^CTAGA串联体测序分析 目目 录录第三节第三节 启动子的结构及功能分析启动子的结构及功能分析 目目 录录主要内容:主要内容:一、启动子的结构分析一、启动子的结构分析二、启动子的功能分析二、启动子的功能分析 目目 录录启动子(启动子(promoter))•是一段能被蛋白质识别的、参与特定基因转录调控的DNA序列•II型启动子通常位于结构基因的上游•共通序列(consensus sequence)是其特征性序列•共通序列和启动子所处的位置是研究启动子的重要线索 目目 录录+10+20Start site-10-20-30-40+1ATGATG-3+5Initiator 共通序列共通序列例如:•原核基因的共通序列:-10区:Pribnow box(T77A76T60A61A56T82序列)-35区:T69T79G61A56C54A54 序列 •真核基因的共通序列: 真核基因启动子在-50区域附近(大约5%~30%基 因 启 动 子 在 -25~-30区 域 ) 有 TATA box(TATAAA序列)TATAATTTGACA 目目 录录一、启动子的结构分析一、启动子的结构分析主要方法:主要方法:•利用利用PCR技术克隆启动子技术克隆启动子•利用核酸利用核酸- -蛋白质相互作用方法研究启动子蛋白质相互作用方法研究启动子•生物信息学预测启动子生物信息学预测启动子 目目 录录(一)利用(一)利用PCRPCR技术克隆启动子技术克隆启动子特异性基因序列基因上游序列基因组DNA根据基因序列合成一条反向引物正向引物用随机引物PCR扩增随机引物特异引物克隆及测序分析注意:•真核基因有内含子,应该根据mRNA序列设计特异性引物•特异性引物尽可能靠近基因的5端1. 1. 根据已知基因序列直接进行根据已知基因序列直接进行PCR扩增扩增 目目 录录2. 2. 利用利用TSS钓取启动子钓取启动子AAAAAAnCap 5-mRNA反转录AAAAAAnTTTTTTncDNA插入载体,克隆扩增Cap 5-以基因特异引物与载体引物配对PCR扩增5-测序分析基因转录起始点序列以TSS序列为引物,基因组序列为模板,与随机引物配对进行TSS上游序列的PCR扩增 目目 录录3. 3. 利用环状利用环状PCR钓取启动子钓取启动子基因组DNA酶切消化基因组DNA片段直接环化连接加上接头后环化连接根据基因上游序列设计一对反向互补引物PCR扩增根据接头序列设计引物PCR扩增克隆测序分析克隆测序分析•加接头环化PCR不依赖特异基因序列•可用于筛选启动子接头 目目 录录(二)利用核酸(二)利用核酸- -蛋白质互作方法研究启动子蛋白质互作方法研究启动子•启动子是一段能被蛋白质识别和结合的DNA序列,因此,能够检测核酸-蛋白质相互作用的研究方法都可以用于启动子的研究中 主要方法:•足迹法(酶足迹法,化学足迹法)•电泳迁移率变动实验(EMSA)•染色体免疫沉淀(ChIP) 目目 录录1. 1. 用足迹法研究启动子用足迹法研究启动子足迹法(Footprinting)•利用DNA电泳条带连续性中断的图谱特点判断与蛋白质结合的DNA区域 基本流程:DNA与蛋白质相互作用切割DNA凝胶电泳分析电泳图谱蛋白与未标记的竞争DNA结合蛋白与标记的DNA结合凝胶电泳放射自显影 目目 录录((1 1)酶足迹法)酶足迹法 ( (Enzymatic footprinting) ) 利用能切割DNA的酶处理DNA-蛋白质混合物,然后通过电泳进行分析 • DNase I足迹法足迹法 (DNase I footprinting) 是一种利用DNase I 随机切割双链DNA,从而确定DNA结合蛋白在DNA上结合位点的方法 • 核酸外切酶核酸外切酶IIIIII足迹法足迹法 (Exonucleoase III footprinting) 是利用核酸外切酶III(Exo III)的35外切酶活性从3末端切割双链DNA的特性,确定蛋白质在DNA上的结合位点的常用方法 目目 录录DNase I 足迹法足迹法dsDNA单链末端标记DNA结合蛋白DNase I酶切消化(控制反应时间)产生长短不同的片段但蛋白质结合区被保护 目目 录录蛋白质结合区MNo-proPro-DNA对在凝胶上出现空白区域的DNA进行克隆测序,即可确定结合蛋白质的DNA序列变性凝胶电泳 目目 录录((2 2)化学足迹法)化学足迹法 ( (Chemical footprinting) ) •是利用能切断DNA骨架的化学试剂处理DNA-蛋白质复合物,从而通过化学试剂无法接近结合蛋白质的DNA区域而确定DNA的蛋白质结合位点主要方法:•羟自由基足迹法 •体内足迹法 目目 录录1 1)羟自由基足迹法)羟自由基足迹法((Hydroxyl radical footprinting)) 化学试剂羟自由基•利用化学试剂产生的羟自由基攻击DNA分子表面脱氧核糖骨架使DNA断裂•当DNA结合蛋白将脱氧核糖遮盖时,自由羟基无法攻击而使这个区域的DNA受到保护 电泳图谱上出现空白区的地方就是结合蛋白质的DNA变性凝胶电泳 目目 录录2 2)体内基足迹法)体内基足迹法((In vivo footprinting)) •用化学试剂对活细胞进行体内处理,使DNA在细胞内受到化学修饰,然后裂解细胞,用化学法或酶法进行足迹实验。

•甲基化干扰实验甲基化干扰实验 (Methylation interference assay) 是利用化学试剂如硫酸二甲酯(Dimethyl sulfate, DMS)对活细胞DNA进行甲基化修饰,从而干扰蛋白质与DNA的结合 •乙基化干扰实验乙基化干扰实验 (Ethylation interference assay) 是利用化学试剂对活细胞DNA进行乙基化修饰,从而干扰蛋白质与DNA的结合 目目 录录化学试剂提取DNADNase I 或化学试剂变性凝胶电泳分析切割DNA•化学修饰对蛋白质与DNA的结合有干扰,因此,体内足迹实验也叫干扰实验•电泳图谱需与未修饰的DNA样品进行比较,在未修饰样品中出现空白区的位置是体内发生化学修饰的DNA区域正常对照化学修饰提取DNA 目目 录录2. 2. 用电泳迁移率变动实验研究启动子用电泳迁移率变动实验研究启动子电泳迁移率变动实验电泳迁移率变动实验 (Electrophoretic mobility shift assay, EMSA)•是利用结合蛋白质的DNA片段在凝胶中迁移滞后的特点,通过电泳分离研究核酸-蛋白质互作的方法•又称为凝胶阻滞实验(Gel retardation assay) 目目 录录细胞蛋白质提取物标记的DNA片段蛋白质与DNA结合蛋白质-DNA复合物电泳迁移滞后凝胶电泳显影滞后条带表明DNA是与蛋白质结合的区域 目目 录录3.3.用染色体免疫沉淀技术研究启动子用染色体免疫沉淀技术研究启动子染色体免疫沉淀染色体免疫沉淀(Chromatin immunoprecipitation, ChIP)•是在保持蛋白质与染色体DNA结合的同时,将染色体切割成小片段并沉淀下来 •非变性非变性ChIP:是先用核酸酶处理细胞核,将染色体消化成碎片,然后用合适的抗体将结合有蛋白质的染色体片段通过免疫沉淀选择出来,再以PCR或核酸杂交技术对DNA序列进行分析 •变性变性ChIP:是先用甲醛处理细胞,使蛋白质与DNA在细胞内发生交联,然后分离染色体并进行剪切,用特异性抗体与DNA结合蛋白相结合,以沉淀法分离DNA-蛋白质复合体 前面章节已介绍,这里不再详述 目目 录录(三)生物信息学预测启动子(三)生物信息学预测启动子•真核基因组的测序正在以不断增长的速度进行着,目前已经可以获得大约50个完整真核生物基因组的序列信息,•预计在未来几年内将会完成更多的基因组测序工作•对基因组注释工作中最难的就是精确鉴定和描绘启动子,因此,启动子的预测就显得非常重要 预测启动子的切入点•启动子的结构特征•启动子在染色体上的位置 目目 录录1. 1. 启动子的结构特征启动子的结构特征典型启动子核心启动子:一般在TSS上游-35区域以内近端启动子:一般涉及TSS上游几百个碱基远端启动子:一般涉及TSS上游几千个碱基 含有增强子或沉默子•一些特征性的结构 TSS附近的CG岛经常出现在启动子中共通序列 (consensus sequence) 目目 录录2. 2. 启动子的预测分析启动子的预测分析•EPD (Eukaryotic promoter databases)•TRRD (Transcription regulatory regions databases)•基因转录起始点数据库 (DBTSS) •启动子数据库启动子数据库 这些数据库主要通过计算机识别、判断及分析,在数据库中寻找启动子的特异性特征结构。

目目 录录二、启动子的功能分析二、启动子的功能分析•启动子通常是基因上游参与基因转录调控的DNA序列由于启动子中的顺式作用元件在基因的特异性表达中发挥重要作用,因此,可以通过连接报告基因研究启动子的功能1. 1. 报告基因报告基因 ( (Reporter gene) )•是研究者们为了制造一种可在细胞培养条件下或动植物体内作为筛选标志的易检测信号,通过分子生物学操作将发光蛋白或酶的编码基因附加到一个感兴趣基因上或插入基因调控序列下游,从而监测感兴趣基因的表达或分析基因调控序列的活性 目目 录录•常用的报告基因常用的报告基因•荧光蛋白编码基因:绿色荧光蛋白 (GFP)红色荧光蛋白 (dsRed)•蛋白酶:荧光素酶 (luciferase)-半乳糖苷酶•在蓝色光源照射下发绿光•能催化荧光素 (luciferin)发生氧化反应发光•能使细菌在X-gal存在条件下变成蓝色 目目 录录2. 2. 报告基因的应用报告基因的应用•监测基因的转染效率监测基因的转染效率 报告基因与目的基因分别插入各自启动子下游,实现报告基因的组成性表达模式•监控目的基因的表达监控目的基因的表达 报告基因与目的基因融合共同受控于一个启动子,报告基因的表达即代表目的基因的表达•研究启动子的活性研究启动子的活性 报告基因插入被研究启动子下游,通过观察报告基因的表达情况推测启动子活性 目目 录录启动子捕获技术 (promoter trapping):是一种研究启动子活性的筛选方法•基本流程:构建启动子捕获载体观察报告基因的表达 报告基因MCSori候选启动子序列插入MCS转染细胞观察报告基因的表达启动子捕获载体 目目 录录第四节第四节 编码序列结构分析编码序列结构分析 目目 录录编码序列编码序列 ( (coding sequence) ):: 通常是指能体现在蛋白质氨基酸序列中的基因信息 主要内容主要内容一、基因编码序列的结构特征一、基因编码序列的结构特征二、基因编码序列的结构分析二、基因编码序列的结构分析 目目 录录一、基因编码序列的结构特征一、基因编码序列的结构特征基因的编码序列具有一些特征性序列比如:•开放阅读框架•蛋白质翻译的起始密码子和终止密码子•真核基因的外显子(编码序列)和内含子(非编码序列)之间有特殊序列 目目 录录(一)开放阅读框架(一)开放阅读框架开放阅读框架 (open reading frame, ORF)•是指生物基因组中含有能潜在编码蛋白质的一段核苷酸序列 •在基因序列中,ORF位于起始密码子(start codon)和终止密码子(stop codon)之间 密码子:•是由三个核苷酸组成的DNA序列,也称作三联密码子•生物体基因组中总共有64种密码子,其中三个终止密码子,61个编码氨基酸的密码子 目目 录录分析一段DNA序列中是否存在ORF: 从理论上说,一般需要对双链DNA序列的6种阅读框架进行分析,每一条链分析三种阅读框架 例如:1)5-UCU AAA AUG GGU GAC-3 (其中AUG是起始密码子)2)5-U CUA AAA UGG GUG AC-33)5-UC UAA AAU GGG UGA C-3 (其中UAA是终止密码子)只有真正的ORF可以不遇到终止密码子 目目 录录(二)(二)mRNAmRNA选择性剪接的序列特征选择性剪接的序列特征 mRNA的选择性剪接 (alternative splicing):•是指基因外显子转录产物RNA以不同方式进行切割再连接的过程•经剪接所产生的mRNA可以翻译成不同的蛋白质,从而导致一个基因可以编码一个以上蛋白质 真核基因的内含子在与外显子交界区域有共通序列 (consensus sequences):•内含子的5端有GU序列,3端有AG序列 目目 录录(三)基因外显子的序列特征(三)基因外显子的序列特征基因外显子可以被分成三部分•能够被翻译成蛋白质的编码区•5-非翻译区(5UTR)•3-非翻译区(3UTR) •有作为蛋白质翻译起始重要元件的Kozak序列: 由起始密码子AUG及其周围序列组成 •3UTR位于终止密码子下游,含有poly A尾的加尾信号AATAAA序列 目目 录录二、基因编码序列的结构分析二、基因编码序列的结构分析•基因的编码序列是指能体现在成熟mRNA中的核苷酸序列,因此,与mRNA互补的cDNA成为研究编码序列的主要切入点.主要方法:•cDNA文库的编码序列筛选•RNA剪接分析编码序列•用数据库分析编码序列•高通量分析RNA剪接的方法主要有三种:基于DNA微点阵分析、交联免疫沉淀(CLIP)和体外报告基因测定法 •对各种方法所获得的cDNA片段的序列在基因数据库中进行同源性比对, 通过染色体定位分析、内含子/外显子分析、ORF分析及表达谱分析等 目目 录录小结:小结:•基因结构分析的切入点已经从一个基因的克隆测序,发展到如今在基因组范围的高通量筛选,因此,研究策略也发生了变化,基因数据库在不知不觉中占据了重要地位。

•基因结构特点成为基因组范围内高通量扫描基因的重要靶标,基因的转录起始点、启动子以及编码序列是基因的重要结构特征 。

下载提示
相似文档
正为您匹配相似的精品文档