遗传信息的传递,第三篇,真核基因与基因组 DNA的生物合成 DNA的损伤和修复 RNA的生物合成 蛋白质的生物合成 基因表达调控 细胞信号转导,本篇学习内容,中心法则 (The Central Dogma),转 录,翻 译,逆转录,复 制,DNA,RNA,蛋白质,真核基因与基因组,第十三章,Eukaryote Gene and Genome,本 章 重 点,掌握概念:基因、基因组、断裂基因、顺式作 用元件、外显子、内含子 掌握真核基因基本结构 熟悉真核基因结构特点,除了某些以RNA为基因组的RNA病毒外,基因通常是指染色体或基因组的一段DNA序列 基因包括编码序列(外显子)、调控序列和间隔序列(内含子)基因(gene):编码蛋白质或RNA等具有特定功能产物的、负载遗传信息的基本单位基因组(genome):一个生物体内所有遗传信息的总和人类基因组包含了细胞核染色体DNA(常染色体和性染色体)及线粒体DNA所携带的所有遗传物质真核基因的结构与功能,第一节,The Structure and Function of Eukaryote Gene,利用碱基的不同排列荷载遗传信息 通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一过程中为适应环境变化,可能会发生基因突变。
作为基因表达(gene expression)的模板,使其所携带的遗传信息通过各种RNA和蛋白质在细胞内有序合成而表现出来基因的功能,与基因功能相关的结构,编码区序列(coding region sequence ),非编码序列(non-coding sequence),基因表达需要的调控区(regulatory region)序列,包括启动子(promoter)、增强子(enhancer)等在细胞内表达为蛋白质或功能RNA的DNA序列,一、真核基因的基本结构,编码序列,编码蛋白质或RNA,非编码序列,包括编码区两侧的调控序列和编码序列间的间隔序列真核基因结构不连续,为断裂基因(split gene)真核基因结构,外显子(exon);在基因序列中,出现在成熟mRNA分子上的序列 内含子(intron):外显子之间、与mRNA剪接过程中被删除部分相对应的间隔序列真核生物绝大部分编码蛋白质的基因都有内含子编码rRNA和一些tRNA的基因也都有内含子 内含子的数量和大小决定了真核基因的大小不同种属中,外显子序列通常比较保守,而内含子序列则变异较大 外显子与内含子接头处有一段高度保守的序列,(5GT-AG 3)RNA剪接的识别信号。
基因的5端称之为上游,3端称为下游 基因序列中开始RNA链合成的第一个核苷酸所对应的碱基记为+1,此碱基上游的序列记为负数,下游的序列记为正数二、基因编码区,基因的编码序列决定其编码产物的序列和功能 编码序列中一个碱基的改变或突变,可能使基因功能发生重要的变化 相同的DNA序列因起始位点的变化或不同的剪接方式而编码不同的蛋白质多肽链三、调控序列,位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的DNA序列,又称旁侧序列基因的调控区(顺式作用元件),转录起始点,TATA盒,CAAT盒,GC盒,增强子,AATAAA,剪接加尾,转录终止点,修饰点,外显子,翻译起始点,内含子,OCT-1,OCT-1:ATTTGCAT八聚体,+1,结构基因,启动子,上游启动子元件,启动子 上游调控元件 增强子 加尾信号 细胞信号反应元件,顺式作用元件,1. 启动子提供转录起始信号,启动子是DNA分子上能够介导RNA聚合酶结合并形成转录起始复合体的序列多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录 少数启动子(如编码tRNA基因的启动子)位于转录起始点的下游,这些DNA序列可以被转录真核生物有3类启动子,分别对应于细胞内存在的三种不同的RNA聚合酶和相关蛋白质。
2. 增强子增强邻近基因的转录,增强子是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平沉默子(silencer)是抑制基因转录的特定DNA序列,当其结合一些反式作用因子时对基因的转录起阻遏作用,使基因沉默3. 沉默子是负调节元件,真核基因组的结构与功能,第二节,The Structure and Function of Eukaryote Genome,基因组:细胞或生物体的一套完整单倍体遗传物质的总和一、真核基因组具有独特的结构,编码序列所占比例远小于非编码序列 含有大量的重复序列, 存在多基因家族和假基因 大多基因具有可变剪接,80%的可变剪接会使蛋白质的序列发生改变 基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞的基因组为二倍体结构特点:,二、真核基因组中存在大量重复序列,高度重复序列(highly repetitive sequence) 中度重复序列(moderately repetitive sequence) 单拷贝序列(single copy sequence)或低度重复序列,(一)高度重复序列,主要存在于染色体的着丝粒区域,重复单位一般由210 bp组成,成串排列,在人基因组中约占5%6%。
重复频率可达106以上,不编码蛋白质或RNA反向重复序列(inverted repeat sequence),卫星DNA(satellite DNA),两个相同顺序的互补拷贝在同一DNA链上反向排列而成,重复单位长度约300 bp,多数散在于基因组中,总长度约占人基因组的5 分类:,参与复制水平的调节 存在于DNA复制起点区的附近,是一些蛋白质(包括酶)的结合位点 参与基因表达的调控 可以转录到核内不均一RNA分子中,有些反向重复序列可以形成发夹结构,有助于稳定RNA分子 参与染色体配对 如卫星DNA成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关功能:,(二)中度重复序列,重复数十至数千次,大多数与单拷贝基因间隔排列短分散重复片段,长分散重复片段,平均长度约300 bp500 bp,与长度约为1000 bp的单拷贝序列间隔排列拷贝数可达数十万如Alu家族、KpnI家族、Hinf家族平均长度为3500 bp5000bp,与长度约为13000bp的单拷贝序列间隔排列在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因三)单拷贝序列(低度重复序列),三、真核基因组中存在大量的多基因家族与假基因,多基因家族是指由某一祖先基因经过重复和变异所产生的一组在结构上相似、功能相关的基因。
基因家族成簇地分布在某一条染色体上,同时发挥作用,合成某些蛋白质如组蛋白基因家族 基因家族的不同成员成簇地分布于不同染色体上,编码一组功能上紧密相关的蛋白质如球蛋白基因家族DNA序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称超家族基因 (superfamily gene),基因组中存在的一段与正常基因非常相似但不能表达的DNA序列假基因(psuedogene),四、线粒体DNA结构有别于染色体DNA,线粒体DNA(mitochondrial DNA,mtDNA)是核外遗传物质,能独立编码线粒体中的一些蛋白质 mtDNA的结构为环状分子,与原核生物的DNA类似不同生物体基因组的比较,五、人基因组中有两万多个基因,六、人的基因在染色体上的分布特征,人类基因组的染色体DNA,。