《真核基因与基因组》由会员分享,可在线阅读,更多相关《真核基因与基因组(37页珍藏版)》请在金锄头文库上搜索。
1、第三篇第三篇 基因信息的传递基因信息的传递中中心心法法则则(central dogma) :1958年年F.Crick提提出出。1970年年H.Temin发发现现逆逆转转录录现现象象,补补充充中心法则。中心法则。DNARNA蛋白质蛋白质转录转录翻译翻译逆转录逆转录复制复制遗遗 传传 学学 中中 心心 法法 则则复制复制?第三篇第三篇基因信息的传递基因信息的传递包括内容:包括内容: 第十三章第十三章 真核基因与基因组真核基因与基因组 第十四章第十四章 DNA的生物合成的生物合成 第十五章第十五章 DNA的损伤和修复的损伤和修复 第十六章第十六章 RNA的生物合成的生物合成 第十七章第十七章 蛋白
2、质的生物合成蛋白质的生物合成 第十八章第十八章 基因表达调控基因表达调控 第十九章第十九章 细胞信号转导细胞信号转导 第十三章第十三章 真核基因与基因组真核基因与基因组基基因因(gene):编编码码生生物物活活性性产产物物的的DNA功功能能片片段段,以以碱碱基基排排列列顺顺序序贮贮存存遗遗传传信信息息。由由Johannsen于于1909年首先提出。年首先提出。除了某些以除了某些以RNA为基因组的为基因组的RNA病毒外,基因病毒外,基因通常是指染色体或基因组的一段通常是指染色体或基因组的一段DNA序列。序列。基因包括基因包括编码序列编码序列(外显子)、(外显子)、调控序列调控序列和和间间隔序列隔
3、序列(内含子)(内含子)。基因组(基因组(genome):):一个生物体内所有一个生物体内所有遗传信息的总和。遗传信息的总和。人类基因组包含了细胞人类基因组包含了细胞核染色体核染色体DNA(常染色体和性染色体)及(常染色体和性染色体)及线粒体线粒体DNA所所携带的所有遗传物质。携带的所有遗传物质。 真核基因的结构与功能真核基因的结构与功能 第一节第一节The Structure and Function of Eukaryote Gene利用碱基的不同排列荷载遗传信息。利用碱基的不同排列荷载遗传信息。 通过复制将遗传信息稳定、忠实地遗传给子代通过复制将遗传信息稳定、忠实地遗传给子代细胞,在这一
4、过程中为适应环境变化,可能会细胞,在这一过程中为适应环境变化,可能会发生基因突变。发生基因突变。 作为基因表达(作为基因表达(gene expression)的模板,使)的模板,使其所携带的遗传信息通过各种其所携带的遗传信息通过各种RNA和蛋白质在和蛋白质在细胞内有序合成而表现出来。细胞内有序合成而表现出来。 n 基因的功能基因的功能单个基因的组成结构及一个完整的生物体内基因单个基因的组成结构及一个完整的生物体内基因的组织排列方式统称为的组织排列方式统称为基因组构基因组构(gene organization)。)。n 与基因功能相关的结构与基因功能相关的结构编码区序列(编码区序列(coding
5、 region sequence )非编码序列(非编码序列(non-coding sequence)基因表达需要的调控区(基因表达需要的调控区(regulatory region)序列,包括启动子(序列,包括启动子(promoter)、增强子)、增强子(enhancer)等。)等。在细胞内表达为蛋白质或功能在细胞内表达为蛋白质或功能RNA的的DNA序列序列一、真核基因的基本结构一、真核基因的基本结构编码蛋白质或编码蛋白质或RNA的的编码序列编码序列。非编码序列非编码序列,包括编码区两侧的调控序列和,包括编码区两侧的调控序列和编码序列间的间隔序列。编码序列间的间隔序列。真核基因结构不连续,为真核
6、基因结构不连续,为断裂基因(断裂基因(split gene)。真核基因结构真核基因结构外显子外显子(exon);在基因序列中,出现在成熟);在基因序列中,出现在成熟mRNA分子上的序列。分子上的序列。内含子内含子(intron):外显子之间、与):外显子之间、与mRNA剪接过程剪接过程中被删除部分相对应的间隔序列。中被删除部分相对应的间隔序列。真核生物绝大部分编码蛋白质的基因都有内含子。真核生物绝大部分编码蛋白质的基因都有内含子。编码编码rRNA和一些和一些tRNA的基因也都有内含子。的基因也都有内含子。内含子的数量和大小决定了真核基因的大小。不内含子的数量和大小决定了真核基因的大小。不同种属
7、中,外显子序列通常比较保守,而内含子同种属中,外显子序列通常比较保守,而内含子序列则变异较大。序列则变异较大。外显子与内含子接头处有一段高度保守的序列,外显子与内含子接头处有一段高度保守的序列,这一共有序列是真核基因中这一共有序列是真核基因中RNA剪接的识别信号。剪接的识别信号。基因的基因的5 端称之为上游,端称之为上游,3 端称为下游端称为下游基因序列中开始基因序列中开始RNA链合成的第一个核苷酸所链合成的第一个核苷酸所对应的碱基记为对应的碱基记为+1,此碱基上游的序列记为负,此碱基上游的序列记为负数,下游的序列记为正数。数,下游的序列记为正数。二、基因编码区编码多肽链和特定的二、基因编码区
8、编码多肽链和特定的RNA分子分子 基因的编码序列决定其编码产物的序列和功能。基因的编码序列决定其编码产物的序列和功能。编码序列中一个碱基的改变或突变,可能使基编码序列中一个碱基的改变或突变,可能使基因功能发生重要的变化。因功能发生重要的变化。相同的相同的DNA序列因起始位点的变化或不同的剪序列因起始位点的变化或不同的剪接方式而编码不同的蛋白质多肽链。接方式而编码不同的蛋白质多肽链。基因编码区中的基因编码区中的DNA碱基序列碱基序列决定特定的成决定特定的成熟熟RNA分子的序列,即分子的序列,即DNA的一级结构决定着的一级结构决定着其转录产物其转录产物RNA分子的一级结构。分子的一级结构。三、调控
9、序列参与真核基因表达调控三、调控序列参与真核基因表达调控 位于基因转录区前后,对基因表达起调控作位于基因转录区前后,对基因表达起调控作用的区域,因其是紧邻的用的区域,因其是紧邻的DNA序列,又称旁侧序序列,又称旁侧序列。列。基因的调控区(顺式作用元件)基因的调控区(顺式作用元件)启动子启动子上游调控元件上游调控元件增强子增强子加尾信号加尾信号细胞信号反应元件细胞信号反应元件转录起始点转录起始点TATA盒盒CAAT盒盒GC盒盒增强子增强子AATAAA剪接加尾剪接加尾转录终止点转录终止点修饰点修饰点外显子外显子翻译起始点翻译起始点内内含含子子 OCT-1 OCT-1:ATTTGCAT八聚体八聚体+
10、1结构基因结构基因启动子启动子上游启动子元件上游启动子元件1. 启动子提供转录起始信号启动子提供转录起始信号 启动子启动子是是DNA分子上能够介导分子上能够介导RNA聚合酶聚合酶结合并形成转录起始复合体的序列。结合并形成转录起始复合体的序列。多数启动子位于真核细胞基因转录起点的上游,多数启动子位于真核细胞基因转录起点的上游,启动子本身通常不被转录。启动子本身通常不被转录。少数启动子(如编码少数启动子(如编码tRNA基因的启动子)位于基因的启动子)位于转录起始点的下游,这些转录起始点的下游,这些DNA序列可以被转录。序列可以被转录。真核生物有真核生物有3类启动子,分别对应于细胞内存类启动子,分别
11、对应于细胞内存在的三种不同的在的三种不同的RNA聚合酶和相关蛋白质。聚合酶和相关蛋白质。 能能够够在在相相对对于于启启动动子子的的任任何何方方向向和和位位置置(上上游游或或者者下下游游)上发挥这种增强作用,大部分位于上游。上发挥这种增强作用,大部分位于上游。增增强强子子序序列列距距离离所所调调控控基基因因距距离离近近者者几几十十个个碱碱基基对对,远远的可达几千个碱基对。的可达几千个碱基对。通常数个增强子序列形成一簇。通常数个增强子序列形成一簇。有时增强子序列也可位于内含子之中。有时增强子序列也可位于内含子之中。不同的增强子序列结合不同的调节蛋白。不同的增强子序列结合不同的调节蛋白。2. 增强子
12、增强邻近基因的转录增强子增强邻近基因的转录增强子增强子是增强真核基因启动子工作效率的顺是增强真核基因启动子工作效率的顺式作用元件,是真核基因中最重要的调控序列,式作用元件,是真核基因中最重要的调控序列,决定着每一个基因在细胞内的表达水平。决定着每一个基因在细胞内的表达水平。沉沉默默子子(silencer)是是抑抑制制基基因因转转录录的的特特定定DNA序序列列,当当其其结结合合一一些些反反式式作作用用因因子子时时对对基基因的转录起阻遏作用,使基因沉默。因的转录起阻遏作用,使基因沉默。3. 沉默子是负调节元件沉默子是负调节元件真核基因组的结构与功能真核基因组的结构与功能 第二节第二节The Str
13、ucture and Function of Eukaryote Genome基因组基因组:细胞或生物体的一套完整单:细胞或生物体的一套完整单倍体遗传物质的总和。倍体遗传物质的总和。一、真核基因组具有独特的结构一、真核基因组具有独特的结构基因的基因的编码序列编码序列所占比例远所占比例远小小于非编码序列。于非编码序列。高等真核生物基因组含有大量的高等真核生物基因组含有大量的重复序列重复序列,真核基因组中存在真核基因组中存在多基因家族和假基因多基因家族和假基因。大多基因具有大多基因具有可变剪接可变剪接,80%80%的可变剪接会使的可变剪接会使蛋白质的序列发生改变。蛋白质的序列发生改变。基因组基因组
14、DNADNA与蛋白质结合形成与蛋白质结合形成染色体染色体,储存于,储存于细胞核内,除配子细胞外,体细胞的基因组细胞核内,除配子细胞外,体细胞的基因组为二倍体。为二倍体。结构特点:结构特点:二、真核基因组中存在大量重复序列二、真核基因组中存在大量重复序列 高度重复序列(高度重复序列(highly repetitive sequence)中度重复序列(中度重复序列(moderately repetitive sequence)单拷贝序列(单拷贝序列(single copy sequence)或低度重复序列)或低度重复序列(一)高度重复序列(一)高度重复序列主要存在于染色体的着丝粒区域,重复单位一般
15、由主要存在于染色体的着丝粒区域,重复单位一般由2-10 bp组成,成串排列,在人基因组中约占组成,成串排列,在人基因组中约占5%-6%。重复频率可达重复频率可达106以上,不编码蛋白质或以上,不编码蛋白质或RNA。反向重复序列(反向重复序列(inverted repeat sequence)卫星卫星DNA(satellite DNA)两个相同顺序的互补拷贝在同一两个相同顺序的互补拷贝在同一DNA链上反向排列而成,链上反向排列而成,重复单位长度约重复单位长度约300 bp,多数散在于基因组中,总长度约占,多数散在于基因组中,总长度约占人基因组的人基因组的5 。分类:分类:l参与复制水平的调节参与
16、复制水平的调节 存在于存在于DNA复制起点区的附近,是一些蛋白复制起点区的附近,是一些蛋白质(包括酶)的结合位点。质(包括酶)的结合位点。l参与基因表达的调控参与基因表达的调控 可以转录到核内不均一可以转录到核内不均一RNA分子中,有些反分子中,有些反向重复序列可以形成发夹结构,有助于稳定向重复序列可以形成发夹结构,有助于稳定RNA分子。分子。l参与染色体配对参与染色体配对 如如 卫星卫星DNA成簇样分布在染色体着丝粒附近,成簇样分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关。可能与染色体减数分裂时染色体配对有关。功能:功能:(二)中度重复序列(二)中度重复序列重复数十至数千次重
17、复数十至数千次,大多数与单拷贝基因间大多数与单拷贝基因间隔排列。隔排列。短分散重复片段短分散重复片段长分散重复片段长分散重复片段平均长度约平均长度约300 bp-500 bp,与长度约为,与长度约为1000 bp的单拷贝序列间隔排列。拷贝数可达数十万。的单拷贝序列间隔排列。拷贝数可达数十万。如如Alu家族、家族、KpnI家族、家族、Hinf家族。家族。平均长度为平均长度为3500 bp-5000bp,与长度约为,与长度约为13000bp的单拷贝序列间隔排列。的单拷贝序列间隔排列。l重复达重复达3050万次万次,每个成员的长度约每个成员的长度约300 bp。l每个单位长度中一个限制性内切酶每个单
18、位长度中一个限制性内切酶Alu的切点的切点(AGCT),将其切成长),将其切成长130bp和和170bp的两段。的两段。Alu家族家族l仅次于仅次于Alu家族的第二大家族,家族的第二大家族,l重复序列中含有限制性内切酶重复序列中含有限制性内切酶Kpn的位点的位点l呈散在分布,拷贝数约为呈散在分布,拷贝数约为3000-4800个个KpnI家族家族l以以319bp长度的串联重复存在于人基因组中长度的串联重复存在于人基因组中l重复序列中含有限制性内切酶重复序列中含有限制性内切酶Hinf I的位点。的位点。Hinf家族家族rRNA基因重复序列属于中度重复序列基因重复序列属于中度重复序列l各重复单位中的
19、各重复单位中的rRNA基因都是相同的。基因都是相同的。lrRNA基因集中成簇存在,这样的区域称为基因集中成簇存在,这样的区域称为rDNA区。区。l人类的人类的rRNA基因位于基因位于13、14、15、21和和22号染色体的核仁组织区,每个核仁组织区平号染色体的核仁组织区,每个核仁组织区平均含有均含有50个个rRNA基因的重复单位。基因的重复单位。l5SrRNA基因似乎全部位于基因似乎全部位于1号染色体,每个号染色体,每个单倍体基因组约有单倍体基因组约有1000个个5SrRNA基因。基因。在单倍体基因组中只出现一次或数次,在单倍体基因组中只出现一次或数次,大多数为蛋白质编码的基因。大多数为蛋白质
20、编码的基因。(三)单拷贝序列(低度重复序列)(三)单拷贝序列(低度重复序列)三、真核基因组中存在大量的多基三、真核基因组中存在大量的多基因家族与假基因因家族与假基因多多基基因因家家族族是是指指由由某某一一祖祖先先基基因因经经过过重重复复和和变变异异所所产产生生的的一一组组在在结结构构上上相相似似、功功能能相相关关的基因。的基因。基基因因家家族族成成簇簇地地分分布布在在某某一一条条染染色色体体上上,同同时时发发挥挥作作用,合成某些蛋白质。如组蛋白基因家族。用,合成某些蛋白质。如组蛋白基因家族。基基因因家家族族的的不不同同成成员员成成簇簇地地分分布布于于不不同同染染色色体体上上,编编码一组功能上紧
21、密相关的蛋白质。如球蛋白基因家族。码一组功能上紧密相关的蛋白质。如球蛋白基因家族。 DNA序列相似,但功能不一定相关的若序列相似,但功能不一定相关的若干个单拷贝基因或若干组基因家族总称。干个单拷贝基因或若干组基因家族总称。超家族基因超家族基因 (superfamily gene)基因组中存在的一段与正常基因非常相似基因组中存在的一段与正常基因非常相似但不能表达的但不能表达的DNA序列。以序列。以 来表示。来表示。假基因(假基因(psuedogene)四、线粒体四、线粒体DNA结构有别于染色体结构有别于染色体DNA线线粒粒体体DNA(mitochondrial DNA,mtDNA)是是核核外外遗
22、遗传传物物质质,能能独独立立编编码码线线粒粒体体中中的的一一些些蛋白质。蛋白质。mtDNA的的结结构构为为环环状状分分子子,与与原原核核生生物物的的DNA类似,结构特点也与原核生物相似。类似,结构特点也与原核生物相似。人的线粒体基因组人的线粒体基因组线粒体基因组编码线粒体基因组编码37个基因,包括个基因,包括13个编个编码呼吸链多酶体系的一码呼吸链多酶体系的一些多肽的基因、些多肽的基因、22个编个编码码mt-tRNA的基因、的基因、2个编码个编码mt-rRNA(16S和和12S)的基因。)的基因。物种物种基因基因组组大小大小(Mb)基因数基因数染色体数染色体数*支原体支原体 M. genita
23、lium0.58470无无流感嗜血杆菌流感嗜血杆菌 H. influrnzae1.831743无无枯草芽枯草芽孢孢桿菌桿菌 B. subtilis4.204100无无大大肠肠杆菌杆菌 E. coli 4.604288无无酿酿酒酵母酒酵母 S. cerevisiae 13.50603416裂殖酵母裂殖酵母 S. pombe12.50492916燕麦燕麦 O. sativa4663000021果果蝇蝇 D. melanogaster165136014秀秀丽隐丽隐杆杆线线虫虫 C. elegans97184246小鼠小鼠 mouse27003000020人人 H. sapiens3000250002
24、3不同生物体基因组的比较不同生物体基因组的比较五、人基因组中有两万多个基因五、人基因组中有两万多个基因基因组大小和基因数量在生物进化中基因组大小和基因数量在生物进化中可能并不具有特别重要的意义,人类的基可能并不具有特别重要的意义,人类的基因较其他生物体可能更为因较其他生物体可能更为“有效有效”,其发,其发挥功能的方式与其他生物不同。挥功能的方式与其他生物不同。六、人的基因在染色体上的分布特征六、人的基因在染色体上的分布特征人类基因组的染色体人类基因组的染色体DNA 基因在染色体上并不是均匀分布。基因密基因在染色体上并不是均匀分布。基因密度最大的是第度最大的是第19号染色体,密度最小的是第号染色体,密度最小的是第13号和号和Y染色体。染色体。染色体上存在着无基因的染色体上存在着无基因的“沙漠区沙漠区”,即,即在在500kb区域内,没有任何基因的编码序列。区域内,没有任何基因的编码序列。基因在染色体上的分布特征基因在染色体上的分布特征