真核生物基因组DNA序列的复杂度.doc

上传人:大米 文档编号:544396693 上传时间:2022-12-22 格式:DOC 页数:6 大小:285KB
返回 下载 相关 举报
真核生物基因组DNA序列的复杂度.doc_第1页
第1页 / 共6页
真核生物基因组DNA序列的复杂度.doc_第2页
第2页 / 共6页
真核生物基因组DNA序列的复杂度.doc_第3页
第3页 / 共6页
真核生物基因组DNA序列的复杂度.doc_第4页
第4页 / 共6页
真核生物基因组DNA序列的复杂度.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《真核生物基因组DNA序列的复杂度.doc》由会员分享,可在线阅读,更多相关《真核生物基因组DNA序列的复杂度.doc(6页珍藏版)》请在金锄头文库上搜索。

1、第二节 真核生物基因组DNA序列的复杂度一、重复序列的检测真核生物基因组DNA C值的巨大差异提出了一个重要的问题,是否C值愈大的物种就含有更多的基因?还是基因数目并未增加而是含有大量不编码蛋白质的重复序列DNA?如果是基因数目随着C值大小而增加,那么编码这些结构基因的单一DNA序列的数量也应随之增加,相反如基因组中DNA含大量不编码的重复序列,那么基因的数目就不一定与C值成比例增加。为此可通过复性动力学来检测基因组DNA序列的复杂性(sequence complesity of DNA poputation)。也就是通过DNA的变性(denaturation)和复性(renaturation

2、)反应的动力学过程分析DNA序列的性质,由于复性的速率取决于互补的DNA序列之间的随机碰撞, 所以DNA复性是一个双分子二级反应。单链消失速度其中:C为单链DNA的浓度(单位是每升的核苷酸摩尔数);t为时间(单位为s);k为重组速率常数(单位是Lmols),k取决于阳离子浓度、温度、片段大小和DNA序列的复杂性。当t=0时,CC0,表明所有DNA都是单链,C0为DNA总浓度。复性的分数CC0是起始浓度和经过时间的乘积C0t的函数,这样的函数绘成图称为C0t曲线(图7-3)。从方程式可见控制复性反应的参数是C0t,如当tt1/2时,即如果基因组中每一种基因只有一个,即都是单拷贝序列,那么基因组愈

3、大则基因组的复杂性愈大,复性速率愈小,k也愈小,所以C0t1/2与非重复序列的基因组大小呈正比。即图6-3表明,C0t1/2与基因组的大小成正比。其中polyUpolyA,其kC0t1/2=1个核苷酸对,因而复性最快;MS2是RNA噬菌体,T4为DNA噬菌体,每个基因组的大小用箭头标于图的上方。二、DNA序列的类别不同生物基因组的C0t1/2是不相同的,C0t1/2的位置除了决定于基因组的大小以外,还取决于每个基因的核苷酸序列的重复次数,重复次数愈少则复性愈慢,C0t1/2的位置愈后,重复次数愈多,C0t1/2位置愈前。真核生物基因组的复性曲线往往出现两个或3个明显不同的C0t1/2位置,说明

4、这类基因组中包含着重复次数显然不同的几个成分(图7-4),该图是假设的一个真核生物基因组复性曲线。从上图可以看出,最后复性这部分DNA的C0t1/2630,它占全部DNA的45,相当于3.0108bp,重复频率为1;中间这部分DNA的C0t1/2=1.4,占全部DNA的30,相当于60105bp,该DNA序列重复频率为350;复性最快部分DNA的C0t1/20.0013,占基因组DNA的25,相当于340bp,重复频率为5105。显然第一部分,即复性最慢的部分是单拷贝DNA序列,第二部分为少量重复或中度重复DNA序列,第三部分为高度重复DNA序列。因此真核生物基因组序列大致可分为许多类型。 (

5、一)单拷贝序列(unique sequence)亦称非重复序列(nonrepetitive sequence)在一个基因组中只有一个拷贝或2-3个拷贝。真核生物的大多数基因在单倍体中都是单拷贝的。不同生物基因组中单拷贝序列所占的比例是不同的(图7-5)。原核生物中一般只含有非重复序列,较低等的真核生物中大部分DNA也是单拷贝的。动物细胞基因组中将近50DNA是中度或高度重复的,特别是植物和两栖类生物中单拷贝DNA序列降低,而中度和高度重复序列增加。从图中还可看出,随着生物的基因组大小的增加,非重复DNA片段长度也随之增加,通常单拷贝序列比较短,只有1000bp左右,故所占的DNA的百分比也很低

6、。两栖类和植物基因组C值的增加并非是单拷贝序列的增加,而是重复序列DNA比例的增加。非重复DNA很少达到2109bp的。由此可见,非重复DNA含量和生物的相对复杂程度是一致的。而且大多数结构基因是位于基因组的非重复DNA序列之中。单拷贝的基因编码许多重要的蛋白质,例如,丝心蛋白单拷贝基因能够合成高达104的mRNA分子,每个mRNA分子又可合成出105个蛋白质分子,这充说明单拷贝基因的高度表达能力。当然也不是所有的单拷贝序列都是编码多肽链的结构基因,因为真核生物基因组中编码的序列不过只有百分之几。(二)中度重复序列(moderately repetitive sequence)中度重复序列中的

7、重复单位平均长度约300bp,重复次数为10102,人的珠蛋白(红血蛋白)基因属于这种少量重复序列,人的珠蛋白基因中除了包括已确定的8个珠蛋白功能基因和3个珠蛋白假基因外,还有一个近年发现的基因。假基因也属于少量重复序列。另一类中度重复序列的重复次数为103105,该序列常以回文序列方式出现在基因组的许多位置上,一些回文序列中间间隔着单拷贝序列,另一些中间不存在单拷贝序列,所以经变性复性后,前者可观察到茎-环结构,后者则形成发夹图像(图7-6)。中度重复序列一般是不编码的序列,这种重复序列和非重复序列一样都不是一个长序列,它们都要被其他组分所隔断。(三)高度重复序列(highly repeti

8、tive sequence)顾名思义,高度重复序列就是在基因组中存在大量拷贝的序列,一般重复次数在106以上。通常这些序列的长度为6200bp,如卫星DNA。这些重复序列大部分集中在异染色质区,特别是在着丝粒和端粒附近。高度重复序列中常有一些AT含量很高的简单串联重复序列。因序列简单,缺乏转录所必需的启动子,故没有转录能力。然而DNA复制能力却和单一序列复制得一样快。大多数高等真核生物DNA都有20以上的高度重复序列,而且数目变化很大,这类序列的多少对C值的影响可能最大。一般认为大多数重复序列是过剩的DNA,但其中某些重复序列具有特殊的功能,如调节基因的表达,增强同源染色体之间的配对和重组,维

9、持染色体结构的稳定性,调节mRNA前体的加工过程,参与DNA复制等,此外重复序列还可能是进化的源泉之一。但是,重复序列的确切生物学意义尚有待阐明。三、卫星DNA卫星DNA(satellite DNA)是一类高度重复的DNA序列。各种DNA在氯化铯梯度离心中,平衡时的浮力密度决定于它的GC含量,GC含量越高,浮力密度越大。真核生物的DNA一般含有3050GC含量,在DNA的不同区段,GC含量约相差10。对一个物种来说,当基因组DNA切断成数百个碱基对的片段进行超离心时,其浮力密度曲线是覆盖一定浮力密度范围的一条宽带,但是有些DNA片段都含有异常高或低的GC含量,常在主要DNA带的前面或后面有一个

10、次要的DNA带相伴随,这些小的区带就像卫星一样围绕着DNA主带,故称卫星DNA。有的高度重复序列的碱基组成与基因组DNA总体的碱基组成差异不大,接近于平均值,因而并非所有的高度重复序列都能形成卫星DNA。复性动力学鉴定发现高度重复的DNA与卫星DNA一样,具有串联集中分布的特点。因此有时把这种高度重复序列称为隐蔽卫星DNA(cryptic satellite DNA)。卫星DNA的重复单位长短不一,牛的卫星DNA是1400bp,某些猴的卫星DNA是172bp,蟹的卫星DNA大部分是AT的重复序列,有时在30个左右的碱基对中才偶尔插入一个GC对,因而AT含量达到97。果蝇(Dvirilis)有3

11、条卫星DNA区带,也是多为AT对,并且还有一个隐蔽卫星(表7-2)。Miklos 1985年的研究指出,果蝇Dnasutoides基因组的60由卫星DNA构成,而它们全部都处在4对染色体的一对最大的染色体上,而这对染色体看来几乎不含别的DNA。根据卫星DNA的浮力密度可以分成、4类,它们的浮力密度分别是1.687、1.693、1.647和1.700gcm3。卫星DNA在染色体上的位置可以用放射性标记探针作DNA分子原位杂交(in situ hybri dization)来鉴定,发现4类卫星DNA都能与人的各条染色体杂交,而且杂交的带型也很相似。说明这4类卫星DNA也存在于人的染色体上,而且分布

12、的状况也相同。卫星DNA分布于着丝粒附近的异染色质区。由于异染色质区是高度螺旋化的,DNA是不表达的。卫星DNA在着丝粒处的集中分布可能与细胞分裂时染色体的运动有关。哺乳动物的卫星DNA常常是多等级的,即一个大的重复单位是由若干个彼此相似的小重复单位串联组成,每个小重复单位又由若干个彼此相似的更小的重复单位串联组成。如小鼠卫星DNA用限制性内切酶EcoR切割,得到234240bp的一系列片段,序列分析发现其中234bp的带在6070的卫星DNA里都有这种序列。若将234bp的左、右各一半的各117bp排列起来进行比较,发现只有22个bp不同,差异为19。说明234bp的重复单位是由117bp亚

13、重复单位重复而来,由于突变而积累了差异。117bp的亚单位又可分成两个58bp的14亚单位。4个58bp亚单位之间的差异达到40。58bp的亚单位又可分成两个18的亚单位,其中之一是28bp(亚单位),另一部分是30bp(亚单位)。8个18亚单位之间的差异达61。如果再将18亚单位分成3个部分,每一部分都含有GAAAAACGT、GAAAAATGA、GAAAAAACT近似序列。由此推测小鼠的234bp高度重复序列可能是由一个9bp的祖先序列例如GAAAAATGT演化而来的。其演化原理可能是在某特定时刻由于某种原因使一个DNA序列横向扩增产生多个串联重复单位,经92758117234bp4轮的横向

14、扩增和突变积累过程,在这个过程中,使不同的重复单位失去同一性,也可能产生插入突变,致使现在的234bp的重复序列也并不完全相同。一般说卫星DNA不受任何选择压的影响,因为它不编码蛋白质或RNA,因而小鼠卫星DNA各个拷贝的序列有相似性而不完全相同。然而有些卫星DNA如节肢动物的卫星DNA是由几乎相同的重复单位组成的。值得注意的是在人的第17号染色体上串联分布的U2snRNA基因有1020个拷贝。每个重复单位约6000bp,而其编码序列却只有188bp。选择压作用于编码序列而使其保持相同,这是不言而喻的。难以理解的是其余5800bp的间隔序列为什么也会保持相同?虽然其中有100bp左右的转录起始、终止以及转录后处理的信号,它们必须是保守的。对其剩余的5700bp的保守性形成的机制以及上述节肢动物卫星DNA的实例中,人们认为:任何串联重复的DNA序列,不论其中是否含有编码的遗传信息,都将经受均一化作用(homogenization),使串联重复的DNA序列保持均一化。一般认为有两种机制:一是交换固定(crossover fixation),二是基因转变(gene conversion)。这两种机制与基因扩增一道维持了串联重复序列的均一化。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号