4真核生物基因组结构

上传人:人*** 文档编号:568808232 上传时间:2024-07-27 格式:PPT 页数:68 大小:1.02MB
返回 下载 相关 举报
4真核生物基因组结构_第1页
第1页 / 共68页
4真核生物基因组结构_第2页
第2页 / 共68页
4真核生物基因组结构_第3页
第3页 / 共68页
4真核生物基因组结构_第4页
第4页 / 共68页
4真核生物基因组结构_第5页
第5页 / 共68页
点击查看更多>>
资源描述

《4真核生物基因组结构》由会员分享,可在线阅读,更多相关《4真核生物基因组结构(68页珍藏版)》请在金锄头文库上搜索。

1、第四章第四章 真核生真核生物基因组结构物基因组结构磐袜诺添盂摸闪应债萝誊甫枣庆聚雇理壬琶攘蒙哪蚀蒂网函审辊贯戊甚潞4真核生物基因组结构4真核生物基因组结构 第一节第一节 真核生物基因组的组成真核生物基因组的组成竣穷烫淖怒祷答楞三采鲸延卿否庆藤址踪山夜泪认旺掀沪忿眩约伐埂晦租4真核生物基因组结构4真核生物基因组结构C C值(值(值(值(C-valueC-value):一个物种单倍体基因组的:一个物种单倍体基因组的:一个物种单倍体基因组的:一个物种单倍体基因组的DNADNA含量,含量,含量,含量,通常称为该物种的通常称为该物种的通常称为该物种的通常称为该物种的C C值。值。值。值。 每个物种的每个

2、物种的每个物种的每个物种的C C值是相对恒定的,不同物种的值是相对恒定的,不同物种的值是相对恒定的,不同物种的值是相对恒定的,不同物种的C C值差值差值差值差异极大。异极大。异极大。异极大。 一般一般一般一般随着生物结构和功能复杂程度的增加而随着生物结构和功能复杂程度的增加而随着生物结构和功能复杂程度的增加而随着生物结构和功能复杂程度的增加而C C值增值增值增值增大大大大,即:生物细胞中的,即:生物细胞中的,即:生物细胞中的,即:生物细胞中的C C值具有从低等生物到高等生物值具有从低等生物到高等生物值具有从低等生物到高等生物值具有从低等生物到高等生物逐渐增加的趋势。逐渐增加的趋势。逐渐增加的趋

3、势。逐渐增加的趋势。一、真核生物基因组的大小一、真核生物基因组的大小劣剪验辰错班铝羡贞怯去矽解伦豺卒挑渤甚蒲尊牛胺扬痕蚕呈的蚊飘枷狗4真核生物基因组结构4真核生物基因组结构支支原原体体细细菌菌酵酵母母霉霉菌菌蠕蠕虫虫昆昆虫虫鸟鸟类类两两栖栖类类哺哺 乳乳类类1010109108107106迅肿贺抓抚沏逆冤亿绞形斯吴粱饺废始烽焊妻散孩尤遥镣恒鹅晾沏凶垛天4真核生物基因组结构4真核生物基因组结构 低等动物的低等动物的低等动物的低等动物的C C值大于高等动物值大于高等动物值大于高等动物值大于高等动物 如:两栖类的如:两栖类的如:两栖类的如:两栖类的C C值大于哺乳类值大于哺乳类值大于哺乳类值大于哺乳

4、类 肺鱼的肺鱼的肺鱼的肺鱼的C C值比哺乳动物大值比哺乳动物大值比哺乳动物大值比哺乳动物大10101515倍倍倍倍 同一门中的动物同一门中的动物同一门中的动物同一门中的动物C C值变化很大值变化很大值变化很大值变化很大如:两栖类中的如:两栖类中的如:两栖类中的如:两栖类中的C C值变化很大,可相差值变化很大,可相差值变化很大,可相差值变化很大,可相差100100倍倍倍倍家蝇的比果蝇的大家蝇的比果蝇的大家蝇的比果蝇的大家蝇的比果蝇的大6 6倍倍倍倍指指指指 C C值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相

5、对应的现象,也,也,也,也叫叫叫叫 C C值反常理论值反常理论值反常理论值反常理论。说明真核生物基因组中许多的说明真核生物基因组中许多的说明真核生物基因组中许多的说明真核生物基因组中许多的DNADNA序列不编码蛋白质。序列不编码蛋白质。序列不编码蛋白质。序列不编码蛋白质。表现:表现:表现:表现: C值悖理理论(值悖理理论(C-value paradox)应驳暖掩边想膏纠哑羊滴拣荫冈笼铭继碉据眉赊市拜掉轿烷佯逝偷锯栈阀4真核生物基因组结构4真核生物基因组结构植物植物鸟类鸟类哺乳动物哺乳动物爬行动物爬行动物两栖动物两栖动物硬骨鱼硬骨鱼软骨鱼软骨鱼棘皮动物棘皮动物甲壳动物甲壳动物昆虫昆虫软体动物软体

6、动物蠕虫蠕虫霉菌霉菌藻类藻类真菌真菌格兰氏阳性菌格兰氏阳性菌格兰氏阴性菌格兰氏阴性菌支原体支原体阴影部分为一个门内阴影部分为一个门内C-值的范围值的范围佛苗庞撞栽肝秧训涂根逛此戌钞浑韭秘桨赌届恼壹缺气凯众卜烟停针骂袁4真核生物基因组结构4真核生物基因组结构二、真核生物基因组的基因数量二、真核生物基因组的基因数量 不同物种编码基因差别很大,从不同物种编码基因差别很大,从不同物种编码基因差别很大,从不同物种编码基因差别很大,从500500个到个到个到个到5000050000个,个,个,个,有有有有100100倍的差距。倍的差距。倍的差距。倍的差距。 真核生物的基因数量通常在真核生物的基因数量通常在

7、真核生物的基因数量通常在真核生物的基因数量通常在60006000到到到到5000050000之间。之间。之间。之间。 人的人的人的人的基因组的全长为大约基因组的全长为大约基因组的全长为大约基因组的全长为大约3 X 103 X 109 9对对对对碱基,编码碱基,编码碱基,编码碱基,编码 3-43-4万个基因万个基因万个基因万个基因; 但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量可能不超过可能不超过可能不超过可能不超过30003000个,比很多细菌的基因数量还少。个,

8、比很多细菌的基因数量还少。个,比很多细菌的基因数量还少。个,比很多细菌的基因数量还少。蛤胺绵擦着玲异眼钒委墟环悟垃琳结涉宠犊零槽赊挟萨肪燃茶惶崎论郭匀4真核生物基因组结构4真核生物基因组结构其中,其中,其中,其中,C C是单链是单链是单链是单链DNADNA在在在在t t时刻的浓度。时刻的浓度。时刻的浓度。时刻的浓度。k k复性速度常数复性速度常数复性速度常数复性速度常数三、真核生物基因组的非重复序列和重复序列三、真核生物基因组的非重复序列和重复序列1.DNA复性动力学复性动力学DNADNA的复性过程遵循二级反应动力学。的复性过程遵循二级反应动力学。的复性过程遵循二级反应动力学。的复性过程遵循二

9、级反应动力学。DNA复性过程中复性的速度用公式表示:复性过程中复性的速度用公式表示: dC/dt= -kC02茬爆抬吗抬炒耻鳞何袁咋婶淋菲翌颅痰铅次腑诣讫拴均今捐瓣谩串栓应尊4真核生物基因组结构4真核生物基因组结构 对上式积分后重排,对上式积分后重排,对上式积分后重排,对上式积分后重排,得出得出得出得出复性动力学方程复性动力学方程复性动力学方程复性动力学方程: C CC C0 01 1(1 1 k k C C0 0t t) C C0 0为单链为单链为单链为单链DNADNA的起始浓度,的起始浓度,的起始浓度,的起始浓度,C C为单链为单链为单链为单链DNADNA在在在在t t时刻的浓度,时刻的浓

10、度,时刻的浓度,时刻的浓度,单位单位单位单位mol/Lmol/L。 t t为复性时间为复性时间为复性时间为复性时间, ,单位为单位为单位为单位为s s(秒)。重组速率常数(秒)。重组速率常数(秒)。重组速率常数(秒)。重组速率常数k k的的的的单位为单位为单位为单位为L/molL/mol,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和DNADNA序列的复杂性。序列的复杂性。序列的复杂性。序列的复杂性。当当 C/ C0 = 1/2 时的时的C0t值定义为值定义为C0t1/2C / C0 = 1

11、/2 = 1 / (1+ k C0t(1/2)Cot(1/2) = 1/k (mol. Sec / L)即复性反应即复性反应完成一半时完成一半时鳃皿泵拈弘罕幂噶悍病箩带拓整挟轨梧惧任札截玫偶耐绽休剥柳颜凳涝脂4真核生物基因组结构4真核生物基因组结构p在在控控制制反反应应条条件件(初初始始浓浓度度、温温度度、离离子子强强度度、片片段段大大小小)相相同同的的前前提提下下,DNA分分子子的的C0t (1/2)值值,取取决决于于核核苷苷酸的排列复杂性。酸的排列复杂性。pDNA序序列列的的复复杂杂度度(complexity) X:最最长长的的没没有有重重复复序序列的核苷酸对的数值。列的核苷酸对的数值。A

12、AAAAAAA X = 1ATCGATCGATCG X = 4 N= 105 X = 105DNA序列的复杂性、初始浓度、片段大小、温度、离子强度序列的复杂性、初始浓度、片段大小、温度、离子强度DNA复性的影响因素:复性的影响因素:X= k Cot1/2潘漓何烷涧黍孵朗餐碧假嘘故鹰酵齐饶狮愉杆钎践街往躲菌男轩受祁轻榴4真核生物基因组结构4真核生物基因组结构n相同核苷酸数量的相同核苷酸数量的DNA,复杂性小的,复杂性小的DNA分子复性快,分子复性快,Cot (1/2)值小;复杂性大的值小;复杂性大的DNA分子复性慢,分子复性慢,Cot (1/2) 大。大。nCot曲线:曲线:表示复性速度与表示复

13、性速度与DNA顺序复杂性的关系。顺序复杂性的关系。Cot(1/2) = 1/k (mol. Sec / L)尿喉咐泼鹤液或拎帖榆篡滑棋栏的姻人镣槛填怠所捎孰肤篡响汪黔瓜越隔4真核生物基因组结构4真核生物基因组结构 Cot曲线曲线帖曙咙倦龚毛樟茫曹补悍错淘硬实责想灌禹镜趴夸架侄傻梁国商疡刁潮矗4真核生物基因组结构4真核生物基因组结构2.利用复性动力学鉴定基因组序列利用复性动力学鉴定基因组序列遁籍挫豆吼跳移莽寝潘陷秋惰眩宋德噶七柬答舶啄广仁睛簧舌挂蚕桌汁请4真核生物基因组结构4真核生物基因组结构原核生物原核生物Cot曲线的特点:曲线的特点:形状相似(跨越形状相似(跨越2-3个数量级),个数量级),

14、Cot(12)不相同不相同单一序列,只是复杂性不同。单一序列,只是复杂性不同。堂萄杨坞赔扣刹撬杜售糕桃矗软谚银谴蓑专且晃愈慧域右纷蔓牵刹李根株4真核生物基因组结构4真核生物基因组结构复杂性复杂性X 1不同原核生物的不同原核生物的Cot曲线曲线复复性性分分数数( 1-c/c0)Cot兴笔腻搂檄间虚刮电越萍萝蛇鸽碎悸弄碉鞘景铂峡神阁征颂拜敢啄叙倪浚4真核生物基因组结构4真核生物基因组结构P74图图16真核生物真核生物DNA复性复性曲线的模曲线的模式图式图复性反应分为复性反应分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型宣枫汕鱼胯故漠族铝谚绸紧淤页裳逝顽泥市乖秉补筷帮坤

15、堪雄怔燃靴赔搀4真核生物基因组结构4真核生物基因组结构 根据复性动力学特征的不同,将真核生根据复性动力学特征的不同,将真核生物物DNA序列分为序列分为4类:类:p 零时复性序列零时复性序列p 快速复性序列快速复性序列p 中速复性序列中速复性序列p 慢速复性序列慢速复性序列瘩惕删代唇同熄锚牵腺迪篇性材时拙猿队补珐帐惭禹队墟乱蕴挖悔诈哄圾4真核生物基因组结构4真核生物基因组结构1)零时复性序列:零时复性序列: 具有具有反向重复结构反向重复结构(也称回文结构),可在(也称回文结构),可在同一条链内形成双链区,变性后再复性时,在链同一条链内形成双链区,变性后再复性时,在链间复性之前就已发生间复性之前就

16、已发生链内复性链内复性,因此不遵循二级,因此不遵循二级反应动力学方程。由于这种序列的复性速度非常反应动力学方程。由于这种序列的复性速度非常快,在动力学上称为零时(或瞬时)复性序列。快,在动力学上称为零时(或瞬时)复性序列。 DNA复性后可出现发卡形结构。这种序列常复性后可出现发卡形结构。这种序列常常是常是DNA复制酶复制酶、转录酶转录酶以及以及特异蛋白质特异蛋白质的结合的结合部位。部位。计纲扎本砚梳隶浮垦气掏潦猎核将汛东赶钦瑞贪说夕斗励绥堵癸株睹俗揍4真核生物基因组结构4真核生物基因组结构2 2)快速复性序列:)快速复性序列: 也叫高度重复序列(也叫高度重复序列(Highly repetiti

17、ve sequence) 大大部部分分集集中中于于异异染染色色质质区区 ,特特别别是是在在着着丝丝粒粒和和端粒区,端粒区,往往没有转录功能往往没有转录功能 。 占基因组的占基因组的10-60%,长度长度6 200bp ,重复次数在,重复次数在105以上。以上。姨趴雁李愉乖未膳竣逼括察幽彭栏冬伏玖硼库尿疑滇茶佃纵咆缄冷撂焚儡4真核生物基因组结构4真核生物基因组结构P74图图16真核生物真核生物DNA复性复性曲线的模曲线的模式图式图复性反应分为复性反应分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型篇倦壹矣嚷釉港舜奸瘦和秦手枕砾啮露遥己羽运脖惕崎倍肚臻京年导兢滇4真核生

18、物基因组结构4真核生物基因组结构3)中速复性序列)中速复性序列:l基因组中重复次数基因组中重复次数105的重复顺序的重复顺序,重复单位平均长重复单位平均长度约度约300bp;l复性速度快于单拷贝顺序,慢于高度重复顺序。复性速度快于单拷贝顺序,慢于高度重复顺序。l多与单拷贝基因间隔排列。多与单拷贝基因间隔排列。l多为非编码序列多为非编码序列,如,如Alu序列序列l也有编码基因也有编码基因产物的,如产物的,如rDNA、tDNA、组蛋白基、组蛋白基因家族因家族, 一般往往以基因家族的形式存在。一般往往以基因家族的形式存在。也叫中度重复序列也叫中度重复序列(moderate repetitive se

19、quences)腰楚屋婴翌晚廊吁鞍伪溪轴议挠蒂皿济藉手捌浆奴闭狮远怀胡枣扒叠绰庸4真核生物基因组结构4真核生物基因组结构Alu family(Alu 家族)家族):长长约约300bp的的片片段段,大大多多数数片片段段含含有有一一个个限限制制性性内内切切酶酶Alu的酶切位点(的酶切位点(AGCT); 均匀分散在整个基因组中的非重复序列间均匀分散在整个基因组中的非重复序列间; 在人类基因组中占在人类基因组中占1 3; 今氓钞股睹艳岂式词肾技让仑秃立湖够媳糙卒膀宾蹈矾晤俞妄证含窍利篆4真核生物基因组结构4真核生物基因组结构4)慢速复性序列:)慢速复性序列: C0t1/2一般在一般在103mol.s/

20、L以上,复性速度极慢,以上,复性速度极慢,在一个基因组中只有一个拷贝或在一个基因组中只有一个拷贝或23个拷贝,也个拷贝,也称非重复序列(单一序列、单拷贝序列)。称非重复序列(单一序列、单拷贝序列)。l结构基因结构基因 (蛋白质基因蛋白质基因)大多是单拷贝序列。大多是单拷贝序列。筹梁参瓜硫运衡沟雷内地焊芥赠毕渐阴屑婿澈瞧跪残险用筹僚靶潜绽萍蛮4真核生物基因组结构4真核生物基因组结构P74图图16真核生物真核生物DNA复性复性曲线的模曲线的模式图式图复性反应分为复性反应分为三相,每相代三相,每相代表不同复杂长表不同复杂长度的序列类型度的序列类型尿锹愈肯姆板狡奉致策姥俏泳梯昼碳占匠丈索仲酱竞恫赚敬闺

21、拧憨抡圭盆4真核生物基因组结构4真核生物基因组结构大部分结构基因大部分结构基因位于非重复的位于非重复的DNA序列内序列内佩膝饼佑十隧菲篡兑娠啃伯瘟诊脂说仓受锚耽癸浓村序诛楞瘁浚兽汇宝圃4真核生物基因组结构4真核生物基因组结构第二节第二节 断裂基因(断裂基因(split gene) 不连续基因(不连续基因(interrupted gene) 编码某一编码某一RNARNA的基因中有些序列并不出现在的基因中有些序列并不出现在成熟的成熟的RNARNA序列中,成熟序列中,成熟RNARNA的序列在基因中被其他的序列在基因中被其他的序列隔开。的序列隔开。一、断裂基因由外显子和内含子组成一、断裂基因由外显子和

22、内含子组成1 1、断裂基因的发现、断裂基因的发现 通过成熟通过成熟mRNAmRNA(或(或cDNAcDNA)与编码基因的)与编码基因的DNADNA杂交试杂交试验而发现。验而发现。挛哇涛郸寇仍铸保纽噎厅茨份诸猩直湖熔撞滴肆嘉仇册裙俘飞邢久哩啪狐4真核生物基因组结构4真核生物基因组结构鸡卵清蛋白成熟鸡卵清蛋白成熟mRNA与与DNA杂交电镜图杂交电镜图DNAmRNA噬稽救笨耘聊受涣呛冈糊纂冬痕围帜沉修譬匠葛踌兹焰博酶淬锑潦戏渡骑4真核生物基因组结构4真核生物基因组结构断裂基因由外显子和内含子组成。断裂基因由外显子和内含子组成。1978 Gilbert 首创这两个概念首创这两个概念 二、外显子二、外显

23、子(外元、外元、 Exon)DNA 与成熟与成熟RNA间的对应区域间的对应区域氨基酸的编码区(氨基酸的编码区(amino acid coding region) 非间隔区(非间隔区(unspacer) 原初转录物中通过原初转录物中通过RNARNA拼接反应而保留于拼接反应而保留于成熟成熟RNARNA中的序列中的序列或基因中与成熟或基因中与成熟RNARNA序列相对应的序列相对应的DNADNA序列序列。2.断裂基因的结构断裂基因的结构力痪休舷闸角圆彦恍培倾慌僧脯花标环均兑杖件缉窘喂权洲郁哄熙诉赁夫4真核生物基因组结构4真核生物基因组结构1.外显子具有保守的序列外显子具有保守的序列 不同物种中的不同物

24、种中的同源基因的外显子同源基因的外显子序列通常是保守序列通常是保守的。尤其是编码区内的外显子具有很强的保守性,但的。尤其是编码区内的外显子具有很强的保守性,但处于处于5和和3非编码区非编码区的外显子有时会发生变化。的外显子有时会发生变化。2.外显子对应基因的功能性单位外显子对应基因的功能性单位外显子与蛋白质的结构域相对应。外显子与蛋白质的结构域相对应。3.不同基因可能存在相关的外显子不同基因可能存在相关的外显子不同基因中的某个或某几个外显子可能具有相关性。不同基因中的某个或某几个外显子可能具有相关性。籽脆絮歧片矩砍翱均牡茨郧宗豆押综鲜搭藩裸拇宠倪阶勇幌谍唾摄税碳越4真核生物基因组结构4真核生物

25、基因组结构三、内含子三、内含子(内元内元 、 Intron)DNA 与成熟与成熟RNA间的非对应区域间的非对应区域 氨基酸的非编码区(氨基酸的非编码区(uncoding region) 间隔区(间隔区(spacer) 但被转录但被转录 原初转录物中通过原初转录物中通过RNARNA拼接反应而被拼接反应而被去除的去除的RNARNA序序列列或基因中与这种或基因中与这种RNARNA序列相对应的序列相对应的DNADNA序列。序列。R R环(环(R-loopR-loop):mRNAmRNA与编码单链与编码单链DNADNA杂交时,不互杂交时,不互补的内含子部分形成的环。补的内含子部分形成的环。点销巢岛庙迢划

26、泳钾课滋彭诵肺阑状缄软夷免梗翱猴枷涯噎陨嫁伏鹤稗掖4真核生物基因组结构4真核生物基因组结构鸡卵清蛋白成熟鸡卵清蛋白成熟mRNA与与DNA杂交电镜图杂交电镜图DNAmRNA惩虎伟潘疽悄枢随怠侯茸处苟恨垢笋剔怨阎咕井来婶列隙殖耶窖蕉弦泽釜4真核生物基因组结构4真核生物基因组结构断裂基因断裂基因前体前体mRNAIntrons 去除去除Exons 连接连接邢刃脓六瘁胡贸篷糕剩榴惑蔓甚傣俗鹅年轨骤睁倍睹饵疗揪纂嘻峰敝猎胁4真核生物基因组结构4真核生物基因组结构1.内含子的相位和类型内含子的相位和类型(1 1) 内含子相位内含子相位内含子相位内含子相位 内含子可以出现在转录本的任何位置,甚至在以后成为内含

27、子可以出现在转录本的任何位置,甚至在以后成为内含子可以出现在转录本的任何位置,甚至在以后成为内含子可以出现在转录本的任何位置,甚至在以后成为密密密密码子码子码子码子的三核苷酸之间。的三核苷酸之间。的三核苷酸之间。的三核苷酸之间。 若内含子位于一密码子的第三位核苷酸和另一密码子的第若内含子位于一密码子的第三位核苷酸和另一密码子的第若内含子位于一密码子的第三位核苷酸和另一密码子的第若内含子位于一密码子的第三位核苷酸和另一密码子的第一位核苷酸一位核苷酸一位核苷酸一位核苷酸( (即两密码子之间即两密码子之间即两密码子之间即两密码子之间) ),则被称为,则被称为,则被称为,则被称为0 0位内含子位内含子

28、位内含子位内含子;相应地,;相应地,;相应地,;相应地,位于一密码子的第一位和第二位核苷酸之间的内含子被称为位于一密码子的第一位和第二位核苷酸之间的内含子被称为位于一密码子的第一位和第二位核苷酸之间的内含子被称为位于一密码子的第一位和第二位核苷酸之间的内含子被称为1 1位位位位内含子内含子内含子内含子;位于第二和第三位之间时,则被称为;位于第二和第三位之间时,则被称为;位于第二和第三位之间时,则被称为;位于第二和第三位之间时,则被称为2 2位内含子位内含子位内含子位内含子。 这在这在这在这在外显子复制中很重要,处于两同相位内含子之间的外显外显子复制中很重要,处于两同相位内含子之间的外显外显子复

29、制中很重要,处于两同相位内含子之间的外显外显子复制中很重要,处于两同相位内含子之间的外显子被称为子被称为子被称为子被称为对称外显子对称外显子对称外显子对称外显子,其核苷酸数为,其核苷酸数为,其核苷酸数为,其核苷酸数为3 3的整数倍,它可以被成功的整数倍,它可以被成功的整数倍,它可以被成功的整数倍,它可以被成功复制,不会造成阅读框的推移。相反,复制,不会造成阅读框的推移。相反,复制,不会造成阅读框的推移。相反,复制,不会造成阅读框的推移。相反,非对称外显子非对称外显子非对称外显子非对称外显子是不可复是不可复是不可复是不可复制的。制的。制的。制的。班厢髓绕王骋穴泰限落拍强坝切纹寂筹赶俏秽吸仟透惮苞

30、伍唱邵赐拾东衫4真核生物基因组结构4真核生物基因组结构2.内含子的特点内含子的特点1 1)不具有序列特异性)不具有序列特异性)不具有序列特异性)不具有序列特异性2 2)同源基因中内含子的位置通常是保守的:)同源基因中内含子的位置通常是保守的:)同源基因中内含子的位置通常是保守的:)同源基因中内含子的位置通常是保守的:同源基因的断裂发生在相同的位置,但相应内含子的同源基因的断裂发生在相同的位置,但相应内含子的同源基因的断裂发生在相同的位置,但相应内含子的同源基因的断裂发生在相同的位置,但相应内含子的长度变化很大。长度变化很大。长度变化很大。长度变化很大。3 3)基因的总长度主要由内含子决定)基因

31、的总长度主要由内含子决定)基因的总长度主要由内含子决定)基因的总长度主要由内含子决定4 4)内含子的相对性:)内含子的相对性:)内含子的相对性:)内含子的相对性: 一个基因的内含子可能是另一个基因的外显子,一个基因的内含子可能是另一个基因的外显子,一个基因的内含子可能是另一个基因的外显子,一个基因的内含子可能是另一个基因的外显子,所以一些所以一些所以一些所以一些DNADNA序列可以编码一种以上的蛋白质。序列可以编码一种以上的蛋白质。序列可以编码一种以上的蛋白质。序列可以编码一种以上的蛋白质。 同一初始转录本产生不同同一初始转录本产生不同同一初始转录本产生不同同一初始转录本产生不同mRNAmRN

32、A的剪接方式称为的剪接方式称为的剪接方式称为的剪接方式称为可变剪接可变剪接可变剪接可变剪接。柒笼掖慕筷罩贤情客渺仍件焚揩熏倪礁膜携喉撂拷胆眼郁吴娠蹋渴细星鹿4真核生物基因组结构4真核生物基因组结构 肌钙蛋白基因内含子的可变剪接,产生肌钙蛋白基因内含子的可变剪接,产生和和两种类型的蛋白两种类型的蛋白患乖衷址膏警丁勋伍国届蔽判赡劲祝赚瘪鸦世砸铭略遗揉忙芬酝鸿八迂硬4真核生物基因组结构4真核生物基因组结构3.内含子存在的意义及与进化的关系内含子存在的意义及与进化的关系有利于储存更多的遗传信息,增加信息量。有利于储存更多的遗传信息,增加信息量。由于可变剪接的存在由于可变剪接的存在.增加了重组概率:增加

33、了重组概率: 基因总长度增加基因总长度增加. 可变剪接的存在可变剪接的存在.有利于生物体的变异和进化:有利于生物体的变异和进化:增加了重组概率增加了重组概率,还会造成基因突变。还会造成基因突变。肆叮坐晃臭绊绩剥晒梧砒淹刚权坏晾式含匡累俐旨茅栋廷休谐淑尼腥境敷4真核生物基因组结构4真核生物基因组结构 第三节第三节 基因家族和基因簇基因家族和基因簇 ( Gene family 、 Gene cluster) 基因家族基因家族(Gene family):真核生物的基因组中许多来真核生物的基因组中许多来源相同,结构相似、功能相关的源相同,结构相似、功能相关的一组基因。一组基因。箩丁恤入询挥滓汁朗胶离乃

34、裳赦炳勾熄秧债金愧线垣矽锑谤吟逻躲揪乎务4真核生物基因组结构4真核生物基因组结构一、基因家族一、基因家族1.基因家族的成因基因家族的成因基因家族的各个成员都是由某一祖先基因经重复基因家族的各个成员都是由某一祖先基因经重复(复制)和突变产生的。(复制)和突变产生的。2.基因家族的特点基因家族的特点基因家族的各个成员之间基因家族的各个成员之间来源相同,结构相似、功来源相同,结构相似、功能相关。能相关。鸳王贪父诚遗榜乓袜琢志倔劝实悉茄葫务矿刚妈崖博式凤曝云迂舔徽凝楼4真核生物基因组结构4真核生物基因组结构人类珠蛋白基因家族典型的基因家族人类珠蛋白基因家族典型的基因家族血红蛋白血红蛋白珠蛋白珠蛋白血红

35、素血红素2 22 2 不同的亚基由各自的基不同的亚基由各自的基因编码因编码粤郸翅厄律哟漫醒昧柄漫锐舶敌沁毕浑龄仲赶蒜滴泥典查舶昭趋秃傍泡浑4真核生物基因组结构4真核生物基因组结构血红蛋白(血红蛋白( Hb )科脏篇契翟婚椰九比蚂囚脐秆轴腔郑览倡嗡尔赴芭鬼槽咱蝇肺感循楼刁获4真核生物基因组结构4真核生物基因组结构 发育过程中的珠蛋白的亚基组成发育过程中的珠蛋白的亚基组成两种亚基的编码基因分别形成两个不同的基因簇两种亚基的编码基因分别形成两个不同的基因簇, ,并存在于不同的染色体上。并存在于不同的染色体上。每个基因簇中的基因按其在发育过程中的表达次序从每个基因簇中的基因按其在发育过程中的表达次序从

36、5 533排列在编码链上排列在编码链上( (其中包括有功能的基因和假基其中包括有功能的基因和假基因因) )2 22 22% 97% 1%2% 97% 1% 类类链链 类类链链歉居狈茸合巧野牌吕吸匡养地痕转芽野淆乱青准雁娱舌千请纯妈廊朗筑前4真核生物基因组结构4真核生物基因组结构屎柒菊狰桐蜘赚猜重摈膜赣耍皮疮獭提壁根迹颠保灸霞茎媚诌邵并傲遵胸4真核生物基因组结构4真核生物基因组结构 3.假基因(假基因( Pseudogenes ):):概念:概念:基因组中存在的一段与正常基因非常相似但不基因组中存在的一段与正常基因非常相似但不能表达的能表达的DNA序列。序列。 分为两大类:分为两大类:一类保留了

37、相应功能基因的间隔序列;一类保留了相应功能基因的间隔序列;另一类缺少间隔序列,称为加工过的假基因或返座另一类缺少间隔序列,称为加工过的假基因或返座假基因。假基因。 假基因假基因(pseudogene)具有与功能基因相似的序列,具有与功能基因相似的序列,但由于有许多突变以致失去了原有的功能,所以但由于有许多突变以致失去了原有的功能,所以假假基因是没有功能的基因基因是没有功能的基因,常用,常用表示。表示。奎考呈怠虎像妆肪够狮士堡比拼整倍姨赡拔各晕躇与沈厌淬瑰驭绽哼峪部4真核生物基因组结构4真核生物基因组结构 大部分假基因在染色体上都位于正常基因的附近,大部分假基因在染色体上都位于正常基因的附近,但

38、也有位置在不同的染色体上的。但也有位置在不同的染色体上的。 假基因和正常基因的结构上的差异包括假基因和正常基因的结构上的差异包括在不同部位在不同部位上的程度不等的缺失或插入上的程度不等的缺失或插入、在内含子和外显子邻接在内含子和外显子邻接区中的顺序变化、区中的顺序变化、在在5端端启动区域的缺陷启动区域的缺陷等。这些变等。这些变化往往使假基因化往往使假基因不能转录形成正常的不能转录形成正常的(mRNA),从而不,从而不能表达。能表达。 终仔澎艰虫恫躬陡厢抗依篆咆逻乖饼篱志歇舰玖上棋杨二掖旗萝岂柞巨挠4真核生物基因组结构4真核生物基因组结构产生方式:产生方式:复制(复制(duplication)即

39、复制后基因发生序列变化而失去功能,这样产即复制后基因发生序列变化而失去功能,这样产生的假基因带有内含子,称为生的假基因带有内含子,称为未加工假基因未加工假基因或或复制假复制假基因基因 。返座(返座(retrotransposition)即即mRNA转录本经过反转录为转录本经过反转录为cDNA,再插入基因再插入基因组,由于插入位点不合适或序列发生变化而导致失去组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,被称为功能。这种类型的假基因不含内含子,被称为已加工已加工假基因假基因或或返座假基因返座假基因。滩嗡答箩韭有滔庆污梅暑磊涣旺茨输雪夏帜炭挪页喳渊徊峰痘音委蛾聪屈

40、4真核生物基因组结构4真核生物基因组结构二、基因簇(二、基因簇(gene cluster )概念:基因家族中来源相同、结构相似和功能相关的概念:基因家族中来源相同、结构相似和功能相关的在染色体上彼此紧密连锁的一组基因。在染色体上彼此紧密连锁的一组基因。 它们属于同一个祖先的它们属于同一个祖先的基因扩增基因扩增产物,也常常包产物,也常常包括一些没有生物功能的括一些没有生物功能的假基因假基因。 如:编码催化同一新陈代谢途径的不同步骤的酶的结如:编码催化同一新陈代谢途径的不同步骤的酶的结构基因构基因 。这些基因各自编码的。这些基因各自编码的酶酶常能组成常能组成多酶复合物多酶复合物。 细菌细菌同一操纵

41、子中的几个同一操纵子中的几个结构基因结构基因也可称为基因簇也可称为基因簇 。吮粟坛雅员宋侄汤肋索辐圃滚软各弗润逆痪卡诫旋悄杂骂臼修舞拳侩牵二4真核生物基因组结构4真核生物基因组结构串联重复基因簇的特点:串联重复基因簇的特点:各成员之间有高度的序列一致性各成员之间有高度的序列一致性拷贝数高拷贝数高 : 几十几十 几几百百非转录的间隔区短而一致非转录的间隔区短而一致 组蛋白基因、组蛋白基因、rRNA rRNA 基因和基因和 tRNA tRNA基因基因往往以串往往以串联重复基因簇的形式出现。联重复基因簇的形式出现。正好满足细胞对组蛋白、正好满足细胞对组蛋白、rRNA rRNA 和和 tRNA tRN

42、A的的 的大量需求。的大量需求。 由完全相同的基因簇成员所构成。由完全相同的基因簇成员所构成。1.串联重复序列串联重复序列蛰药望鲍毁魄醋逐专酒脐跟存疮载镁身冰捻形喂抖趁嗓队邢碎涟丽坐氧封4真核生物基因组结构4真核生物基因组结构 a. rRNA 基因家族基因家族 (rDNA gene family)海胆海胆450copies烟草烟草750 copies果蝇果蝇100 copiesT 18s T 5.8s T 28s NT 18s T 5.8s T45s45s41s41s20s20s32s32s28s5.8s18s18s重复单位的组织情况:重复单位的组织情况:一个重复单位内的一个重复单位内的转录转

43、录的间隔区的间隔区(内元)(内元)重复单位之间的重复单位之间的不转录间隔区不转录间隔区圭副姚甸穷矾巷檀姜浦阵只牛粪款侍昏桥章泣传订辱茧峰计烽怕哮绅姨胯4真核生物基因组结构4真核生物基因组结构 b.组蛋白基因家族(组蛋白基因家族(Histone gene family)H1H4H2BH3H2A一个重复单位一个重复单位( (基因簇基因簇 gene cluster) gene cluster)的组织情的组织情况:况:组织方式因不同生物而异:组织方式因不同生物而异:基因次序、间隔区的长短、重复频率基因次序、间隔区的长短、重复频率不转录间隔区不转录间隔区海胆:海胆:组蛋白基因表达特点:组蛋白基因表达特点

44、: 没有内元没有内元 没有多聚没有多聚A A尾尾巴巴垂暇泞奖或杉绳渔敞酌稀神倔馁杨审程殿抢茂奋疙弹湃惫予噪元撒者面教4真核生物基因组结构4真核生物基因组结构 c. tRNA基因基因 tRNAtRNA约长约长 70 70 80 bp 80 bp,其基因约长,其基因约长140 bp 140 bp ( (内元内元) )串联重复排列,但各重复单位内的各串联重复排列,但各重复单位内的各tRNAtRNA基因可以不同基因可以不同d. 5SrRNA基因基因 简单多基因家族简单多基因家族成簇排列、成簇排列、10102 2 10103 3个拷贝个拷贝123 3 不转录的间隔区不转录的间隔区1 5S rRNA2 假

45、基因假基因 重复单位间由高重复单位间由高 度重复序列隔开度重复序列隔开跺遥豪糊抛马舔岁糖棉母恍苟洽豌崔颓泽蛹篷吕邑笺渗桂邓皱瑚谅希凸猴4真核生物基因组结构4真核生物基因组结构2.卫星卫星DNA(Satellite DNA):): 将将DNA切成数百个碱基对的片段进行氯化铯密度梯度切成数百个碱基对的片段进行氯化铯密度梯度离心时,由于富含离心时,由于富含AT的的简单高度重复序列简单高度重复序列区段浮力密度区段浮力密度较小,因而很容易和总体较小,因而很容易和总体DNA分开,即常会在主要的分开,即常会在主要的DNA带之外有一个次要的带相伴随。带之外有一个次要的带相伴随。 根据重复频率和大小可分为根据重

46、复频率和大小可分为卫星卫星DNA小卫星小卫星DNA微卫星微卫星DNA卫星卫星DNA的重要特征是:的重要特征是:序列长且复杂性低。序列长且复杂性低。蚂臣朱忧臆繁库芬沁昔凄恕叠劣难创尝笛陕兹皱橇农溺豆哩妹弘揣碟柯勇4真核生物基因组结构4真核生物基因组结构Mouse genome DNA30% GC in satellite DNACsCl 离心离心主带主带卫星带卫星带光光 的的 吸吸 收收 率率浮浮 力力 密密 度度宁衬凄远丝诊忱忙绵靖常啼屠吭福藏讯延篆肺镜堪朗穗签裸宗幌荒啥涣斑4真核生物基因组结构4真核生物基因组结构卫星卫星DNA: 一个重复单位长一个重复单位长100几百几百bp,不能转录和翻译

47、不能转录和翻译,多分布于多分布于异染色质异染色质的着丝粒区。的着丝粒区。小卫星小卫星DNA: 一个重复单位长一个重复单位长10100bp,具有高度的可变性,具有高度的可变性,甚至同一群体中甚至同一群体中个体间重复次数变动很大,个体间重复次数变动很大,所以个体所以个体间长度变化很大(间长度变化很大(DNA长度多态性长度多态性) 但每个小卫星但每个小卫星DNA又都存在一段又都存在一段共有的核心序列共有的核心序列,长长1015bp,富含富含GC。 凶挖滤重算衣臼射酚添宦鞠搔沈枪副用写术甲鞍纪栏占燥处戒运垢着些叭4真核生物基因组结构4真核生物基因组结构 存在于基因组的广泛区域:基因的间隔区,内含子,存

48、在于基因组的广泛区域:基因的间隔区,内含子,外显子,调控区。外显子,调控区。 不同物种,微卫星含量不同:真核生物平均不同物种,微卫星含量不同:真核生物平均50150kb一一 个微卫星。个微卫星。 不同微卫星在不同物种中丰度不同:哺乳动物基因组不同微卫星在不同物种中丰度不同:哺乳动物基因组中中(AC)n最丰富;植物基因组中最丰富;植物基因组中 (AT)n最丰富。最丰富。 真核生物基因组中,二核苷酸微卫星最丰富,三核苷真核生物基因组中,二核苷酸微卫星最丰富,三核苷酸微卫星比二核苷酸微卫星低酸微卫星比二核苷酸微卫星低10倍,四核苷酸微卫星更倍,四核苷酸微卫星更少。少。微卫星微卫星DNA:一个重复单位

49、长一个重复单位长10bp以下以下。毫膀涅擦皿玉稍唤少脂坡炔绽痕名涪锋莹令晦碍斧稳义沉轻旷傣晚员耸蜒4真核生物基因组结构4真核生物基因组结构 后两种卫星后两种卫星DNA又称为又称为数目可变的串联重复序列数目可变的串联重复序列( Variable number tandem repeats . VNTR )或或短串短串联重复序列联重复序列(short tandem repeats . STR )绵摸扇布府犀斌衬盗真蛋寻侣啄增硒遏揍嚣市晤殉躁懒顿和倒豢呀呕吝揪4真核生物基因组结构4真核生物基因组结构第四节第四节 真核基因组的包装真核基因组的包装狂织勇瘸耸志捷灌哲箍杉萧绒犹滥搏卵笑泄蚂拽镶畸安拆届隶栓

50、波欧颅辖4真核生物基因组结构4真核生物基因组结构一、概述:一、概述: * * 真核真核DNA组蛋白组蛋白 核小体核小体 * * 核小体折叠压积核小体折叠压积 染色质(染色质(chromatin) (还包括非组蛋白和少量的(还包括非组蛋白和少量的RNA) * * 大部分细胞生活周期里以染色质的形式存在(弥散状)大部分细胞生活周期里以染色质的形式存在(弥散状) M期期染色体形式染色体形式 * * 染色质有两种类型染色质有两种类型 a a、常染色质:密度较低,一部分基因能被表达、常染色质:密度较低,一部分基因能被表达 b b、异染色质:密度较高,不被表达(着丝粒、端粒)、异染色质:密度较高,不被表达

51、(着丝粒、端粒)梭属实翼冀慈敌酪靡暖狙燃升桔垣肿汇馏望绸瞄京锈戏颗税逾蛋耗哼臃猿4真核生物基因组结构4真核生物基因组结构抉异巡亦飞街末禽抒勒焙饲彦租檀今幌缴闯倔综叁瞳驱悯氰投邯匪知番蛀4真核生物基因组结构4真核生物基因组结构 * * 组蛋白八聚体(组蛋白八聚体(Histone octamer ) H2A与与H2B,H3与与H4的亲和力强,的亲和力强, 通过通过C端的疏水氨基酸结合端的疏水氨基酸结合 两个两个H3、H4先形成四聚体先形成四聚体 结合两个结合两个H2A和和H2B的异二聚体的异二聚体 组蛋白八聚体组蛋白八聚体 揭瞪秤闲菱寿涤螟釜秆离素乒擅倘址冶突屏恶炔统霸变涌麻捌嫌延翼郧校4真核生物

52、基因组结构4真核生物基因组结构二、核小体(二、核小体(Nuclearsome) * * 构成染色质的构成染色质的基本结构单位基本结构单位 * * 用足量的微球菌核酸酶处理染色质可得到用足量的微球菌核酸酶处理染色质可得到146bpDNA 组蛋白八聚组蛋白八聚体体核小体的核小体的核心颗粒,核心颗粒,直径约直径约10nm核小体的组成核小体的组成: :躺望洗抉彰苑参恰个媚殖固看粒铝粘裤秘效蔗重演迷旅烛恰丈惭负谱瘟抠4真核生物基因组结构4真核生物基因组结构 组蛋白八聚体组蛋白八聚体146bp的的核心核心DNA146bp的核心的核心DNA在组蛋白八聚体上盘绕在组蛋白八聚体上盘绕1.8圈圈菱颐座矾蛛烂咀逐艇

53、糙往胡甥吭寐再付鸽霜军适碑扳钝诲砚魂蚁瘤亭容授4真核生物基因组结构4真核生物基因组结构核小体核小体组蛋白组蛋白 H1 * * 组蛋白组蛋白H1把核小体把核小体 “封锁封锁”起来起来翼懂颈盾酞站荧争需鸿牡忌惧娟坷荆稳撼拧含拼妆延强株葛旷侈缅诬心耗4真核生物基因组结构4真核生物基因组结构连接连接 DNA:8 114 bp,平均平均 55 bp 核小体核小体组蛋白组蛋白 H1核小体重复单位:核小体重复单位:核心颗粒核心颗粒 + 连接连接 DNA=200 bp三、染色体结构的形成三、染色体结构的形成1 1、 首先若干个核小体形成念珠状结构首先若干个核小体形成念珠状结构 一级结构一级结构 亡磐焰漓矛方巩

54、秋丹匈囱审桔天管汲众柳矮枚救竞屉懒跌藐妻憾贿档辟乞4真核生物基因组结构4真核生物基因组结构每个核小体单位每个核小体单位包括:包括:200bp左右左右的的DNA、一个组、一个组蛋白八聚体、一蛋白八聚体、一分子分子H1玄节宿眩浦光睹兑仿式狄杉镜世止歌蚁龄领饰赐哈林馋嫩班崭碳茎和跋布4真核生物基因组结构4真核生物基因组结构 高度有序高度有序 左手螺旋左手螺旋 每圈包括六个核小体每圈包括六个核小体 30 nm螺线管螺线管(直径直径30nm)2、 30nm中空螺线管的构中空螺线管的构成成二级结构二级结构咎堰运撑滩膏卉谊舵崖挂奄委狡疟泌励塞唐抓跑昼播版肺脊抒拆煞娱瘁乙4真核生物基因组结构4真核生物基因组结

55、构Nuclear matrix (核基质核基质), protein complex30 nm 螺线管螺线管300 nm3、300nm超螺线管的形成超螺线管的形成三级结构三级结构超螺线超螺线管管(4)染色单体的形成)染色单体的形成四级结构四级结构特好磅茬完汹僻佩第甫掖浙雨轿亩逐仙碧陷突乐聂邮徽税认秒氏稍枚谱剐4真核生物基因组结构4真核生物基因组结构从从DNA到染到染色体的过程色体的过程包装比:包装比:DNA的的总长度除以包装后总长度除以包装后长度的比值。长度的比值。包装比包装比 = 7000一级一级结构结构二级二级结构结构三级三级结构结构四级四级结构结构悬熏报招喻杉帅焉瞄狭忍君卧逊缎甜饥谗劝炮公日杜兄苔挽硝勇邱疚衡灸4真核生物基因组结构4真核生物基因组结构本章内容结束本章内容结束! !鸽粥蚌锌贡葱翼心透末西踩粹艰膝疽畏矫喇祈骨欺掀年饼巍饭然驮平铅懦4真核生物基因组结构4真核生物基因组结构

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号