分子生物学第一章第一章 基因与基因组基因与基因组Gene and GenomeGene and Genome21基因-DNA-染色体31第一节 基因(Gene)一、基因概念一、基因概念 基因是分子上具有遗传效应的特定核苷酸序列的总称,是具有具有遗传效效应的分子片段的分子片段是遗传物质的最小功能单位41基因认识的历史孟德尔:遗传因子(生物每一个性状都是通过遗传因子来传递的,遗传因子是一些独立的遗传单位)516171沃尔特萨顿和鲍维里:遗传因子位于染色体上约翰逊(丹麦遗传学家):提出“基因”概念摩尔根:证实了染色体是基因的载体(果蝇杂交)8119110111112113约翰逊还提出了“基因型”与“表现型”这两个含义不同的术语,初步阐明了基因与性状的关系141托马斯亨特摩尔根:建立了著名的基因学说基因以直线形式排列,它决定着一个特定的性状,而且能发生突变基因是遗传的功能单位,它能产生特定的表型效应基因又是一个独立的结构单位在同源染色体之间可以发生基因的互换151二、基因结构根据操纵子学说,并不是所有的基因都能为肽链进行编码1611.结构基因(structure gene):决定合成某一种蛋白质或RNA分子结构相应的一段DNA包括编码结构蛋白和酶蛋白的基因.有些结构基因只能转录而不能转译,如tRNA基因和rRNA基因。
1712.调节基因(regulator gene):是调节蛋白质合成的基因包括阻遏因子或调节蛋白的基因能使结构基因在需要某种酶时就合成某种酶,不需要时,则停止合成,它对不同染色体上的结构基因有调节作用1813.操纵基因 操纵结构基因的基因当操作基因“开放”时,处于同一染色体上的,由它所控制的结构基因就开始转录、翻译和合成蛋白质当“关闭”时,结构基因就停止转录与翻译191启动基因、操纵基因与其控制下的一系列结构基因组成一个功能单位叫做操纵子(operon)就其功能而言,调节基因、操纵基因和启动基因都属于调控基因这些基因的发现,大大拓宽了人们对基因功能及相互关系的认识2012114.断裂基因(splitegene)20世纪70年代中期,法国生物化学家查姆帮(Chamobon)和波盖特(Berget)在研究鸡卵清蛋白基因的表达中发现,细胞内的结构基因并非全部由编码序列组成,而是在编码序列中间插入无编码作用的碱基序列,这类基因被称为间隔或断裂基因2215.外显子和内含子(exon and intron)1978年,生化学家沃特吉尔伯特提出基因是一个转录单位的设想,他认为基因是一个DNA序列的嵌合体,同时包含两个区段:一个区段将被表达并存在于成熟的mRNA中,称为“外显子”;一个区段由虽然也同时被表达,但将在成熟mRNA中被删除,称为“内含子”。
近年来的研究发现,原核生物的基因序列一般是连续的,在一个基因的内部几乎不含“内含子”,而真核生物中绝大多数基因都是由不连续DNA序列组成的断裂基因231近年来的研究发现,原核生物的基因序列一般是连续的,在一个基因的内部几乎不含“内含子”,而真核生物中绝大多数基因都是由不连续DNA序列组成的断裂基因241断裂基因的表达过程是:整个基因先由DNA转录成一条信息RNA前体(precursormRNA),其中的内含序列会被一种称为“剪接体”的RNA/蛋白质复合物所切除,两端再相互连接成一条连续的核酸顺序,以形成成熟的mRNA251分子断裂基因的存在为基因功能的展现赋予了更大的潜力2616.重叠基因(overlappinggene)长期以来,人们一直认为在同一段DNA序列内是不可能存在重叠的读码结构的但是,1977年,维纳(Weiner)在研究Q0病毒的基因结构时,首先发现了基因的重叠现象1978年,费尔(Feir)和弗雷德里克桑格在研究分析X174噬菌体的核苷酸序列时,也发现由5375个核苷酸组成的单链DNA所包含的10个基因中有几个基因具有不同程度的重叠,但是这些重叠的基因具有不同的读码框架。
以后在噬菌体G4、MS2和SV40中都发现了重叠基因271重叠基因:是指两个或两个以上的基因共有一段DNA序列,或是指一段DNA序列成为两个或两个以上基因的组成部分281基因的重叠性使有限的DNA序列包含了更多的遗传信息,是生物对它的遗传物质经济而合理的利用2917.假基因(伪基因)(pseudogene)一种核苷酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因假基因和正常基因的结构上的差异包括在不同部位上的程度不等的缺失或插入、在内含子和外显子邻接区中的顺序变化、在5端启动区域的缺陷等这些变化往往使假基因不能转录并形成正常的(mRNA)从而不能表达301现已在大多数真核生物中发现了假基因,如Hb的假基因、干扰素、组蛋白、球蛋白和球蛋白、肌动蛋白及人的rRNA和tRNA基因均含有假基因由于假基因不工作或无效工作,故有人认为假基因,相当人的痕迹器官,或作为后补基因3118.移动基因(jumping gene):巴巴拉麦克林托克发现能跳动的控制因子.单个的基因从染色体的一个位置跳到另一个位置,甚至从一条染色体跳到另一条染色体上称“转座子”,transposon321331转座(因)子是基因组中一段可移动的DNA序列,可以通过切割、重新整合等一系列过程从基因组的一个位置“跳跃”到另一个位置。
3419.等位基因(allele)基因在体细胞中成对存在,所以一个个体的基因型就有:AA,Aa,aa一对同源染色体的相同位置上控制着相对性状的一对基因351一对同源染色体同一基因座上的一对基因称为一对等位基因361一个二倍体生物如果具有一对不同的等位基因,则这种生物为该基因的杂合子,反之则为纯合子若杂合子的一对等位基因中只有一个能表达出性状,另一个不表达,则前者称显性基因,后者称隐性基因如果一对等位基因同时表达,则称为共显性371纯合子(Homozygote)是指同一位点(locus)上的两个等位基因相同的基因型个体,即遗传因子组成相同如AA,aa相同的纯合子间交配所生后代不出现性状分离杂合子(heterozygote)是指同一位点上的两个等位基因不相同的基因型个体,如Aa,基因型的个体杂合子间交配所生后代会出现性状的分离381减数分裂过程中同源染色体和非姐妹染色单体间发生交换(基因重组),使配子的遗传多样化,增加了后代对环境的适应性39140110.复等位基因在种群中,同源染色体的相同位点上,可以存在两种以上的等位基因,遗传学上把这种等位基因称为复等位基因(multipleallelism)。
任何一个杂合的二倍体个体只存在复等位基因中的二个不同的等位基因)411人的ABO血型系统IA、IB、iIA和IB都对i为显性,IA与IB为共显性但是,对于每个人来说,只能有其中的两个基因这一组复等位基因的不同组合,形成了A、B、AB和O四种血型(见下表)421复等位基因是由基因突变形成的一个基因可以向不同的方向突变,于是就形成了一个以上的等位基因431原核生物基因结构:441真核生物基因结构451461三、基因突变genemutation基因突变是指基因组DNA分子发生的可遗传的变异由于DNA分子中发生碱基对的增添、缺失或替换,而引起的基因结构的改变,就叫做基因突变后代的表现中出现祖先从未有的新性状基因突变是生物进化材料的根本来源基因突变和许多疾病的发生有关,如与肿瘤发生有关的癌基因和肿瘤抑制基因471基因突变特性:普遍性基因突变在自然界各物种中普遍存在随机性T.H.摩尔根在饲养的许多红色复眼的果蝇中偶然发现了一只白色复眼的果蝇这一事实说明基因突变的发生在时间上、在发生这一突变的个体上、在发生突变的基因上,都是随机的稀有性野生型基因以极低的突变率发生突变481可逆性野生型基因经过突变成为突变型基因的过程称为正向突变。
正向突变的稀有性说明野生型基因是一个比较稳定的结构突变基因又可以通过突变而成为野生型基因,这一过程称为回复突变491少利多害性一般基因突变会产生不利的影响,被淘汰或是死亡,但有极少数会使物种增强适应性不定向性例如控制黑毛A基因可能突变为控制白毛的a+或控制绿毛的a-基因有益性一般基因突变是有害的,但是有极为少数的是有益突变501应用:诱变育种通过诱发使生物产生大量而多样的基因突变,从而可以根据需要选育出优良品种害虫防治用诱变剂处理雄性害虫使之发生致死的或条件致死的突变,然后释放这些雄性害虫,便能使它们和野生的雄性昆虫相竞争而产生致死基因突变的或不育的子代511从染色体的角度来看有1.缺失2.重复3.倒位4.易位以功能分类1.失去功能的突变2.次形态突变3.超形态突变4.获得功能的突变以突变原理分类1.点突变2.沉默突变3.错义突变4.移码突变5.无义突变521第二节 基因组单倍体细胞中的全部基因为一个基因组包括编码序列和非编码序列在内的全部DNA分子单倍体细胞中的全套染色体脊椎动物的基因组通常指的只是染色体DNA线粒体有自己的基因组,叫做线粒体基因组531基因组指单倍体细胞中包括编码序列和非编码序列在内的全部DNA分子或RNA分子l核基因组是单倍体细胞核内的全部DNA分子;l线粒体基因组则是一个线粒体所包含的全部DNA分子;叶绿体基因组则是一个叶绿体所包含的全部DNA分子。
541不同生物体基因组的大小,复杂程度都不一样进化程度越高基因组复杂程度越高551C值(C-Value)一个基因组中的DNA含量用C值(C-Value)表示561571一、基因组特点(一)原核生物基因组特点1.细菌基因组特点:1)基因组较小,通常只有一个环形或线形的DNA分子2)基因组的大部分序列是用来编码蛋白质的,基因之间的间隔序列很短5813)功能相关的序列常串连在一起,由共同的调控元件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成,这种结构称操纵子5914)一般没有内含子5)只有一个复制起点6)以RNA为产物的基因往往是多拷贝的,蛋白质基因是单拷贝的6017)编码顺序一般不会重叠同基因(isogenez)(编码同工酶,isoenzyme)如大肠杆菌基因组中有两个编码分支酸变位酶基因,两个编码乙酰乳酸合成酶的基因6112.病毒基因组病毒是最简单的生物,完整的病毒颗粒包括外壳蛋白和内部的基因组DNA或RNA病毒不能独立地复制,必需进入宿主细胞中借助细胞内的一些酶类和细胞器才能使病毒得以复制621病毒基因组的结构特点1)与细菌或真核细胞相比,病毒的基因组很小但病毒基因组大小相差较大。
但是不同的病毒之间其基因组相差亦甚大如乙肝病毒DNA只有3kb大小,所含信息量也较小,只能编码4种蛋白质,而痘病毒的基因组有300kb之大,可以编码几百种蛋白质,不但为病毒复制所涉及的酶类编码,甚至为核苷酸代谢的酶类编码,因此,痘病毒对宿主的依赖性较乙肝病毒小得多6312)病毒基因组可以由DNA组成,也可以由RNA组成组成病毒基因组的DNA和RNA可以是单链的,也可以是双链的,可以是闭环分子,也可以是线性分子641如乳头瘤病毒是一种闭环的双链DNA病毒,而腺病毒的基因组则是线性的双链DNA,脊髓灰质炎病毒是一种单链的RNA病毒,而呼肠孤病毒的基因组是双链的RNA分子一般说来,大多数DNA病毒的基因组双链DNA分子,而大多数RNA病毒的基因组是单链RNA分子651埃博拉病毒6613)多数RNA病毒的基因组是由连续的核糖核酸链组成但也有些病毒的基因组RNA由不连续的几条核酸链组成如流感病毒的基因组RNA分子是节段性的,由八条RNA分子构成,每条RNA分子都含有编码蛋白质分子的信息6714)基因重叠(overlappinggene)即同一段DNA片段能够编码两种甚至三种蛋白质分子这种结构使较小的基因组能够携带较多的遗传信息。
6815)病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部份不被翻译不翻译的DNA顺序通常是基因表达的控制序列乳头瘤病毒是一类感染人和动物的病毒。