基因的分子结构

上传人:cl****1 文档编号:431572211 上传时间:2023-03-04 格式:DOC 页数:16 大小:75.50KB
返回 下载 相关 举报
基因的分子结构_第1页
第1页 / 共16页
基因的分子结构_第2页
第2页 / 共16页
基因的分子结构_第3页
第3页 / 共16页
基因的分子结构_第4页
第4页 / 共16页
基因的分子结构_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《基因的分子结构》由会员分享,可在线阅读,更多相关《基因的分子结构(16页珍藏版)》请在金锄头文库上搜索。

1、.基因的分子构造X乃虎 黄美娟中国科学院遗传发育所大学生命科学学院2021年3月修订一 假设干概念1.5末端和3末端5末端:系指具有一个自由的或加帽的 5磷酸基团 5-P)之核苷酸链的末端。3末端:系指具有一个自由的或是磷酸化的3羟基3-OH)之核苷酸链的末端。2. 上游与下游这是用来描述多核苷酸链或蛋白质多肽链分子中相反取向或相对位置关系的一对术语。上游upstream和下游downstream在不同的场合代表不同的含义:(1) 基因的DNA或mRNA分子: 上游:位于5-末端的序列叫上游序列。 下游:位于3-末端的序列叫下游序列。(2) 在基因的转录反响中:上游:位于转录起点5-方向的DN

2、A序列叫上游。下游:位于转录起点3-方向的DNA序列叫下游。(3)蛋白质多肽链: 上游:处于N-端的氨基酸序列为上游。下游:处于C-端的氨基酸序列为下游。(4)在基因工程研究中: 上游:基因的克隆、别离、转化、表达和调节等研究工作统称上游。下游:转基因之后的细菌培养与发酵以及转基因动植物的培育、表达产物的别离纯化 及鉴定等研究工作统称下游。3.上游序列与下游序列在基因的DNA序列中,头一个被转录的核苷酸碱基叫做转录起点,通常是A或G,其坐标定为+1。.(1)上游序列位于转录起点5一侧的DNA叫做上游序列。其核苷酸碱基的坐标定为负。例如-1-5,-10.。(2)下游序列 位于转录起点3-侧的DN

3、A叫做下游序列。其核苷酸碱基的坐标定为正。例如+3,+5,+10.。4.5-侧翼序列区和3-侧翼序列区(1)5-侧翼序列区5-flanking sequence region)位于mRNA转录起点之前的一段长度有限的DNA序列区,叫做5-侧翼序列区,或者泛称为启动子区。在该区存在着数种控制基因转录的信号:a. 确定mRNA起点的信号b. 决定最大转录起始速率的信号 c. 对环境刺激作出反响的信号d. 对发育程序作出反响的信号e. 增强子序列区(2)3-侧翼序列区3-flanking sequence region) 位于mRNA转录终点之后的一段长度有限的DNA序列区,叫做3-侧翼序列区,也叫

4、做3-下游序列区。在该区存在着数种控制基因转录的信号:a. 终止转录作用的信号 b. mRNA3-末端的加工信号 c. 大多数真核基因的3-末端还有一段poly(A)加尾信号,即多聚腺苷酸化信号 (3)旁侧DNA(flanking DNA)这个术语与上述所说的侧翼序列区的概念不同。指的是与目的基因之核苷酸序列两端严密相邻的,但是位于基因核苷酸序列外侧的DNA序列或基因。 5. 前导序列区和尾随序列区(1)前导序列区leader sequence region指位于mRNA 5-末端,起始密码子之前的一段长达数百个核苷酸的不转译的RNA区段,叫做前导序列区,也叫前导序列或5-非转译区,简称5-U

5、TR。它含有如下两种元件:a. 核糖体结合位点Ribosome-binding site ,RBS) b. 转译起始信号(2)尾随序列区trailer sequence region) 指位于mRNA 3-末端,终止密码子之后的一段非转译的核苷酸序列,叫做尾随序列区,也叫做尾随序列或3-非转译区,简称3-UTR,其长度约为100个核苷酸左右,它含有一个转录终止信号。6. 核苷酸序列的同源性和相似性(1)同源性homology)定义:一指蛋白质的同源性即两种或数种蛋白质多肽链之间氨基酸序列的相似性。二指核酸的同源性即两种或数种核酸分子之间核苷酸序列的相似性。要点:无论何种情况,序列的同源性均是起

6、因于它们的编码基因之间有着共同的祖先。显而易见,就基因的进化而言,它们之间只有有关或无关两种情况,介于二者之间的情况是不存在的。因此,说不同序列或不同基因之间具有百分之几的同源性,抑或是说具有很高的同源性或很低的同源性,都是不科学的,没有意义的。什么叫同源基因(homologous gene)呢它是指来自不同的物种,但编码着同样的蛋白质产物,具有共同的进化祖先的基因。同源基因的核苷酸序列往往具有很高的相似性,因此可以作为DNA杂交的探针使用。(2)相似性similarity)这是用来描述不同的核酸分子之间或不同的蛋白质多肽链之间,核苷酸序列或氨基酸序列一致性程度的一种术语。不同序列之间的相似性

7、或说是相关性的程度,是用序列的一致性identity或保守性conservation来衡量的。很显然,不同序列之间的相似性程度是不一样的,有高有低,可以用“百分比或“高度相似性、“低水平相似性等带有度量性含意的语言来表述。需要指出的是,核苷酸序列具有高度的相似性的基因或者蛋白质,往往是同源的。(3)一致性identity 定义:“identity有时也译作“同一性,系指被比对的两种甚至数种的核苷酸序列或氨基酸序列之间,在一样的位置具有同样的核苷酸单元或同样的氨基酸单元的水平。序列一致性的程度,通常用被比对的两种核苷酸序列或氨基酸序列,在同一位置具有同样的核苷酸或同样的氨基酸数目占总数的百分比来

8、表示。4保守性conservation 在分子生物学和基因工程学中所用的保守性conservation或保守的conserved这个词,在不同的情况下有不同的含义,根本上可分为如下三个不同的层次:a. 保守基因conserved gene)是一类在不同的物种中均存在的基因。例如,在人类基因组中已发现的基因中,约有25%在植物基因组中也存在。再如人、猪等的胰岛素基因,亦是属于保守基因。b. 保守序列conserved sequence也译作一致序列或共有序列。是指在大量相关的,但并非完全一样的核苷酸序列中,共同存在的一段核苷酸类型与数目都极少变化的特定的序列区段。在保守序列中,每一个位置的核苷酸

9、都是一系列可比较的相关序列,在一样的位置上最经常用的代表性的核苷酸。例如,大肠杆菌基因启动子中的-35元件5-TTGACA-3)和-10元件5-TATAAT-3),便是两种典型的保守序列。在众多的大肠杆菌基因启动子中,这两个元件的核苷酸类型和长度均极少变化。c. 保守区conserved region或构造域domain指在不同的蛋白质多肽链分子中,共同存在的一段氨基酸类型及数目均极少变化的特定的区域或区段。例如,转录因子的DNA结合域之一的亮氨酸构造域便属于一种有代表性的蛋白质保守区。二 基因的主要组成局部真核基因和原核基因 真核基因:真核细胞核基因组DNA编码的基因,以及感染真核细胞的DN

10、A病毒和反转录病毒基因组编码基因,统称真核基因。原核基因:由原核生物染色体基因组DNA以及高等生物线粒体基因组DNA和叶绿体基因组DNA编码的基因,都属于原核基因。基因的共有组成局部: 无论真核基因还是原核基因,其构造都有如下4个局部: a. 编码区coding region b. 非编码区noncoding region) c. 启动区 (promoter region ) d. 终止区 (terminator region)1. 编码区1编码区的含义:在原核蛋白质编码基因的mRNA分子中,以及在真核蛋白质编码基因的成熟mRNA分子中,从起始密码子通常是AUG)开场至终止密码子UAA,UAG

11、,UGA)为止的一段编码氨基酸的核苷酸序列,叫做编码区,或称编码序列区。2不连续的编码序列区:真核基因构造的主要特征是,许多真核蛋白质编码基因以及某些tRNA基因,它们的转录序列区都是被一种叫做间隔子intron)的非编码序列所连续,形成不连续的编码序列区。3编码区段与读码框:编码区与开放读码框open reading fram在概念上是有差异的。开放读码框ORF)也有的叫可读框,是指由一系列氨基酸密码子组成的不具有终止密码子的DNA序列区,或者说是可以转译成蛋白质多肽链的一段DNA序列区。它与编码区的差异在于它不包括终止密码子,而编码区那么包括终止密码子。2. 非编码区1非编码区的定义:基因

12、中转录而不转译的核苷酸序列区。尽管这些非编码序列区不转译成蛋白质多肽链产物,但对基因的表达与调控却是必不可少的。2非编码区的类型a. 5-末端非转译区5-UTR)b. 3-末端非转译区(3-UTR)c. 间隔子序列区真核蛋白质编码基因中存在3. 启动区启动子1启动区的定义:相应于原核的启动区promoter在真核基因中那么往往译作启动子,特指位于基因-末端上游紧邻转录起点外侧,一段具有特殊功能的非编码的核苷酸序列区。在有关的文献中,启动区的定义似乎不那么严格,有时人们也把-侧翼序列区泛称为启动区。从广义的角度讲,控制基因转录的各种信号的任何组合都可以称之为启动区。例如有人也把增强子enhanc

13、er归为真核基因启动子的一个组成元件element(2)启动区的构造 原核基因启动区的构造:a. 元件,亦叫box或Pribnow box,也可称之为TATAAT box;b. 元件,也叫做box,或box。真核基因启动子的构造:a. 元件,亦叫盒;b. 上游激活元件:box和 box。图1.原核基因启动区主要元件图2.真核基因启动子主要元件(3)启动区的类型:根据识别启动子的聚合酶的类别,可将真核启动子分成三种不同的类型:a. 型启动子b. 型启动子c. 型启动子4.终止区终止区的定义:terminator region也叫做终止序列,一般特指位于原核生物操纵子-末端,也是转录单位-末端转录

14、终止位点之后的一段序列,其功能是为聚合酶提供转录终止信号。终止子terminator,也叫做转录终止子或终止序列,是指位于真核基因-末端下游外侧与转录终止位点相连的一段非编码的核苷酸序列区。它具有使转录反响终止的转录终止信号的功能。2终止区的意义:a. 保证基因的转录反响在正确的位置终止;b. 产生正确长度的分子;c. 产生正确的蛋白质多肽链;d. 防止产生通读现象。三原核基因的构造原核基因组的构造大肠杆菌基因组的组成: *1. 组成:染色体基因组;质粒基因组;噬菌体基因组。*2. 大肠杆菌染色体基因组,实质上是指大肠杆菌拟核的染色体基因组N。由于质粒基因组和噬菌体基因组都比较小,一般只有几个,所以有时文献中只将大肠杆菌染色体基因组看作是E.coli的基因组。而不涉及质粒和噬菌体的基因组。*3. 大肠杆菌基因组大小小的只有4.6b左右最大可达5.5b左右实验菌株那么介于二者之间(2)大肠杆菌基因组的构造特点:*高效的遗传信息利用率a. 既没有不必要的额外重复序列,也极少存在无功能的冗余序列;b. 基因组以上的核苷酸序列都是编码基因c. 基因排列紧凑,同一个操纵子不同基因之间的间隔距离一般不超过 bp,而且其中还存在着转录起始信号和终止信号;d. 存在着编码序列彼此重叠、

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号