基因的分子进化_原理与方法_潘星华

上传人:lcm****20 文档编号:46610680 上传时间:2018-06-27 格式:PDF 页数:5 大小:454.09KB
返回 下载 相关 举报
基因的分子进化_原理与方法_潘星华_第1页
第1页 / 共5页
基因的分子进化_原理与方法_潘星华_第2页
第2页 / 共5页
基因的分子进化_原理与方法_潘星华_第3页
第3页 / 共5页
基因的分子进化_原理与方法_潘星华_第4页
第4页 / 共5页
基因的分子进化_原理与方法_潘星华_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《基因的分子进化_原理与方法_潘星华》由会员分享,可在线阅读,更多相关《基因的分子进化_原理与方法_潘星华(5页珍藏版)》请在金锄头文库上搜索。

1、自然杂志71卷4期专题综述基因的分子进化:原理与方法潘星华傅继梁理学博士(遗传学),博士后(基础医学),副教授,第二军医大学生物教研室,医学分子生物学开放实验室,上海20 0 433遗传学教授,博士生导师,第二军医大学副校 长,生物教研室主任,医学分子生物学开放 实验室主任,上海2 00433关键词分子进化进化速率分子钟系统发育树基因起源Do ba zn sky说:“不从进化的观点看问题,生物学的一切将不可理解”.分子进化研究不仅是一种特定的学科方法,而且是一种可以广泛应用的科学理论.人类墓因组计划的实施为分子进化研究赋予了孟要使命,也 提供了新的机遇.本文综述了分子进化的墓本原理、方法和最新

2、发现,包括同源性分析、进化速率估计、系统发育树、分子种和基因及基因家族起源等方面,并提出了展望.过去4 0年来,分子生物学戏剧性地改变了生物学的几乎所有领域的面貌.尽管传统的进化学家只是缓慢而勉强地认识到核酸和蛋白质序列数据的重要性,但迄今,这些数据已成为实证及理论进化研究最重要的组成部分,并在一门新的学科分支分子进化 中发挥着不可替代的作用,形成了一系列独特的方法和普遍遵循的原则.正是这些方法和原则使分子进化研究得以实现它的两个基本任务:重建基因或物种的进化历史,以及阐明基因或物种的进化机制.一、同源性分析核昔酸和氨基酸序列中记录着生物进化历史的全部信息,每一个核普酸都有它的历史渊源、来龙去

3、脉.分子进化研究的目的就是要通过破译这种信息进而了解基因进化以及生物 系统发育的内在规律.破译的最基本工作是进行 序列比较,只有在这个 基础上,进化速率、系统发育等研究才成为可能.为此,必须确定所比较的序列是从一共同祖先中分政的后代还是同一物种基因重复的产物,即是进行直向比较(orthologo u seompai rso n)还是平行比较 (pa ralogousc omparison s).另外,在实际分析中,要准确地排除由于进化 中的趋同c (onv erg enc e)进而共享特征基序(s equ e c n。moito的可能性极小.故一般满足于从“相似性”角度作序列比较并心角不宣地假

4、定他们是有同源性,研究表明这种假设一般是可行的川.评价序列相似性一般可以分为互相依赖的三个步骤:l、选择合理的计分系统;2、决 定计分 系统的统计意义3、建立最佳直线校谁比序方式(optimalalignment).习惯上,在进行核昔酸序列比较计分时,仅计 数完全相同的核昔酸数,而氨基酸的比较则应用 了5种不相同的 计分方案二相同性、密码子突变距离、化学相似性、已知同源蛋白的替换频率、在四维结构中的:一碳原子的距离1 2 1,这些计分系统在评估不同蛋白祖先同源关系中的灵敏度也有系统的研究. 2 I1.确定两核普酸序列比较得分的统计意义通常是从每一序列 中取出大量的随机序列片段,并比较这些序列片

5、段,从而产生得分的一定的分布形式,计算实际得分偏离随机得分平均值的标准差就可表示两序列相似性的统计意义4 I J.经常采用两种方法建立最佳直线校堆比序:一是先将两序列的一个小片段固定再进行比序,如i Ftc hl s l最初提出的局部(lc oa l)法和全长 (s Pan ) 法,二是采用所谓的“程序 动力学方法( dy-n am iepr oga rmm ingalgorithms)16, ,进行完全或球状g (o Iba l)比序.对在直线 校淮比序所出现的缺口(g ap)以罚分如e na lty)来解决.但目前对罚分还没有建立合理的生物学标谁1 7 1.一般方法不能检出的短的共有基序,

6、还可用Al s t h cu l及其同事8 l t建立的程序去检测.二、进化速率利用i Ll g l改 良的评价基因编码区核昔酸替换的方法,以及从化石估计的分歧时 间数据,已得到适合于多种不 同基因的每位点每年的非同义替换率(Ka )和同义替换率( Ks)的范围,它们分别是。一Zxlo一9(Ka)和2一12x1 0一9( K5 ).这是进 化的绝对速率.在没有化石资料的情况下,也可通过比较同等时间尺度的不同物种 间序列的改变程度来研究进化的相对速率,如:同一对物种间不同基因的序列分歧,一对重复基因(如:和声球蛋白)在不 同物种内的序列分歧,某一特定分类阶元 (如牛一羊)189专题综述Zjran

7、Za之hiVol.17No.4分别与其参考物种(如 猪)序列的比较,从一共同祖先 同时发散的多个物种的序列的比较等等. 有趣的是真核生物假基因几乎与功能基因的 同义替换速率或核节酸 中立替换速 率几乎完全相同【0 .当然,在 少数情况下土要是密 码 子使用谱(eodonu s age)存 在偏向(bia,、)的情 况下,Ks似乎也受到某种限制1 1!.人们很快注意到,单纯计算现存物种同源序列核释酸或氨基酸替换的差异往往低估了源于共同祖先的有关系谱 的真实替换 数目.因此,认为可能存在多次替换、平行替换及趋同替换等方式l 2.在假设它们服从泊松分布的前 提下,提 出了计算公 式,进 而iKmu

8、r a 3还提出了所谓的“二参 数模式, ,(twoparametermodel),可计算两核普 酸 序 列 之间 转换/颠换 ( tra ns 1i t () n/t ran s v er si on )比值的预期 值(l:2 ) 和真实观测值之 间 的差异.有人还在上述 方案中加人别的参数,但未得到广泛应用.R NA病毒基因的变 化 速 率 大约比DNA多聚酶 复制 的基因快1 00万倍,即:以缺乏校 读 功能pr o o卜re adingf un etio n)依赖于R NA的RNA多聚酶或反转录酶或其他酶所复制的流感病毒、反转录病 毒及原癌基因,其进化速率特征是1 03核营酸替换惊位点

9、每年I4.这种高突变率使Hv l等的进化足以赶超人群甚至受染个体 的免疫保护反应.最近研究发现,替换速度的 大小与纯 化选择(仅 允许选择上呈中性的氨基酸的替换)和超显性选择的 相对强度有一定关系,分析进化速率的变化可以探究基因功能的改变.另外,啮齿类基因的替换速 度明 显地较一般哺乳动物快,但对其原因还没有公认的解释.方法的检验才能认定一种蛋白质或基因的分子钟行为.第,如果能得到有关 分类阶原的化石,则其相应序列进 化速度的衡定性可以根 据化石年代直接证明l 7气第二如前所述,在没有化石资料的情况下,亦可进行有关谱系相对进化速率的检验,除了极少例外,这种检验方法往往是很有效的l 8”):第三

10、,如G i一 lespie指出,如果出现星状或刷状系统发育树,还需要检验分歧度的变异与平均值的比率是否一致;最后,在一个按支序方法重新构建了结点( nod a l)和祖先序列的系统发育树中,进化速率的衡定性也应 该是能够验证的仪1.在这样的检验卜,将发现多数基因的分子钟都有一定的缺陷,但一般也不 会出现太 大的速 率差异一几遇到较 大的速率 差异,往往可归结为自然选择对一个或 多个谱系基因产物的效应山l,最常见的情况是基因失去 了其全部功能而变成厂假基因或失去了部分功能同时 也失去了部分限制,也可能源于 出现超显性正选择的结果.相 反,基因的钟样进化行为则 与严格的纯化选择相符.必须指出,即便

11、是在衡 定进化的分子 中也检出 了适应性的替换2 3 1.因此大多数分子承受的选择作用与分子中保持的需要相背道而驰.不过,尽管分子钟的随机“嘀嘀嗒嗒”的速 率井不像同位素衰减那样均匀,它仍然是分子进化研究的一个有价值的工具,不仅可为许多现存的分类阶原的进化历史提供一个时间骨架,而且已为前寒武纪的生物分歧!2 41以及基因重复1 2 51提供了重要的证据.三、分子钟分子系统发育分析建立在这样一个事实基础: : J在各种不 同的发育系谱i ( ln eag e )及足够大的进化时 间尺度中,许多序列 的进 化速率几乎是衡定 不变的.为此,D i ck er son l ll于197 1年基于某些蛋

12、 白进化速率的衡定性提出 了“分子钟(moleeularelo ek), ,观点,并被Ksm、: r al“作为其“中立进化学说(neutralthe o ryorevo一utio n),的主要证据.中立进化论认为,大多数突变基因在选择上.是 中立的,即既无益又无害,中立突变基因在群体 中的固定是随机漂变引起的,因此功能上重要的基因受到更多的选择压力而进化速率较慢,新基因产生的士要方式是基因重复和不等交换.自此分子进化观点经受了深人的研究和广泛的争论.回顾过去,我们现在认识到,必须经过一种或多种190四、系统发育树J芥 列数据非常合适于构筑系统发育树. 事实上,自从Fiteh和Ma rgo一i

13、ashI2 6开创性地以20种真核生物细胞色 素C氨基酸序列构筑了系统发育树(或称进化树),并显示其与有关物种的经典进化树完全相符以来,构筑系统发育树的方法层出不穷,文献 中一片序列树的浓密的荫凉.图l和图2示出两种进化树.构筑进化树主要有两大类方法:一类是矩阵法(ma-tri xme thod ),运用序列等分子指标的距离矩阵来构筑进 化树:最常用的 方 法 是非加权对 群算 术平均法(u PGMA)f27,还 有F一M 法(Fiteh一Ma rgoliash法 )1261,Fa rr法(dista n eewa ngermethod)和改进的Fa r r法12 81,以及最新的邻接法(ne

14、ighbo r 一joining法,简称N一J法)129等,这些方法都属于表 征系统学(ph e n ei te s)范畴.第二类是直接利用氨基酸或核昔 酸序列数据来构筑进化树,最常用的是最大似然法(maximum 一ikelihood method)301,属于支序列 系统 学( cl ai ds tic s)范畴.吕宝忠3 1 】对部分具体方法作了较详细的介绍,他还总结了第三类方法然杂志71卷4期专题综述简约法(p盯aismony). 这些方法的基础都是以最小进化原理为基本假设,即认为核普酸替换数最小的进化树为最接近客观进 化历史的进化树.提出有关方法的作者或其 他 人对这些方法都进行 过

15、计 算机 模 拟 或原核生物的实验进 化研究 的验证,表明都相对 精确地重建系统 发育史 1 3 2.但 探入研究 表明【33 5:一般 情况下,UPGMA法常 能较 好地而且一 目一r然地显示进 化树合运用几种方法.在迄今化石证据仍存在巨大缺口的情况下,分子系统发育研究确实大大加强了在某些情况下甚至改变了我们对许多基因和许多分类阶元生物进化历史,甚至对许多基因功能的认 识.念珠菌脉胞菌五、基因起源分子进化研究也使我们更清楚地理解真核基因基本结构的起源. 我们知道,许多真核生物蛋 白质是由多种互相分离的外显 子所编 码的功能 性结构域f uc ni toa nldomain)组成的,oizbe

16、rtl 6认为内含子是基因发生在古细胞的早期进化遗迹,在真核基因进化的历史长河中,慢慢地散在地丢失,有的至今保留有原有的某些功能或获得新的功能从而形成内含子内基因等现象;而在原核基 因谱系中,则是快速地大片地丢失,从而表 现为原核基 因的连续性. 有 许多蛋 白由外显子特异的功能结构域,或具有相似二级结构的结构域所组成田,其进化历史可以通过内含子的丢失来分析.但也有一些基因,其内含子是在新近获得的1 3 8.具有 自我剪切能力的可动内含子 (mobs一eintron)的发 现139】表明,早期细胞 中的可动遗传因子促进了基因的形成,而且这一过程可能至今仍在一种更严格的选择压力下继续进行着.图1细 胞色素C进化 树. 根据细胞色素C氨基酸 序列推算的 实际突变距 离D(突变距 离为两种同源 分子的基 因 间核式普酸差 异 数)以F一M 法构筑的 进化树. 图中数字 为 重建突 变距离D . 任意两物 种细胞 色素C的D 为有 关各 分枝 长之 和,如人和金枪 鱼 之 间刀二0名+6刀+

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号