全基因组复制文献(最终翻译版)

上传人:宝路 文档编号:22148806 上传时间:2017-11-25 格式:DOCX 页数:12 大小:296.40KB
返回 下载 相关 举报
全基因组复制文献(最终翻译版)_第1页
第1页 / 共12页
全基因组复制文献(最终翻译版)_第2页
第2页 / 共12页
全基因组复制文献(最终翻译版)_第3页
第3页 / 共12页
全基因组复制文献(最终翻译版)_第4页
第4页 / 共12页
全基因组复制文献(最终翻译版)_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《全基因组复制文献(最终翻译版)》由会员分享,可在线阅读,更多相关《全基因组复制文献(最终翻译版)(12页珍藏版)》请在金锄头文库上搜索。

1、种子植物的全基因组复制事件Angiosperms 被子植物Polyploidy 多倍体Orthogroup 纯正群WGD 全基因组的复制phylogenomics 种系基因组学同义现场发散(KS )Eudicots 双子叶植物MLT 最大似然树unigene 是 Universal Gene 的英文缩写,意为广泛通用的基因数据库全基因组的复制( WGD ) ,或多倍体,伴随着基因的损失和二倍化,长期以来被认为是动物,真菌和其他生物,尤其是植物一个重要的进化动力。被子植物的成功归功于在某种程度上,与基因或全基因组复制相关的革新,在保存的基因序列的分析中找到了能阐明单子叶植物和双子叶植物分化时间、

2、同时更为古老的基因组复制的证据,但这些证据仍然模棱两可。在这里,我们用测序的植物基因组的全面的系统发育基因组分析和系统发育,基因举足轻重的谱系超过12.6万个新的表达序列标签序列阐明两组古老的基因重复一中现存种子植物的共同祖先和其他在现存被子植物的共同祖先。基因复制事件进行了强烈集中在3.19亿年前和1.92亿年前,暗示在祖先谱系两次全基因组复制在现存种子植物和被子植物分别多样化前不久。显著,这些祖先全基因组复制导致调节基因重要的种子和花发育的多样化,这表明他们参与了重大创新,最终促成种子植物和被子植物的兴起和最终的霸主地位。被子植物是目前陆生植物中最大的群体,拥有超过300,000的生物物种

3、。显著,大多数开花植物谱系反映了一轮或多轮古多倍体。例如,对拟南芥进行的完整基因组序列分析支持了最近的两次全基因组复制(命名为a和b),在这期间,十字花科植物(十字花科)的直系和一个三重事件(c),可能由所有核心双子叶植物共享。毛果杨基因组显示了核心双子叶植物三重证据以及更近的全基因组复制。在单子叶植物(R和S)两个多倍体事件被推定为已经先于谷物和其他草(禾本科)的多元化。一些研究暗示,一个古老的全基因组复制事件比被子植物进化还早。然而,这些古老事件的存在和时间,和他们的长期影响,仍然不明朗。这里我们使用了严格的种系基因组学办法(补充图1;补充方法里的详细信息),以测试单子叶植物和真双子叶植物

4、的分化之前发生的一个或多个古老的基因组复制的假设。由重复的事件映射到系统进化树,我们判断旁系同源物是否在一个给定的物种事件(图1a)之前或之后复制。虽然单个基因可能会丢失一些系统发育,但从很多或者全部的基因家族来同时考虑,一张广阔的蓝图可以绘制。我们使用同种完全测序的基因组(补充表1 ,两个单子叶植物(水稻和高粱)和五个真双子叶植物(拟南芥,番木瓜,毛果,黄瓜和葡萄)来构建基因科或亚科。当给基因重复和在单子叶植物、双子叶植物分化之前发生的潜在全基因组复制测定年份时一种lycophyte (卷柏moellendorffii )和一种苔藓(小立碗藓)作为外类群(对照组)。总体而言,所有基因组测序中

5、的蛋白质编码基因的77.03 被分成31,433个多基因核心纯正群 。我们定义纯正群是发源于中心类群的有共同祖代单个基因的同源基因簇,并参考纯正群九个测序的基因组为核心纯正群。其中, 7470个核心纯正群包含至少一个单子叶植物,一个双子叶植物,一个卷柏和/或小立碗序列。这些核心纯正群在我们推算单子叶植物双子叶植物分化的复制事件的调查中被用到。我们为每个核心纯正群的指示共享重复的拓扑结构(图1a ,分析I)查询最大似然树( MLTS ) 。我们筛选了基因树(补充方法) ,要求七个核心品种中至少一个保留两个旁系,紧随一个单子叶植物、双子叶植物的共同祖代所推断出来的基因复制事件其后(见补充资料1纯正

6、群的列表) 。例如,纯正群1711(DEADbox RNA解旋酶)的最大似然树(包含在单子叶和真双子叶植物而MLTS为纯正群 2312 (亚精胺合酶)重复基因和纯正群 396 (功能未知)表明,无论是单子叶植物或双子叶植物旁系同源物之一是丢失后单子叶植物和真双子叶植物的分歧(见典范树补充图2a , 3a和4 ) 。在这个保守的标准的基础上,我们发现了大量的核心纯正群与单子叶植物和真双子叶植物(共享重复重复829 799核心纯正群与引导支持( BS)大于或等于50 ; 474重叠在451核心纯正群符合BS=80 ;补充资料2 ) 。的C三重(它可被限制在真双子叶植物)之前发生的这些重复。正如所料

7、,取样双子叶植物谱系中的许多年轻的重复也观察到在这些树上( 1,146 纯正群存活至少一个双子叶宽一式三份( c)条) ,但在本研究中,我们专注于该单子叶植物的分化之前发生的古老的重复和真双子叶植物。和裸子植物(松属,云杉属, Zamia ,柳杉等;补充表2 ),从基部被子植物(补充表2马兜铃,鹅掌楸, Nuphar和Amborella )额外的同系物中加入799芯纯正群以形成扩大纯正群 。这些关键系统发育谱系增加基因采样,并提供更好的分辨率古代重复的时机。由“基本被子植物”我们的意思是开花植物单子叶植物和真双子叶植物分离之前出现的最早分支谱系。在重新估算的扩大纯正群基因树,我们又增加了质量控

8、制步骤,除去短期或高度分散的基因数据库 (从表达序列标签数据集组件中所产生的序列;补充方法) 。过滤后,仍然有540和338 纯正群与基因数据库一起分别从基部被子植物和裸子植物采样。这其中, 322 纯正群含有由基底被子植物和裸子植物(图1b)个单一。对于540纯正群从基部被子植物个基因数据库 ,树木的数量中,我们发现了一个重复祖先被子植物起源之前(图1a ,分析第IIa )大大超过了我们被子植物起源后,确定了共同的重复数(图1a,分析IIb)中。一个重复的推论预先约会基底被子植物(祖先被子植物重复)的多样化是由262 ( BS=80 )的支持或343 ( BS=50 ) 纯正群 ,而只有一个

9、(BS=80 )或五个( BS=50 ) 纯正群支持一个基因复制的推断只是被子植物冠组(图1b ,分析II)的由来之后。我们还发现,只有五个与幸存的重复使用一些共享纯正群 ,但不是全部,采样基础被子植物。虽然基底被子植物是一个档次的(而不是一个分支) ,我们代表他们与图一行。 1A因为重复信号是包括所有基础被子植物。338个纯正群填充裸子植物基因数据库额外的分析鉴定62 (BS=80 )或147 ( BS=50 ),其中包含一个种子植物全基因复制和59 ( BS=80 )树木或110 ( BS=50 )树木以后的复制只能通过共享被子植物(图1b ,分析三)。此外,分析了322 纯正群扩大了与来

10、自基底被子植物和裸子植物直系同源物也检测到了两个古老的共享重复类似的信号: 65 ( BS=80 )或130 ( BS=50 )的树木呈现一个祖先的种子植物的重复(见典范树补充图2b ) ,和54 ( BS=80 )或88 ( BS=50 )树木支撑被子植物的祖先重复(补充图3b和图1b ,分析四)。总之,我们的保守滤波程序确定的799棵有适合有关古代重复的存在假设检验的拓扑结构。这些树提供了两组重复的,一个在所有种子植物的共同祖先的所有被子植物和其他的共同祖先存在压倒性的支持。有几种机制可以解释基因复制的协同模式在基因树透露,包括WGD或多个节段或染色体复制。现有数据的最简约的解释是古WGD

11、 。我们进行分歧时间分析,以进一步研究这一假说。如果拟议的WGDs是真实的,估计日期的独立基因树木基因复制事件预计将是相似的。可选地,如果重复是无关(即,独立的事件的集合)中, 重复次裸子植物和被子植物的起源之间的区间内的均匀分布所预期的祖先被子植物重复或导致种子植物的分支为祖种子植物重复。我们校准的799核心纯正群支持(BS=50 )单子叶植物和真双子叶植物从我的分析分离前古重复和估计的使用程序R8S (补充方法)在774核心纯正群 860节点的分歧时间。然后,我们分析了使用分配的分歧时间估计要由混合模型中指定的类贝叶斯方法的推断重复时间的分布。重复时间的分布是双峰,峰值19262 ( 95

12、 置信区间)和319.63亿年( MYR)前。日期被集中在两个相对短的时间间隔,这表明这些重复没有均匀分布(图2a) 。此外,我们还分析了古代重复的499节点的435纯正群符合BS=80 (图2b ),并发现了类似的分布模式(两个组成部分: 21064和32164秘耳前) 。然后,我们研究古代重复仅限于在分析三纯正群已被填充了近全长裸子植物基因数据库的年龄分布。其中338 纯正群与推断的绝对年代,有110 (BS=50 ; 59 80 BS )是放置一个重复的被子植物分支从裸子植物发散后。重复次从这些纯正群推断的分布表现为一侧显著峰( 23469或23669秘耳前; 。补充图5A , B) 。

13、现存被子植物中存在的最近的共同祖先一直追溯到130-190秘耳前。因此,所识别的事件的重复现存被子植物的辐射,这与从系统发育分析的结果(图1b ,分析)之前发生。一个额外的分析仅限于那些147 (BS=50)或62 (BS=80) 纯正群(图1b ,分析a)中所包含的种子,植物全重复的基础上的系统发育分析。混合模型分析确定了重复时间的分布只有一个显著组成部分( 34963或34764秘耳前; 。补充图5C ,D ) ,这是年纪比祖节点为现存种子植物( 310秘耳前) 。因此,无论是分子约会和系统发育分析支持另一种古老的全基因组复制所有现存种子植物(图3)共享。的同义位点发散的重复基因和同线性分

14、布的分析也支持这一结论(补充讨论) 。基因重复提供了新颖功能的进化原的遗传物质。 WGD在古代种子植物会产生每一个基因的多个副本,其中一些表型新奇的起源可以有至关重要的作用,并最终在起源和被子植物的迅速多样化。虽然这些保留从祖先WGDs重复基因代表了所有功能类别,有来自几个功能类,包括转移和结合蛋白,转录因子和蛋白激酶(补充图6及补充资料3 )保留重复基因过剩。这些类别显著富含纯正群尚存在分析我所描述的单子叶植物,双子叶植物的重复和纯正群幸存的预被子植物和/或预种子植物中的重复分析三。这些结果与基因保留的以下更近WGDs在拟南芥谱系(参见23和其中的参考文献)模式一致,并WGD在脊椎动物中,支

15、撑的解释,在这里观察到的并发的重复是WGD的产品。总而言之,这些模式表明,对于某些类型的基因复制下面的多倍体要保留的倾向一直是后-WGD二倍化过程中整个植物的进化史的一个共同特点。本来可以到古老的种子植物和被子植物的创新贡献重复基因的一个子集,包括那些在繁殖和花发育的特殊角色。在这项研究中,我们发现参与花发育途径与单子叶植物和真双子叶植物的分化之前至少有一个古老的复制事件(补充表3) 35 纯正群 。例如, 纯正群 361 (含拟南芥光敏色素基因) ,其中包括开花时间和种子发芽监管,保留重复基因下面两个假定WGDs预约会被子植物和种子植物,起源分别与已发布的亲缘关系的光敏色素一致基因家族。其他

16、已发表的基因家族系统发育还建议基因复制的常见模式,暗示在这里看到的全基因组规模的重复。例如, TIR1/AFB已经现存被子植物的多元化经历过的一个古老的重复。锌指同源盒( ZHD )系列, HD -ZIP III基因家族,并MADS- box基因(补充讨论)的系统发育分析表明重复图案与WGDs预先约会被子植物和种子植物的起源是一致的。因此,单个基因或基因家族,这些以前的研究支持我们的结论基于对成千上万个基因的全基因组的调查,并找出一些从这些重复的可能已经在种子植物和被子植物的演化有重要的作用所产生的许多基因。方法综述系统发育分析. 我们使用 OrthoMCL方法来建构一套核心纯正群。生成与肌肉所有纯正群氨基酸比对,然后通过除去不良的对准区域使用TRIMAL1.2修整。为核心纯正群(检索到HaMStR)其他单基因排序的序列,在氨基酸水平进入现有9种“全路线(修剪之前)使用CLUSTALX1.8对齐。修整后,将各单基因序列进行检查,并去除其外对准,如

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号