南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究

上传人:新** 文档编号:577762177 上传时间:2024-08-22 格式:PPT 页数:39 大小:4.88MB
返回 下载 相关 举报
南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究_第1页
第1页 / 共39页
南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究_第2页
第2页 / 共39页
南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究_第3页
第3页 / 共39页
南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究_第4页
第4页 / 共39页
南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究_第5页
第5页 / 共39页
点击查看更多>>
资源描述

《南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究》由会员分享,可在线阅读,更多相关《南方红豆杉叶绿体全基因组分析反向重复区域的丢失以及与相关物种的比较研究(39页珍藏版)》请在金锄头文库上搜索。

1、南方红豆杉叶绿体全基因组分析-反向重复区域的丢失以及与相关物种的比较研究研究背景研究背景研究背景研究背景自从烟草和地钱叶绿体基因组序列的首次报告以来,一些陆生植物叶绿体基因组序列就被陆续确定。最近的测定各种植物品种的完整叶绿体基因组序列的分析中已经进行了了大量的对比分析,促进了植物和基因组进化的研究,包括基于这些数据的转录组分析和泛基因组分析。虽然裸子植物物种的完整的叶绿体基因组序列少有公布,仍然在其中发现了其独特的性状,如大规模的基因组重排和更频繁的基因缺失和插入事件。研究背景研究背景在进化过程中,基因组重排和陆地植物叶绿体基因组的基因丢失事件被认为与反向重复序列的大小有着密切的关系。大型反

2、向重复序列有助于稳定叶绿体基因组,减少基因损失和重排的可能性。在大多数被子植物如海枣属中,LSC、SSC和IR的相对大小保持不变,其基因排序方式和基因内容与被子植物的祖先几乎是相同的。然而,裸子植物如松科、柏科的一些分支丢失了一个反向重复区域,导致了其叶绿体基因组中更多的基因丢失和结构重排。研究背景研究背景南方红豆杉是红豆杉科红豆杉属的一个变种,属于中国特有物种。它的次级代谢产物紫杉醇可以用来治疗卵巢癌、乳腺癌和非小细胞肺癌,是在过去十年中最有前景的抗肿瘤剂,对于晚期以及顽固的卵巢癌,乳腺癌均显示出活性。紫杉醇最早是在20世纪70年代从太平洋紫杉树的树皮中分离,但红豆杉的叶子被发现同样可以作为

3、紫杉醇及相关类毒素的来源。由于乳腺癌的患病率增加,其独特的药用价值逐渐被认可。南方红豆杉质体基因组信息的获取将为进一步的转录组和蛋白质组分析提供有用信息,并为研究催化叶绿体中的天然化合物的生物合成的酶的方法提供基础。研究背景研究背景目前,一些裸子植物物种基因组的基因含量和结构仍鲜为人知, GenBank中只有3个红豆杉科物种完整的叶绿体基因组序列被公布。在本研究中,我们报告了南方红豆杉的完整叶绿体基因组序列。这是在红豆杉属首次报道的叶绿体基因组。在这份报告中,我们详细描述了基因组组装,注释和其中的简单序列重复(SSR)。为了更好地理解南方红豆杉的叶绿体基因组的独特的结构,还进行了散点图分析和基

4、因组比较分析。材料和方法材料和方法材料和方法材料和方法2.1DNA测序和基因组组装测序和基因组组装采集了南方红豆杉的新鲜叶片用于DNA提取,5g纯化的DNA被用于构建叶绿体DNA文库。Solexa高通量测序系统被使用来产生原始的read用于本实验。由于初始的序列read为核基因组DNA和细胞器DNA的混合物,基于已知的叶绿体参考基因组,使用了BLAT软件来从中分离出与叶绿体相关的read。使用SolexaQA来将低质量的read剔除。使用了SOAPdenovo软件来进行组装,其K值设置为57。随后基于已有的篦子三尖杉的叶绿体基因组,对contig进行人工组装,形成环形基因组。材料和方法材料和方

5、法各个contig之间的Gap使用如下方法来进行填补:使用BLAT将原始测序得出的read在组装成的contig两段进行作图,并且通过添加重叠的read来延长contig。重复添加read直到两个重叠群之间的gap被填补完毕。为了避免组装过程中出现的错误,我们设计了4对引物用于PCR扩增以验证可能的SC/IR边界区域以及多聚体丰富的区域。材料和方法材料和方法2.2基因组注释基因组注释南方红豆杉基因组的注释使用的是DOGMA(DualOrganellarGenoMeAnnotator)软件。其预测的基因序列使用在线BLAST功能进行了再次验证。开放阅读框使用NCBI网站上的ORFfinder软件

6、进行了鉴定。预测的tRNA基因使用tRNAscan-SE进行了再次检测。密码子的使用使用CodonW进行了计算。南方红豆杉的环形图使用OGdraw软件进行了绘制。材料和方法材料和方法2.3基因组结构和基因多样性的比较研究基因组结构和基因多样性的比较研究Harr-plot分析使用了PipMaker,用以提供南方红豆杉和其近缘种(主要是台湾三尖杉和台东苏铁)之间基因组的比较分析。对两两基因组之间倒置所需最小重排数进行了鉴定,9个叶绿体基因组被使用来进行基因组间分化的分析。使用ClustalX来将南方红豆杉与其他物种进行序列比对,以鉴定序列中的差异位点。Speciesaccession number

7、台东苏铁Cycas taitungensisNC_009618银杏Ginkgo bilobaJN867583雪松Cedrus deodaraNC_014575桃柘罗汉松Podocarpus totaraNC_020361烟草Nicotiana tabacumNC_001879水稻Oryza sativaJN861110玉米Zea maysNC_001666日本柳杉Cryptomeria japonicaAP009377台湾杉Taiwania cryptomerioidesNC_016065材料和方法材料和方法2.4重复结构重复结构使用了REPuter软件来分析了南方红豆杉基因组中的正向重复和反

8、向重复的序列,各个重复结构的相似性控制在90%以上,长度控制在30bp以上。使用了MISA检测了SSR序列,阈值设置如下:单核苷酸重复控制在10次以上,二核苷酸重复的序列长度控制在12个碱基以上,三核苷酸和四核苷酸重复的序列长度控制在15个核苷酸以上,其它重复的序列长度控制在24个核苷酸以上。研究结果研究结果研究结果研究结果3.1基因组组装和验证基因组组装和验证测序结果以及随后的组装结果如下:我们人工修正了叶绿体基因组中的模糊核苷酸位点,它们主要是在从头组装的延伸步骤中产生的,我们同样修正了与插入缺失相关的错误,这主要是由基因组中的聚合物重复产生的。Totalnumberofpaired-en

9、dreads16,139,329Averagereadlength(afterfilteringlow-quality)71.5Readsusedincompletecpgenomeassembly562,270(3.48%)Numberofbasesusedincompletecpgenomeassembly39,077,765Foldcoverageofchloroplastgenome266X研究结果研究结果No.directionprimerdirectionprimer1forwardACGGCTTAAACAAGAACACCCreverseACACTCCGACTTTATCACCTCT

10、2forwardGGATGATGCGTAACACCACCreverseATGTCCCTATGTTTCCCAAAATG3forwardTCGATGAAGAGAGTGCGAGTreverseAATGCCTCGAAGCCAGGATC4forwardGGAGAGATCATTTGTCTTGAAGCreverseCAGCTTGGCCCAATGATCTTTable S2. Primers designed for PCR amplifications.为了检测组装获得的叶绿体基因组的正确性,我们设计了4对引物来用于PCR扩增,用来验证可能的边界区域以及同聚物丰富的区域。最后完整的南方红豆杉叶绿体基因组序列被

11、保存于GenBank.3.2南方红豆杉叶绿体基因组的一般特征南方红豆杉叶绿体基因组的一般特征南方红豆杉(129513bp)台湾三尖杉(136,196bp)篦子三尖杉(134337bp)台湾杉(132,588bp)日本柳杉(131,810bp)台东苏铁(163,403bp)银杏(156,945bp)柏科三尖杉科与三尖杉属和松属相似,南方红豆杉无典型的IR区域,这就导致了LSC和SSC区域的边界难以定义。2024/8/22CategoryforgenesGroupofgeneNameofgeneSelf-replicationRibosomalRNAgenesrrn16,23,5,4.5Trans

12、ferRNAgenestrnC-GCAtrnD-GUCtrnE-UUCtrnF-GAAtrnfM-CAUtrnG-GCCtrnG-UCCatrnH-GUGtrnI-CAU(2)trnI-GAUatrnK-UUUatrnL-CAAtrnL-UAAatrnL-UAGtrnM-CAUtrnN-GUUtrnP-GGGtrnP-UGGtrnQ-UUG(2)trnR-ACGtrnR-UCUtrnS-GCUtrnS-UGAtrnS-GGAtrnT-GGUtrnT-UGUtrnV-GACtrnV-UACatrnW-CCAtrnY-GUASmallsubunitofribosomerps2,3,4,7,8,11

13、,12(2),14,15,16,18,19Largesubunitofribosomerpl2a,14,16,20,22,23,32,33,36DNAdependentRNApolymeraserpoA,B,C1a,C2aTranslationalinitiationfactorinfAGenesforphotosynthesisSubunitsofphotosystemIpsaA,B,C,I,J,MSubunitsofphotosystemIIpsbA,B,C,D,E,F,H,J,K,L,M,N,T,ZSubunitsofcytochromepetA,B,D,G,L,NSubunitsofA

14、TPsynthaseatpA,B,E,Fa,H,ILargesubunitofRubiscorbcLChlorophyllbiosynthesischlB,L,NSubunitsofNADHdehydrogenasendhAa,Ba,C,D,E,F,G,H,I,J,KOthergenesMaturasematKEnvelopmembraneproteincemASubunitofacetyl-CoA-carboxylaseaccDc-TypecytochromesynthesisgeneccsAGenesofunknownfunctionConservedopenreadingframesyc

15、f1,2,3a,4PseudogenesPseudogenePseudo-clpPa研究结果研究结果南方红豆杉叶绿体基因组整体的AT含量为65.37%,这与篦子三尖杉(64.76%)和台湾三尖杉(64.92%)相似,但是高于台东苏铁(60.5%),水稻(61.0%)以及黑松(61.2%)。研究结果研究结果AminoacidCodonNo.RSCUtRNAAminoacidCodonNo.RSCUtRNAPheUUU7111.35SerUCU4171.89UUC3400.65trnF-GAAUCC1790.81trnS-GGALeuUUA7232.06trnL-UAAUCA2601.18trnS

16、-UGAUUG4161.19trnL-CAAUCG950.43CUU4041.15ProCCU3571.7CUC1270.36CCC1650.79CUA3250.93trnL-UAGCCA2491.19trnP-UGGCUG1110.32CCG690.33IleAUU8871.5ThrACU4681.88AUC3100.52trnI-GAUACC1490.6trnT-GGUAUA5750.97ACA2801.13trnT-UGUMetAUG4651trnfM-CAUACG980.39ValGUU4331.45AlaGCU6632.05GUC1270.42trnV-GACGCC1520.47GU

17、A4581.53trnV-UACGCA3681.14trnA-UGCGUG1800.6GCG1100.34TyrUAU5981.64CysUGU1821.56trnC-GCAUAC1300.36trnY-GUAUGC520.44TERUAA20.75TERUGA41.5UAG20.75TrpUGG3561trnW-CCAHisCAU3691.62ArgCGU3241.78trnR-ACGCAC870.38trnH-GUGCGC610.34GlnCAA5351.56trnQ-UUGCGA2291.26CAG1530.44CGG490.27AsnAAU6281.56SerAGU2851.29AAC

18、1750.44trnN-GUUAGC850.39LysAAA7551.55trnK-UUUArgAGA3311.82trnS-GCUAAG2170.45AGG980.54AspGAU6371.61GlyGGU5551.49GAC1530.39trnD-GUCGGC1290.35trnG-GCCGluGAA7791.56trnE-UUCGGA6391.72trnG-UCCGAG2220.44GGG1650.44共有19657个密码子构成了南方红豆杉的蛋白质编码基因。在这些密码子中,1772(9.01%)的密码子编码了异亮氨酸,234个密码子编码了半胱氨酸,分别是最多和最少的氨基酸。研究结果研究结

19、果3.3基因分布和基因内容基因分布和基因内容南方红豆杉叶绿体基因组有9个基因含有内含子,大多数为单内含子基因,除了ycf3,该基因的外显子由两个内含子分割开来。基因rps12为反式剪接,其在叶绿体基因组上的两个部分相距19kb,在一些起始密码子中检测到了特殊的密码子偏好,例如基因rpl16以ATC起始,编码异亮氨酸,而近缘种台湾三尖杉使用的密码子为常见的ATG。基因rps16被鉴定为假基因,因为在编码区中鉴定出了两个终止密码子,分别位于起始密码子下游18和51个碱基处。研究结果研究结果Repeatno.Size(bp)TypeRepeat1locationRepeat2location190D

20、IGS(rpl33rps18)IGS(rpl33rps18)290ItrnI-CAUatrnI-CAUb3141Dycf2ycf2458Dycf2ycf25102DIGS(rrn16trnI-GAU)IGS(rrn16trnI-GAU)6124DIGS(rrn16trnI-GAU)IGS(rrn16trnI-GAU)773Dycf1ycf18110DIGS(ycf1chlN)IGS(ycf1chlN)9197DIGS(ycf1chlN)IGS(ycf1chlN)10199DIGS(ycf1chlN)IGS(ycf1chlN)1164DIGS(ycf1chlN)IGS(ycf1chlN)1224

21、8ItrnQ-UUGatrnQ-UUGb13170DaccDaccD14120DclpPclpP1571DclpPclpP16499DclpPclpPintron3.4重复结构分析重复结构分析重复分析鉴定出了48个正向重复和2个反向重复,均在30bp以上,序列一致性大于90%。最长和最短的重复分别为499bp以及58bp。在编码区域发现了7个重复,一个发现于clpP的内含子中,其它重复均发现于基因间隔区。研究结果研究结果在南方红豆杉的叶绿体基因组中有22个长度10的SSR序列,包括14个单核苷酸重复,两个二核苷酸重复,一个三核苷酸重复,一个六核苷酸重复和4个复杂重复。没有发现4核苷酸重复。所有

22、的(14/14)单核苷酸重复均由A或者T构成。我们同样分析了叶绿体基因组中的SSR分布,其中9个SSR分布于CDS,含有这9个SSR的基因分别对应于ycf4,rps8,rpl32,ycf1,rps2,rpoC2和clpP。ycf1基因被发现含有3个SSR,包括两个单核苷酸重复以及一个六核苷酸重复。No.LocationSSRtypeSSRSSRstartSSRend1psbTpsbBp2(TC)6554455552ycf4p1(T)10822682353psbEpetLc(T)10attgggcg(T)1112,58712,6154rpl33rps18p1(T)1115,25915,2695r

23、ps8p1(T)1118,10318,1136trnI-CAUycf2c(TA)7tcaa(AT)6caa(AT)6caa(AT)724,45224,5137ndhB intronp1(T)1433,48133,4948rpl32p1(A)1049,36549,3749rps15ycf1p3(AAT)560,26760,28110ycf1p1(T)1062,00562,01411ycf1p1(T)1163,27363,28312ycf1p6(TCTTCC)564,88964,91813psaMtrnG-UCCp1(A)1080,79780,80614atpAatpFc(TA)6tttgta(T

24、)1082,90082,92715rps2p1(T)1186,61086,62016rps2rpoC2p1(T)1487,24287,25517rpoC2p1(T)1088,20488,21318rpoC2rpoC1p1(T)1590,22190,23519rpoBtrnC-GCAp2(TA)896,58196,59620ndhCtrnV-UACp1(T)12118,453118,46421atpErbcLp1(T)12122,150122,16122clpPc(A)11gggaaaaaaaaagggaaaaaaaaagg(A)10127,356127,402讨论讨论讨论讨论4.1南方红豆杉其

25、他裸子植物之间的基因含量的差异南方红豆杉其他裸子植物之间的基因含量的差异南方红豆杉和其他一些裸子植物叶绿体基因组含量有显着的区别。基因rps16是红豆杉的叶绿体基因组没有的。这种rps16的缺失还在黑松的叶绿体基因组中被发现。另一种定位在红豆杉和银杏的ndhJ和ndhK之间的基因psbG,在南方红豆杉的叶绿体基因组之中完全不存在。这种psbG基因的缺失同样出现在台东苏铁的叶绿体基因组。psbG基因被认为是一种NDH基因,而不是一个光系统II基因,并且已经发现,所有的NDH基因在黑松中均发生了丢失。这些NDH基因的损失被认为是源于黑松叶绿体基因组中特定的基因突变。这种现象为NDH基因在进化过程被

26、从叶绿体转移到细胞核提供了证据。讨论讨论南方红豆杉的叶绿体基因组与台湾三尖杉(已发表的与南方红豆杉关系最接近的物种)相比缺少一个编码蛋白质的基因(psbG)和tRNA基因(tRNA-UGC)。tRNA-GUC在在台湾三尖杉、篦子三尖杉和台东苏铁的叶绿体基因组中有发现。此外,四个核糖体蛋白基因(rps11,rps18,rps3和rpl23)在南方红豆杉的叶绿体基因组中发现,它们在柏科如日本柳杉中也有发现,在台湾三尖杉的叶绿体基因组则没有发现。在这四种不同的核糖体蛋白基因中,rps11已发现仅在十几个物种存在,包括早期分化的植物和绿藻中。剩下的三个核糖体蛋白基因都在mtDNA中出现。据报道,在水稻

27、的核基因组中被发现了2个rps11基因,在其线粒体基因组中发现了一个rps11的假基因。核糖体蛋白基因rpl32,也在被子植物如蓝桉和栽培稻,蕨类如铁线蕨,裸子植物如台东苏铁和日本柳杉中被发现,但在胡杨中该基因从叶绿体基因组转移到了核基因组。我们已经将南方红豆杉叶绿体中的rpl32基因序列与其它6个裸子植物,2个单子叶和1双子叶植物进行了比对,rpl32在9个参考序列中的平均长度是71个氨基酸,而在南方红豆杉的长度是107个氨基酸。该序列在C-末端附近是高度保守的,而N-末端附近的其余部分是多样化的。据报道,转移的杨树叶绿体rpl32基因编码183个氨基酸,并且在C-末端区域也发现了进化上保守

28、的结构域。但是,南方红豆杉的叶绿体基因组rpl32的N-端延伸的部分仅仅是核糖体蛋白的一个组件还是具有另一个生物功能目前仍不明确。讨论讨论包括南方红豆杉在内的10个物种的rpl32氨基酸序列比对讨论讨论4.2南方红豆杉叶绿体基因组基因的多样化南方红豆杉叶绿体基因组基因的多样化accD基因编码质体乙酰辅酶A羧化酶(ACC酶)的-羧基转移酶亚单位,广泛分布于各种陆生植物物种的叶绿体基因组之间,包括不进行光合作用的寄生植物。然而,买麻藤中accD基因的顺序是完全丢失的,其阅读框长度在其他裸子植物中发生了显著的变化。南方红豆杉的accD阅读框长度是773密码子,比台湾三尖杉(1056个密码子)的短,但

29、比日本柳杉(700个密码子)的更长。然而,苏铁,银杏,和松科的阅读框长度要短得多,范围从320到359密码子不等,不到红豆杉和三尖杉一半的大小(红豆杉科)。讨论讨论clpP基因编码Clp蛋白酶的蛋白水解亚基,它具有ATP的依赖性。在南方红豆杉的叶绿体基因组中发现其近N-末端有着独特的串联重复序列延伸。我们对南方红豆杉中clpP基因的氨基酸序列与其他7种陆地植物物种,包括5种裸子植物,1种单子叶和1种双子叶植物进行了比对。clpP在7个参考序列的平均长度为210个氨基酸,而在南方红豆杉的长度是404个氨基酸。序列扩展的原因是复杂SSR重复的存在。研究结果研究结果包括南方红豆杉在内的8个物种的cl

30、pP氨基酸序列比对讨论讨论4.3大反向重复序列区在南方红豆杉叶绿体基因组内的缺失大反向重复序列区在南方红豆杉叶绿体基因组内的缺失相较于有一对大的反向重复序列的台东苏铁叶绿体基因组,南方红豆杉叶绿体基因组中对应的一个IR片段已经完全丧失。剩余的IR被分为两个部分,SSC区域位于中部。黑松同样在其叶绿体基因组之中丢失了一个大的反向重复序列区域。讨论讨论在黑松叶绿体基因组中,IR区域被分成三个部分。黑松退化后的IR区域有495bp长,包含一个重复的trnI-CAU基因和部分的psbA基因,松属物种的反向重复序列被认为在结构上与其它物种存在差异,由两个或更多个基因构成,包括trnI-CAU基因,据推测

31、这由于大量反向重复序列的不完整损失导致的。在南方红豆杉叶绿体基因组中发现有两对短的IR序列,由284bp和114bp的IR构成,它们分别含有重复的trnQ-UUG和trnI-CAU基因。基于已经确定的松科叶绿体基因组反向重复序列,南方红豆杉叶绿体基因组残留的反向重复序列可能是一个包含重复trnI-CAU基因的114bp反向重复。讨论讨论大的反向重复序列被认为能稳定叶绿体基因组,使之能应对大型的结构重排,大反向重复序列的损失,导致南方红豆杉的叶绿体基因组出现更多的基因缺失和插入事件和基因组重排。被子植物里的豆科植物叶绿体基因组中就发生了结构的变化,它们同样也丢失了反向重复序列,所以相比之下,丢失

32、了反向重复序列的品种更倾向于发生重排。讨论讨论4.4南方红豆杉叶绿体基南方红豆杉叶绿体基因组的大反向区域因组的大反向区域除了大反向重复序列的丢失,基因组重排似乎已经在红豆杉的叶绿体基因组的进化中扮演了重要的角色。在这项研究中,我们使用了5种陆生植物,包括红豆杉的叶绿体基因组在内,通过基因组规模上的基因排列来研究发生倒位的原因。讨论讨论我们通过在叶绿体基因组的两两比较倒位,确定它们之间的结构差异,估计出的最小的重排方式,即使倒位未必是导致基因顺序变化的唯一的突变事件。需要至少3次倒位才能将台湾三尖杉的叶绿体基因组的基因结构转变成南方红豆杉的叶绿体基因组,至少需要花5次倒位以及大型反向重复序列的删

33、除,才能将台东苏铁的基因构造成南方红豆杉的叶绿体基因组结构。讨论讨论Harr散点图分析表明,南方红豆杉叶绿体基因组的结构在基因顺序方面与其他陆生植物的叶绿体基因组存在显著不同。讨论讨论然而,每个倒置的基因顺序是未整理过的,所以,除了倒位步骤,还需要在反向重复序列区域加入一些额外的基因的拷贝才将南方红豆杉的叶绿体基因组的基因结构转变成和被子植物台东苏铁类似的祖先结构,如毛茛和普通烟草的叶绿体基因组。结论结论结论结论本研究中报道的南方红豆杉叶绿体基因组序列显示,红豆杉属物种与此前报道的裸子植物在叶绿体基因组上存在显著差异。它丢失了一个大的IR,使得在其叶绿体基因组中发生了更多的基因丢失和结构重排事件。南方红豆杉叶绿体基因组中大IR区的丢失以及大量的基因组重排使我们对红豆杉的谱系演化有了新的更深的了解。南方红豆杉叶绿体基因组中的若干基因与其他物种存在显著差异,其基因组结构和基因排布也与近缘种台湾苏铁和台湾三尖杉存在显著差异。这种差异暗示了红豆杉科物种在进化历程上的独立性和复杂性。Thank you!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号