转录因子WRKY的同义密码子使用偏好性分析.doc

上传人:公**** 文档编号:559604346 上传时间:2023-04-09 格式:DOC 页数:16 大小:273.51KB
返回 下载 相关 举报
转录因子WRKY的同义密码子使用偏好性分析.doc_第1页
第1页 / 共16页
转录因子WRKY的同义密码子使用偏好性分析.doc_第2页
第2页 / 共16页
转录因子WRKY的同义密码子使用偏好性分析.doc_第3页
第3页 / 共16页
转录因子WRKY的同义密码子使用偏好性分析.doc_第4页
第4页 / 共16页
转录因子WRKY的同义密码子使用偏好性分析.doc_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《转录因子WRKY的同义密码子使用偏好性分析.doc》由会员分享,可在线阅读,更多相关《转录因子WRKY的同义密码子使用偏好性分析.doc(16页珍藏版)》请在金锄头文库上搜索。

1、拟南芥和水稻转录因子WRKY的同义密码子使用偏好性分析生物科学 2004级 何瑞指导老师 刘汉梅 讲 师摘要:本文首次对拟南芥和水稻WRKY基因家族的密码子用法进行了分析,发现两个物种WRKY基因的碱基组成明显不同,水稻的密码子在第一、二、三位GC含量都明显高于拟南芥,且第三位差异最大。不同物种的WRKY基因存在共同的进化趋势,即基因GC3s逐步增大。对应性分析结果显示,拟南芥WRKY基因的密码子使用偏性受碱基组成等多种因素共同作用,水稻主要受碱基组成和基因表达水平两个因素的影响。最后确定了拟南芥和水稻WRKY基因家族的最优密码子,分别为11个和27个。研究结果为深入开展其进化、表达调控机制和

2、提高该基因家族新成员预测的准确性等提供了重要的理论依据。关键词:WRKY基因,密码字偏好性,GC含量,EncSynonymous Codon Bias of WRKY Gene Family in Aribidopsis and RiceHE Rui Biological Science,Grade 2004Directed by LIU Han-mei (instructor)Abstract: WRKY gene family were firstly analyzed on the codon bias in Arabidopsis and Rice. The components of

3、 nitrogenous bases in the two species are obviously different: the GC content at the fist, second and third position of Rice are significantly higher than those of Aribidopsis, that discrepancy at the third position is the most marked. Meanwhile, as WRKY gene family is evolving, G-ending and C-endin

4、g codons of both Aribidopsis and Rice are good for the genes evolution. According to Correspondence Analysis, the codon usage of WRKY gene in Aribidopsis is affected by many factors, such as the components of nitrogenous bases. But the components of nitrogenous bases and the gene expression level ar

5、e two primary factors in Rice. The numbers of the optimal codon in Arabidopsis and Rice are 11 and 27. The results of the the research provide the accuracy of important theoretical basis of forecasts for its evolution, regulation of gene expression and adding the gene family members.Keywords: WRKY G

6、ene,Codon bias,GC content,Enc蛋白质中的氨基酸序列是由mRNA中核苷酸序列决定的。mRNA上连续相邻的核苷酸以3个为一体,即三联体密码子,进行翻译时,识别与其对应的tRNA,正确的译出遗传信息中所指定的氨基酸。遗传密码子具有通用性、线性不重叠和简并性等特点。除少数种外,原核和真核生物中核基因均采用标准的遗传编码系统进行蛋白质翻译工作。任何相邻的2个密码子之间无空位,且线性不重叠。通常,AUG作为翻译识别的起始密码子,而UGA、UAG和UAA三个密码子作为翻译终止密码子,由此构成一个完整的编码阅读框。终止密码子不编码任何的氨基酸,这样就有61种密码子编码20种氨基酸,

7、因此出现了冗余现象,即密码子的简并性。使得某些氨基酸可能由几种不同的密码子编码,通常将编码同一氨基酸的不同密码子互称为同义密码子(Synonymous Codon)。同义密码子编码同一氨基酸,如果没有任何选择压力或突变偏好,那么每个氨基酸位点上的核苷酸突变都是随机的,同义密码子出现的概率是一样的。但实际上,同义密码子的使用并非随机的1,2,而是不同的物种或同一物种的不同基因在编码氨基酸时倾向使用某些特定的同义密码子,这种现象称为同义密码子的使用偏好性(Synonymous Codon Usage Bias)3。同义密码子的使用偏好性广泛地存在于细菌、真菌、植物、动物及人类中,且对于不同生物,影

8、响密码子使用偏性的因素也不尽相同,因此产生了多种解释密码子偏性使用的理论。早期关于密码子偏性理论(如密码子的选择模式在进化过程中是保守的;密码子的使用偏性与对应的同工tRNA丰度相关,从而有利于提高翻译的效率和准确性)的数据大多来源于大肠杆菌和酵母等单细胞生物4。而后,关于密码子使用偏性与tRNA丰度的关系,在对多细胞生物果蝇和线虫的分析中得到了与大肠杆菌和酵母相似的结论。Bierne等5通过分析果蝇中3种不同位点的多态性和分歧与密码子偏性的关系,认为蛋白质的选择压力是密码子偏性进化的主要原因。而关于密码子偏性与翻译效率也有不同的看法,Kanaya等6在研究物种特异的密码子偏性时,通过对5个真

9、核生物(酵母、线虫、果蝇、非洲爪蟾和人)的密码子使用模式进行比较分析发现,并不是所有的高表达基因都有显著的密码子使用偏好性现象,说明真核生物中密码子的偏性并不是由翻译效率决定的,而可能和基因组中的isochore结构及含GC二核苷酸的密码子使用有关,因为后者与哺乳动物中发现的通过GC二核苷酸甲基化来调节转录有关;且在植物的密码子偏性分析中也得到了类似的结论7。随着基因芯片技术的产生和发展,获得组织特异基因及其表达丰度成为可能,Zhang等8发现看家基因的进化速率低于组织特异基因,同时指出看家基因和组织特异基因的密码子使用模式基本相似,并提出基因表达水平是决定密码子使用偏好的主要因素。产生密码子

10、偏性的原因主要是自然选择的结果,但并非唯一因素。其中自然选择、突变偏性和遗传漂移之间存在一种特殊的平衡点9-11。通常翻译的效率和准确性会影响同义密码子的使用,主要是与对应的tRNA种类的丰度分布有关,例如最优密码子与细胞质中tRNA丰度最高的对应12。在近几年的研究表明,同义密码子的偏向使用与基因的G+C含量,尤其是与GC3S紧密相关13-18。例如,在一些单细胞生物如E.Coli.S.Cerevisiae中,高表达的基因密码子的使用偏性一般比较大,这主要是由基因的碱基组成和翻译过程中tRNA的选择性两大因素造成的。另外,基因长度、mRNA、蛋白质的疏水性水平及氨基酸的保守性等都是影响密码子

11、的偏好性因素。同义密码子的使用偏好性与诸多生命活动过程如蛋白质的合成等有着密切联系,因此对同义密码子使用偏好性的研究具有重要的生物学意义。1、通过同义密码子使用频率的研究,可以判断未知基因是高表达基因还是低表达基因19,同时还可以判断基因表达的时间等20,用于研究基因表达控制机制;2、根据编码区和非编码区的密码子使用偏性的不同,可以对基因组进行扫描,从而发现编码区和非编码区,预测新的基因21;3、为从蛋白肽段序列逆翻译到核苷酸序列提供了翻译标准,可以实现从蛋白质序列到寡核苷酸探针的设计22;4、由于同义密码子的使用偏性与tRNA丰度有关,可以预测细胞中的核糖蛋白以及相关合成酶在细胞中的位置23

12、;5、同义密码子的使用偏性还与基因功能相关,可以对待测基因的功能进行预测。WRKY基因是植物特有的转录因子家族,通过与顺式作用元件W-盒特异结合从而调控下游目标基因表达,参与生物和非生物胁迫应答反应、信号分子传递、植物衰老和器官发育等一系列生理活动。各种高等植物当机体受到机械损伤、病原物侵害或者非生物胁迫诱导时,WRKY基因都能大量而快速的表达。因其成员都至少含有一个保守的由60个氨基酸组成的结构域,并且该结构域N端有高度保守的WRKYGQK核心序列而得名。以WRKY结构域的系统发生关系及锌指结构的特征为基础,将其分为3个大组:I组包含两个WRKY结构域,锌指结构为C-X4-5-C-X22-2

13、3-H-X1-H;II组只含有一个WRKY结构域,锌指结构与I组相同;III组也只含有一个WRKY结构域,但锌指结构为C-X7-C-X23-H-X1-C。在其进化关系上,I组代表最原始的基因形式,II组由I组进化而来,III组由II组进化形成24。目前在密码子使用偏性研究方面,主要集中在对已知全基因组序列的低等生物和模式生物如病毒、细菌、酵母、线虫、果蝇、人和拟南芥等的基因组密码子使用模式研究,对单一功能基因家族的密码子用法研究较少。本文将对拟南芥和水稻的WRKY基因家族的密码子用法进行比较分析,明确该基因家族在单、双子叶植物中的密码子用法特点,为深入研究其进化、表达调控机制和提高该基因家族新

14、成员预测的准确性等提供重要理论依据。1 材料和方法1.1 材料1.1.1 数据从植物转录因子数据库(http:/,http:/ricetfdb.bio.uni-potsdam.de/)分别下载了拟南芥和水稻WRKY基因的CDS(Coding DNA sequence)序列(2007-8-3)。拟南芥tRNA基因拷贝数来源于拟南芥基因组tRNA扫描分析数据库(http:/lowelab.ucsc.edu/GtRNAdb/Athal/),水稻的相应数据来源参见Xi等的文献25。采用C语言编写程序,筛选从数据库下载的CDS序列,筛选原则如下:CDS长度大于或等于300bp;以ATG为起始密码子,并以

15、TAG、TGA或TAA为终止密码子;不含除A、T、C、G字符以外的碱基。最终筛选到符合条件的拟南芥84条CDS、水稻112条CDS作为本文的分析样本。1.12软件Codon W软件(version 1.4,http:/bioweb.pasteur.fr/seqanal/interfaces/codonw.html)用于对应性分析和计算各项同义密码子使用偏性的衡量指标。Microsoft EXCEL用于数据相关分析和图表绘制。1.2 方法1.2.1 基因分类用C语言编写程序,根据其结构特点分别查找并整理出拟南芥和水稻的3类WRKY基因。对于少数变异的基因24,根据WRKY结构域和锌指结构的特点归

16、于亲源关系相近的一类。1.2.2 密码子使用偏性相关数据量的计算(1) 密码子使用的相对概率(Relative Synonymous Codon Usage,RSCU) 对于某一特定的密码子i,RSCUi指编码同一氨基酸的密码子间的相对概率,它的计算方法如下公式。如果密码子使用无偏好性,则RSCU值为1;如果该密码子比其他同义密码子使用更频繁,则其RSCU值大于1;反之亦然。由于该指标计算简单,除出了氨基酸的组成对密码子使用的影响,而且比较直观的反映了同义密码子的使用偏好,因此应用最为广泛。式中,Xij是编码第i个氨基酸的第j个密码子的出现次数,ni是编码第i个氨基酸的同一密码子数量(值为1-6)。(2)GC含量(GC1、GC2和GC3) GCn指在密码子第一、二和三位上的GC含量分布。GC3S不同于GC3,是指编码同一氨基酸的同

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号