RNA及RNA二级结构的理论知识.doc

上传人:灯火****19 文档编号:136791920 上传时间:2020-07-02 格式:DOC 页数:6 大小:350KB
返回 下载 相关 举报
RNA及RNA二级结构的理论知识.doc_第1页
第1页 / 共6页
RNA及RNA二级结构的理论知识.doc_第2页
第2页 / 共6页
RNA及RNA二级结构的理论知识.doc_第3页
第3页 / 共6页
RNA及RNA二级结构的理论知识.doc_第4页
第4页 / 共6页
RNA及RNA二级结构的理论知识.doc_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《RNA及RNA二级结构的理论知识.doc》由会员分享,可在线阅读,更多相关《RNA及RNA二级结构的理论知识.doc(6页珍藏版)》请在金锄头文库上搜索。

1、第2章 RNA及RNA二级结构的理论知识2.1 RNA的生物知识2.1.1 RNA基本单位在动植物、微生物、一些病毒以及噬菌体内都有RNA分子,它是一种以磷酸二酯键连接的几十种核糖核苷酸的形式存在的核酸,核苷酸是构成RNA的基本单位。从本质上看,多个单核苷酸聚在一起形成的多聚核苷酸构成了核酸。核苷酸由核酸经大量水解得到;而核苷和磷酸由对核苷酸的水解得到;同样的,对核苷再进行水解就可得到含氮碱基和戍糖;含氮碱基包括嘌呤碱和嘧啶碱,戍糖经过分解形成核糖与脱氧核糖。2.1.2 RNA的化学构成RNA主链由核糖与磷酸二酯键构成,与之相连的四个碱基以一些特殊次序排成一个多核苷酸序列,从若干个数据库一直到

2、成千上万个基地。研究表明,核苷酸的碱基的主要构成是含氮杂环化合物,这些化和物质主要有嘧啶衍生物和嘌呤衍生物两类。其中嘧啶生物包括胞嘧啶C、尿嘧啶和胸腺嘧啶;嘌呤生物包括鸟嘌呤、腺嘌呤。鸟嘌呤、腺嘌呤和胞嘧啶同样存在与DNA分子中,但胸腺嘧啶只存在与DNA中。他们相应的化学结构如图2.2。图2.2核苷酸各碱基的化学组成通过对上图的综合分析,我们发现RNA的化学结构并不非常复杂,都是通过氢键分别将A和U、C和G连起来,形成互补碱基配对,不同的地方是连接氢键个数的差别,即A和U之间最多形成两个氢键;G和C之间最多形成3个氢键,如图2.3所示。图2.3RNA碱基配对中的氢键构成除了一些小的RNA病毒,

3、大部分RNA的主要以单链形式存在,但这种单链形式的产生不是偶然,而是在碱基堆积作用下,使单链结构其中个别区段借助碱基的互补配对,将自身折叠并且形成一个短的双螺旋区。这种RNA短双螺旋结构和单一的未配对链结构,与DNA双链双螺旋结构进行对比,其稳定性明显差很多。但正是这一稳定的特点,使RNA能形成更复杂的三维结构。除了“AU”和“GC”配对之外,还存在一些非典型的配对,如“G=U”配对等。在热力学方面,“G=U”配对有稳定性的特点,即同上面两个典型Waston-Crick配对很接近,因此“G=U”配对又称为晃动配对。那么,如果从稳定性上将上述配对放一起做比较的话,通常情况应为“GC”“A=U”“

4、G=U”。2.2 RNA二级结构的特征生物RNA的分子结构分别有一级、二级、三级和四级四种,其中四级结构最复杂。同时,RNA分子结构具有跟蛋白质类似的种类繁多、结构复杂的特点。生物RNA分子中共有四种不同的核苷酸,它们按照不同顺序排列在一起就形成RNA的一级结构。RNA分子存在很多由互补碱基对构成的单链区结构、茎环结构,以及双链结构等各种不同的组件形成的平面结构,并通过这些结构来进行自我折叠运动,所构成的结构就是RNA二级结构。2.2.1 RNA二级结构的组成上文提到,RNA二级结构是RNA分子在自然条件下对自身进行各种形式的回折,在不同的碱基互补对茎区之间,以非匹配的环区形式和最顶部单链形式

5、两者交替出现的茎环结构。这些茎环结构又能分出一些子结构,也叫做RNA二级结构的结构元件,正是这些按一定规律组合在一起的元件才构成了各种RNA完整的二级分子结构。这个复杂的形成过程里面,有三对碱基作为研究的重点,即AU碱基对、GC碱基对和GU碱基对。常见的RNA二级结构如图2.10所示。图2.10常见的RNA二级结构示意图(表示碱基对,数字表示碱基的序列号)所谓的茎区结构就是我们通过RNA二级结构示意图会发现有一部分双螺旋区域是由两方面组织,一部分是碱基互补对的形式构建起来的,另一部分是其余被隔离在双螺旋区域之外且没有碱基对的单链则形成了环结构。所谓环结构,在RNA二级结构示意图中,我们根据图形

6、与实物的比较,很容易找出几种形象的环形结构,它们有:发卡环、膨胀环、内环和多分支环等如图2.11所示。图2.11茎区及环的示意图RNA二级结构中还有两个重要的组成部分,一个叫做多分支环,它是连接着RNA分子结构各个区域没有实现配对的各个发卡环;另一个叫做自由单链,它是RNA分子结构排序组合最顶端没有形成配对的单链。假结,在RNA分子结构中一般包含两种假结的形式:一种叫做平面假结,是在RNA分子结构中环结构上和环结构外区域的碱基配对,能够以平面图形的表示的形式假结形式;跟前者相反的另外一种情况被称为非平面假结。RNA二级结构的模体是由RNA分子基本单元按照一定的排列组合而构成的。如图2.12所示

7、:2.12RNA二级结构模型以及其个结构单元关系目前,关于RNA二级结构的研究依然是RNA分子结构领域当中的重点和难点。其第一个原因是RNA二级结构是RNA分子从一级结构到三级结构跨越必不可少的桥梁。第二个原因是通过弄清RNA二级结构的预测结果,就可以在大范围内确定RNA三级结构的问题。并且,当研究者的意见都归于一致时,在RNA分子结构当中,对于各个组成方面所具有的生物学意义与其碱基序列的组成相比意义更大,这个对比对非编码的RNA或者DNA同样适用。此外,RNA的分子结构还有一个相似性的特点,就是在各同源RNA当中,通常它的二级结构都是不自觉接受或相像;但是相似存在这个特性几乎不会出现在一级结

8、构上。并且,RNA的同源性和保守型特征都是建立在二级结构的基础上而不是一级结构的保守序列上的。因此,当对某种RNA基本情况有所了解后,研究者就可根据给出的RNA二级结构问题做出相对准确的预测。简单来说,就是通过用计算机手段和有关数学方法,对给定的RNA分子碱基序列按照一些方法来计算,从而最大可能地来测出该RNA分子多具备的二级结构。2.2.2 RNA二级结构预测方法的发展Von Heijne总结并叙述了预测RNA二级结构的各种方法.Tinoco et al第一次大概算出了有关二级结构的能量,他通过研究小分子和利用外推法来预测最稳定的大分子结构。这个预测包括了双链区里堆叠碱基对有关的稳态能量跟未

9、配对区域不稳定的影响,帕帕和麦克马洪研发的程序能够列出tRNA序列里所有有可能的螺旋区。他们采用改良版的威士顿-克里克碱基配对原则,利用排列组合适当的螺旋得到所有可能的二级结构,且测算了任何一个可能结构的全部自由能。斯洛伐克设计出一种能够使合适的双链区相加就获得能量最适合结构的方法。马丁内斯列出了可能双链区,并利用计算波磁慢函数给出之前所指区域在它平衡常量里的比例,这里的-G是这些区域里的自由能,r为气体常数,t是温度。用蒙特 卡洛的办法折叠RNA分子,这个方法当中的每个起始区域都是经一个加权集合里任意选择的,这跟用余吉不思取样的办法是差不多的。假设每一个可能的双链区用袋子里的弹珠来表示。每种

10、类型了弹珠用博磁慢概率给与权重,这样能量越稳定的区域对应的弹珠就越有可能被选中。另外可能区域的选择可通过权重进一步进行,一直到不能再加了。这个方法产生了一系列的通过能量加权的可能结构,但没有考虑到未配对区域不稳定的影响。博磁慢概率函数现在已经被用作找寻最有可能的二级结构了。2.2.3 二级结构预测基本原理 分子里的碱基相互配对形成了RNA二级结构。碱基配对有三种形式:G-C、A-U、G-U,他们中间分别有3个,2个跟1个氢键。碱基之间连续不断的配对形成了螺旋区,对RNA二级结构有着稳定作用来降低整体结构的自由能,而RNA分子中没有配对的部分形成“发卡环,内部换,膨胀环跟多分支环”等环装结构,不

11、利于稳定结构 和升高结构的自由能,RNA二级机构就是在这种矛盾之间的平衡中形成的。在各种可能结构之间找最小自由能结构是预测RNA二级结构最常用的方法,而通过研究体外少核苷酸稳定性可以得到基本结构的自由能数据。最常用的自由能数据是萨尔泽跟瘤能量积分系统,但在这两组数据中没有提到多分支环的能量计算,目前一般将之作内部处理,或用公式计算:4.7+0.4x单链碱基数+0.1x螺旋区数目.有了这些数据,就能够评价RNA二级结构的稳定性,通过这种方法可以得到近似稳定能量的结构和最可靠预测结构。在有关序列当中发现的序列变异也能用来预测可能在每个分子里都存在的碱基配对。预测一组可能形成一种特殊结构的序列是RN

12、A二级结构预测方法的另外一种形式。从序列来预测RNA三维结构的方法还在发展当中。还有一种常见的RNA二级结构的预测方法考虑到碱基配对的保守形式,这些形式在一定的rna分子进化过程中是相对保守的。发现序列中碱基配对的区域在rna分子进化的同时发生改变,使结构的完整度能以维持。例如,如果在一个给定类型的序列中两个位置(G和C形成一个碱基对),则在相应的位置上保留了G和C、A和U或U和A的序列被认为是可能的匹配。RNA分子中这些协同变异模式是RNA二级机构的一种表现,课件预测结构。计算上遇到的挑战是如何在其他序列变化的背景中发现这些协同变量的位置。3.1.3 RNA二级结构的表示RNA二级结构的表示

13、方法很多,如半圆表示、圆形表示、点阵表示。山峰表示。正多边形表示等,其中以正多边形表示最为直观形象,便于分子生物学家观察,研究RNA二级结构特征,但是利用这种方法来比较不同的结构是较为困难的,因为利用这种表示方式时,常导致许多结构的重叠,为此,人们不得不借助于旋转的办法来克服重叠现象,这样以来,即使是对同一结构,可能由于在不同的地方旋转或在同一地方旋转的角度不同而导致结构形状的变化。目前,再现结构对结构进行比较的最好方法是树状表示方法,这种方法是从图论的角度来考虑的,与上述方法不同,在RNA二级结构中,每个配对碱基用一个点表示,然后用一条有向线段将点按顺序连接起来,便可获得RNA二级结构的树状

14、表示,在这种显示中,环区碱基等信息将被丢失。最小自由能RNA的二级结构被划分为茎区,外环,凸环,内环,发卡环以及多分枝环等。Zuker,Turner等人详细地给出了各个部分结构的能量计算方法,到目前为止,有些能量值还在不断地被修正和补充。其中较有影响的软件Mfold采用的就是最近邻能量规则,也被称为环依赖的能量规则。环依赖的能量规则在如下三个方面做了约定:(1) 二级结构中不允许讯在一个碱基和两个以上碱基同时配对的情形。(2) 发卡环的长度必须大于等于3。(3) 二级结构中不允许讯在假结,即任意两茎区之间只能是嵌套关系或顺次关系。假结和三碱基配对的情形的能量,由于目前实验手段的限制,和数据不足两方面的原因而无法给出其准确的能量计算公式。碱基i和k配对可以表示为i.k的形式。如果单碱基r或者碱基对I.k满足条件ii(k)k,且不讯在另一配对碱基p.q使得ipi(k)qk,则成r或I.k是从配对i.k可到达的。值得注意的是对于长度为n的RNA序列,如果添加假想的第0个碱基和第(n+1)个碱基到当前结构中后,且嘉定两碱基形成配对,则对于任意的RNA序列均可得到一致的封闭的二级结构。一个环可能包含0,1或多个碱基对。K-环表示一个环包含(k-1)个碱基对。Ls和Ld分别表示一个环中的单碱基个数和配对的碱基个数。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号