RNA Structure 3.2RNA Sturcture根据最小自由能原理,将Zuker的根据RNA —级序列预测RNA二级结构的算法在软 件上实现预测所用的热力学数据是最近由Turner实验室获得提供了一些模块以扩展Zuker算法 的能力,使之为一个界面友好的RNA折叠程序基本配置:Windows95,Windows98 或 WindowsNTPentium 以上芯片,32 兆内存熟悉菜单对熟悉使用非常重要简单介绍如下:New Sequence:打开序列编辑器,可输入或粘贴入序列,以.seq格式存储Open Sequence:打开以.seq格式.gen(genbank)格式或文本格式存贮的序列文件RNA Fold Single Strand.此项使用RNA参数打开折叠窗口DNA Fold Single Strand.此项使用DNA参数打开折叠窗口RNA Fold Intermolecular.此项使用RNA参数折叠两个单体DNA Fold Intermolecular.此项使用DNA参数折叠两个单体Refold.此项使用不同于先前使用的标准,重新折叠,快速生成次优结构用于已经折叠并存盘的序 列。
Efn2•此项测定生成的RNA二级结构的自由能,储存在ct文件格式中Draw. 此项可绘制任何结构,储存在 ct 文件格式中Dot Plot .此项可计算任何折叠的序列的点阵图,用于已经折叠并存盘的序列Mix and Match .此项可重组次优结构的区域使生成最低自由能的结构,与化学修饰数据一致Oligo Walk打开Oligo Walk tool帮助确定一个与RNA对象紧密杂交的寡聚体方法:RNAstructure使用Zuker算法预测RNA二级结构,预测一个结构分两步进行第一步是使用回归算 法生成一个最优结构与一系列次优结构生成次优结构的个数由用户输入的两个参数( maximum structures and % sort)决定,第三个参数为窗口大小此参数控制次优结构有多少不同小的窗口尺 寸只允许生成非常类似的结构第二步是重新排序最有可能的结构使用公式重新计算每个结构的最小自由能,输出根据重新计算 的最小自由能排序两步是连续进行的准确度最近的研究比较了预测与种系确定的结构, When domains of less than 500 bases were used, the algorithm was able to predict 82.5% of 3,426 base pairs from small subunit rRNAs, group I introns, group II introns, and tRNAs.序列编辑器 如何生成与编辑一个RNA或DNA序列 选择File/New菜单,打开序列编辑窗口。
需要的话,在Title框内输入Title信息,在Comment框内 输入注释信息,最后在 Sequence 框内输入序列信息, 由 5'端到 3'端注意:使用大写字母输入序 列当使用T或U或同时使用时,RNA折叠算法将假设其为RNA将T认为是U,而DNA折叠模块 将认为其为DNA并将U认为是T可使用X代表缺口或未知碱基选择File/Save或File/save as命令以.SEQ格式贮存载入序列或引入 Genbank 格式文件选择File/Open Sequence命令载入.SEQ序列文件,也可选择Genbank格式文件(.GEN)或只有序列 信息的文本文件序列编辑当输入一个序列时,如果Read while typing选项选择的话,可在输入同时听到输入的序列,按下Read back键,计算机将从光标所在位置向回读序列,按Cancel键终止如果先选择一部分序列再按Read back 键,只读取选定部分序列编辑器可将你输入的序列转存为类似 Genbank 格式的文件按下 Format 键,序列将变为每行 60 个碱基 每 10 个碱基一个空格Fold RNA键将你的文件输入Fold模块,程序将提示你存盘。
折叠预测RNA二级结构如下进行:1. 选择 file|RNA fold single strand 启动模块,单击 sequence 按键,打开对话框以载入序列,此序列 必需以.SEQ为扩展文件名,其它序列文件可在序列编辑器中转为此格式注意必需为大写字母2•输入文件名后,缺省值将填充在剩下的区域,这些值可改变选取Generate Save File选项,在执 行算法后生成存盘文件,此存盘文件用于重新折叠与生成点阵图3. 在此碱基可被强制为单链或双链或螺旋4. 单击开始键,开始预测运算5. 需要的话,选择Draw structure,在绘图模块中看预测的二级结构结果输出的二级结构以最小自 由能顺序排列但由于方法的限制与热力学参数的简化,第一个结构并不一定为实际的RNA结构,要折叠一个已存贮为.seq文件的序列,可选择菜单选项filelfold RNA single strand,直接进入折叠窗 口或单击工具条中的 fold RNAsingle strand 键折叠RNA单链次优结构输出的数量由用户输入的两个参数决定Max % Energy Difference:设定输出结构的自由能允许与最小自由能相差的百分数。
例如如果结构的 最小自由能为-100 kcal/mol,最大能量百分误差为10,将输出所有能量为等于或大于-90 kcal/mol的结 构Max number of structures: 设定生成的结构数量最大为 1000.程序输出预测结构直到以上任何一个参数达到要求Window size:此参数控制次优结构互相之间有多少不同小的Windows size只允许生成非常接近的结 构,大的 Windows size 则需要更大的不同Advanced Options :除非特殊情况,不推荐使用RNA折叠单链模块强制一个碱基为单链 在二级结构预测时,用户可选择不配对的碱基方法如下:1. 在序列文件中,不配对碱基使用小写字母表示2. 选择要折叠的序列后,选择Force/Single菜单,进入文本编辑框,输入不配对碱基从5'端的位置 序号单击 OK查看目前的选择碱基,选择ForcelCurrent.重新设定选择碱基,选择ForcelReset.菜单命令强制一个碱基为双链用户能选择必须配对的碱基,由Force|Double菜单命令完成,操作类似上述RNA折叠单链模块强制一个碱基对选择菜单命令Force|Pair.完成。
折叠模块使用限制 尽管作者努力,预测的最低自由能结构可能并不是自然界存在的形式,特别当序列长度为几百时, 但至少其可能的结构已限制在一定数量内最近的研究证明最低自由能结构,含有大约70%正确的碱基对,但前1000个最佳次优结构中的一个 结构会含有大于 95%的正确的碱基对因此建议进行实验以限制预测的结构例如,化学修饰数据 可帮助识别存在与自然界中的结构 Mix&Match 模块的功能便是帮助你使用此类数据识别最可能自然结构RNAstructure现在也提供其它几种折叠的预测,如单链DNA折叠,RNA或DNA寡聚体的分子间折 叠并提供重新折叠选项 refold 重新生成已折叠序列的次优结构单链DNA折叠使用John SantaLucia, Jr.及其同事提供的热力学参数,也可折叠DNA序列RNA或DNA分子间折叠可使用RNA或DNA参数确定寡聚体的分子间二级结构,这需要选定两个序列分子间折叠使用初始参数以正确决定自由能但也有一些限制程序算法不能预测pseudoknots,对 于分子间折叠意味着pseudoknots结构如kissing hairpins结构不能被正确预测,因此,使用的分子间 折叠的序列应很短。
Refold重新折叠选项可读取一个由任何折叠模块生成的存盘文件*.sav,并生成一个不同的次优结构因为 程序算法分为两部门,因此这功能非常有帮助第一步是非常慢的一步,重新折叠便读取第一步的 数据快速生成其它结构EFN2 能量函数 2此模块计算结构的自由能1. 单击.CT File按键,打开对话框输入.CT文件的名字,这是一个含有二级结构信息的文件格式,以 CT 为扩展名2. 对于输出文件.OUT,给出了缺省名称,可单击Out file按键更改3. 单击 Start 按键4•输出两个文本文件扩展名分别为.CT与OUT5. 使用文本文件编辑器打开文件,6. 结构以自由能大小排列,绘图模块1 选择菜单命令 File|Draw.2. 选择一个已存在的.CT文件绘图如果.CT文件含有超过一个结构,可以选择观看哪个结构在菜单中选择ViewlStructure number,选 择想要观看的结构或按住Control键按动上箭头或下箭头也可更改现有显示结构放大缩小选择 View|Zoom 或按住 Control 键按动左箭头或右箭头打印选择 File|Print.拷贝到剪贴板选择 Copy 菜单 place a black and white bitmap on the clipboard 将其拷贝到剪贴板,并可复制到其它应 用程序。
可在 view|counterclockwise 菜单选项选择是顺时针还是逆时针绘图。