引物设计原理

上传人:san****glu 文档编号:32894233 上传时间:2018-02-13 格式:DOC 页数:35 大小:349.50KB
返回 下载 相关 举报
引物设计原理_第1页
第1页 / 共35页
引物设计原理_第2页
第2页 / 共35页
引物设计原理_第3页
第3页 / 共35页
引物设计原理_第4页
第4页 / 共35页
引物设计原理_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《引物设计原理》由会员分享,可在线阅读,更多相关《引物设计原理(35页珍藏版)》请在金锄头文库上搜索。

1、引物设计原理引物设计的目的是为了找到一对合适的核苷酸片段,使其能有效地扩增模板 DNA 序列。引物设计总体上包含三个程序:序列下载;同源性比较;引物设计筛选;要设计引物首先要找到 DNA 序列的保守区。同时应预测将要扩增的片段单链是否形成二级结构。如这个区域单链能形成二级结构,就要避开它。如这一段不能形成二级结构,那就可以在这一区域设计引物。一般引物长度为 1530 碱基,扩增片段长度为 100600碱基对。引物确定以后,可以对引物进行必要的修饰,例如可以在引物的 5端加酶切位点序列;标记生物素、荧光素、地高辛等,这对扩增的特异性影响不大。但 3端绝对不能进行任何修饰,因为引物的延伸是从 3端

2、开始的。按照多肽的氨基酸序列来设计 PCR 引物或杂交探针是最常用的实验手段。在核酸分子杂交、DNA 序列测定和通过 PCR 放大 DNA 片段等实验中,对这些反应的质量起最重要影响作用的,就是这些寡核苷酸探针或引物。用优化的寡核苷酸进行实验能够很快得到好的结果,而用不够合适的寡核苷酸时,常常得出似是而非的结果,不仅大大增加了后续实验的工作量,还可能一无所获。寡核苷酸,无论是 DNA 的或者 RNA 的,都有形成双链结构的潜在可能性,预测这种结构的稳定性对设计和优化寡核苷酸就很重要。在一个双链结构中,碱基对的相对稳定性是由其邻近碱基决定的。PCR 引物设计的优化原则细心地进行引物设计是 PCR

3、 中最重要的一步。理想的引物对只同目的序列两侧的单一序列而非其他序列退火。设计糟糕的引物可能会同扩增其他的非目的序列。1. 引物长度:如果 PCR 的退火温度设置在近于引物 Tm 值(引物/模板双链体的解链温度)几度的范围内,18 到 24 个碱基的寡核苷酸链是有很好的序列特异性的。但不应大于38,因为过长会导致其延伸温度大于 74,不适于 Taq DNA 聚合酶进行反应。引物越长,扩增退火时被引发的模板越少。为优化 PCR 反应,使用确保溶解温度不低于 54的最短的引物,可获得最好的效率和特异性。 每增加一个核苷酸,引物特异性提高 4 倍;这样,大多数应用的最短引物长度为 18 个核苷酸。如

4、果期待的产物长度等于或小于 500 bp,选用短的(16 18 mer)的引物:若产物长 5 kb,则用 24 mer 的引物。有人用 2023 mer 引物得到 40 kb 的产物。2. 引物 GC 含量:GC 含量在 40%60%之间,以 45-55为宜。这可为有效退火提供足够热度。GC 含量(composition)过高或过低都不利于引发反应。如果 G-C 比例超出,则在引物的 5端增加 As 或 Ts;而如果 A-T 比例过高,则同样在 5端增加 Gs 或 Cs。上下游引物的 GC 含量和 Tm 值应该协调。协调性差的引物对的效率和特异性都较差,一对引物的 Tm 值相差尽量不超过 23

5、 摄氏度,有效启动温度,一般高于 Tm 值 510。含有50的 G+C 的 20 个碱基的寡核苷酸链的 Tm 值大概在 5662范围内,其 Tm 值最好接近 72以使复性条件最佳。若采用太高的退火温度,Tm 值低的引物对可能完全不发挥作用。在从一批在特定序列范围内已合成好的寡核苷酸中选择一对新的引物时,这种 GC 含量和 Tm 值的协调非常关键。同时引物和产物的 Tm 值也不要相差太大,20 摄氏度范围内较好。可以通过分析几个逐步提高退火温度的反应以提高特异性。开始低于估算的 Tm5,以 2为增量,逐步提高退火温度。3. 引物 Tm:引物所对应模板序列的 Tm 值最好在 72左右。(Tm 值曲

6、线以选取 72 度附近为佳,5到 3的下降形状也有利于引物引发聚合反应),至少要在 5580之间。引物 Tm 最常用的两种方法。第一个公式来源于高盐溶液中的杂交,适用于小于 18 碱基的引物。第二个公式根据 GC 含量估算 Tm。确定引物 Tm 最可信的方法是近邻分析法。这种方法从序列一级结构和相邻碱基的特性预测引物的杂交稳定性。大部分计算机程序使用近邻分析法。 Primer LengthTm = 2 (A+T) + 4(G+C)Primer Length Tm = 2 (A+T) + 4(G+C)4 12 C 22 66 C6 18 C 24 72 C8 24 C 26 78 C10 30

7、C 28 84 C12 36 C 30 90 C14 42 C 32 96 C16 48 C 34 102 C18 54 C 36 108 C20 60 C 38 114 C4. 引物 3端:引物 3末端和模板的碱基完全配对对于获得好的结果是非常重要的,而引物 3末端最后 5 到 6 个核苷酸的错配应尽可能的少。如果 3末端的错配过多,通过降低反应的退火温度来补偿这种错配不会有什么效果,反应几乎注定要失败。引物 3末端的另一个问题是防止一对引物内的同源性。应特别注意引物不能互补,尤其是在 3末端。引物间的互补将导致不想要的引物双链体的出现,这样获得的 PCR 产物其实是引物自身的扩增。这将会在

8、引物双链体产物和天然模板之间产生竞争 PCR 状态,从而影响扩增成功。引物 3末端的稳定性由引物 3末端的碱基组成决定,一般考虑末端 5 个碱基的 G。此值的大小对扩增有较大的影响,负值大,则 3末端稳定性高,扩增效率更高,同时也更易于异位引发。 引物 3端要避开密码子的第 3 位:如扩增编码区域,引物 3端不要终止于密码子的第3 位,因密码子的第 3 位易发生简并,会影响扩增的特异性与效率。实验证明,以 T 结尾的引物即使与 T, G 或 C 错配仍可有效延伸。而当末位链为 T 时,错配的引发效率大大降低,G、C 错配的引发效率介于 A、T 之间,所以 3端最好选择 T。3 f: N5. 引

9、物序列组成与模板序列组成的相似性:可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,如此可保证不出非目的产物的假带。但对于特定的模板序列,还应结合比较其在正确位点的引发效率。如果两者相差很大,比如在正确位点的引发效率为 450 以上,而在错误位点的引发效率为 130,并且不好找其他更合适的引物,那么这对引物也是可以接受的。Frq 曲线为 Oligo6 新引进的一个指标,揭示了序列片断存在的重复机率大小。选取引物时,宜选用 Frq 值相对较低的片断。# F; K( V1 U8 D9 k! T2 x# l6. 引物最好在模板 c

10、DNA 的保守区内设计:DNA 序列的保守区是通过物种间相似序列的比较确定的。在 NCBI 上搜索不同物种的同一基因,通过序列分析软件(比如DNAman)比对( Alignment),各基因相同的序列就是该基因的保守区。7. 预期产物的特定长度经常取决于应用的需要:若目的是建立测定特异 DNA 片段的临床检验方法,120300bp 的小 DNA 扩增产物可能是最好的。产物应具有好的特异性和高的产生效率,并含有能用于探针捕捉杂交实验的足够信息。这一长度范围的产物可以通过采用两步扩增循环方法得到,从而减少扩增时间。其他 PCR 方法有不同的最佳产物长度。例如,通过定量的 RNA-PCR 检测基因表

11、达时,产物应该足够大以便构成竞争性模板,这样,产物和竞争物都能够在凝胶上很容易的分辨出来。这些产物一般在 250750bp 范围内。! I9 I5 R7 A& G# O7 _9 M6 Q3 j8. 引物自身及引物之间不应存在互补序列:引物自身不应存在互补序列,否则引物自身会折叠成发夹结构(Hairpin)使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续 4 个碱基的互补。两引物之间也不应具有互补性,尤其应避免 3 端的互补重叠以防止引物二聚体(Dimer 与 Cross dimer)的形成。引物之间不能有连续 4 个碱基的互补。引物二聚体及发夹结构如果不可

12、避免的话,应尽量使其G值不要过高(应小于 4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使 PCR 反应不能正常进行。与二聚体相关的一个参数是碱基的分布,3 端的连续GGG 或 CCC 会导致错误引发。二聚体形成的能值越高越稳定,越不符合要求。与二聚体相同,发夹结构的能值越低越好。虽然有些带有发夹环,其 G为3 kcal/mol 的自身互补引物也可以得到不错的结果,但是如果它的 3末端被发夹环占据时就很麻烦,即会引发引物内部的延伸反应,减少了参与正式反应引物的数量。当然,如果发夹环在 5末端对反应就没有多大的影响了。9. 碱基要随机分布:引物序列在模板内应当没有相

13、似性较高,尤其是 3端相似性较高的序列,否则容易导致错误引发(False priming)。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其 3端不应超过3 个连续的 G 或 C,因这样会使引物在 GC 富集序列区错误引发。10. 引物应具有特异性:引物设计完成以后,应对其进行 BLAST 检测。如果与其它基因不具有互补性,就可以进行下一步的实验了。值得一提的是,各种模板的引物设计难度不一。有的模板本身条件比较困难,例如 GC 含量偏高或偏低,导致找不到各种指标都十分合适的引物;用作克隆目的的 PCR,因为产物序列相对固定,引物设计的选择自由

14、度较低。在这种情况只能退而求其次,尽量去满足条件。11. G值:G 值(自由能)反映了引物与模板结合的强弱程度。一般情况下,引物的G值最好呈正弦曲线形状,即 5端和中间 G值较高,而 3端 G值相对较低,且不要超过 9(G 值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。引物 3 端的G 值过高,容易在错配位点形成双链结构并引发 DNA 聚合反应。(不同位置的G 值可以用 Oligo 6 软件进行分析)。3末端双链的 G是 02 kcal/mol 时,PCR产量几乎达到百分之百,随着其绝对值的增加产量逐渐下降,在6 时只有 40%、到8时少于 20%、而10 时接近于 0。

15、应当选用 5 端和中间G 值相对较高,而 3 端G 值较低(绝对值不超过 9)的引物。12. 引物的 5端:引物的 5端可以修饰,而 3端不可修饰:引物的 5 端决定着 PCR 产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物 5 端修饰包括:加酶切位点;标记生物素、荧光、地高辛、Eu3+等;引入蛋白质结合 DNA序列;引入点突变、插入突变、缺失突变序列;引入启动子序列等。引物的延伸是从 3 端开始的,不能进行任何修饰。3 端也不能有形成任何二级结构可能。* J i3 7 f!有时候,仅有有限的序列可供用于引物设计。比如,如果仅知道氨基酸序列,可以设计简并引物。为

16、了增加特异性,可以参考密码子使用表,根据不同生物的碱基使用偏好,减少简并性。次黄嘌呤可以同所有的碱基配对,降低引物的退火温度。不要在引物的 3端使用简并碱基,因为 3端最后 3 个碱基的退火足以在错误位点起始 PCR。使用较高的引物浓度(1M 到 3M),因为许多简并混合物中的引物不是特异性针对目的模板。0 O,13. 在 DNA 测序和 PCR 中最好用 5末端稳定(如 GC 含量较多),而 3末端不太稳定(如 AT 含量较多 )的引物:这种引物的结构可以有效地消除假引发反应。这就是基于引物内部稳定性的经验之谈。其 3末端稳定性低的引物在这些反应中能起好作用的原因在于,接近或在 3末端上的碱基与非靶位点碱基所形成的配对的稳定程度还不足以引发 DNA 合成,所以不会产生假产物。因此,为了有效地引发反应,引物的 5末端和中央部分必须与靶

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号