如何设计引物

上传人:公**** 文档编号:548972211 上传时间:2024-02-04 格式:DOC 页数:4 大小:113.50KB
返回 下载 相关 举报
如何设计引物_第1页
第1页 / 共4页
如何设计引物_第2页
第2页 / 共4页
如何设计引物_第3页
第3页 / 共4页
如何设计引物_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《如何设计引物》由会员分享,可在线阅读,更多相关《如何设计引物(4页珍藏版)》请在金锄头文库上搜索。

1、引物设计原则:1找出这种细胞物种的PTN全长核苷酸序列2采用primer premier 5.0软件设计引物设计应注意如下要点:1. 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38,因为过长会导致 其延伸温度大于74 C,不适于Taq DNA聚合酶进行反应2。2. 引物序列在模板内应当没有相似性较高,尤其是3端相似性较高的序列,否则容易导致错配。引物3端出现3个以上的连续碱基,如 GGG或CCC也会使错误引发机率 增加2。3. 引物3端的末位碱基对Taq酶的DNA合成效率有较大的影响。不同的末位碱基在错配位置导致不同的扩增效率,末位碱基为A的错配效率明显高于其他3个

2、碱基,因此应当避免在引物的 3端使用碱基A34。另外,引物二聚体或发夹结构也可能导致PCR反应失败。5端序列对PCR影响不太大,因此常用来引进修饰位点或标记物2。4. 引物序列的GC含量一般为40-60%,过高或过低都不利于引发反应。上下游引物的 GC含量不能相差太大25。5. 引物所对应模板位置序列的 Tm值在72C左右可使复性条件最佳。 Tm值的计算有 多种方法,如按公式 Tm= 4(G+C)+ 2(A+T),在 Oligo软件中使用的是最邻近法 (the nearest neighbor method) 67。6. AG值是指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对

3、稳定性。应当选用 3端AG值较低(绝对值不超过 9),而5端和中间AG值相对较高的 引物。引物的3端的AG值过高,容易在错配位点形成双链结构并引发DNA聚合反应。7. 引物二聚体及发夹结构的能值过高(超过 4.5kcal/mol )易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行8。8. 对引物的修饰一般是在 5端增加酶切位点,应根据下一步实验中要插入 PCR产物的载体的相应序列而确定。如果文献上的这个基因跟你是同一物种来源的话是可以运用别人的引物看看他的引物是基因组的还是cDNA的。cDNA的可以直接用。基因组的就再看看了好的引物对实验进程不会延缓我觉得在涉及引物只要遵

4、循以下的原则,一般是没什么问题!我是从来不借助什么专业软件来设计,按照自己的需要选取就是了,一般20bp,不浪费!到目前还没有失败过!引物设计和选择目的DNA序列区域时可遵循下列原则 :(1)引物长度约为16-30bp ,太短会降低退火温度影响引物与模板配对,从而使非特异性增 高。太长则比较浪费,且难以合成。 引物中 G+C含量通常为40%-60%,可按下式粗略估计引物的解链温度Tm=4(G+C)+2(A+T).(3)四种碱基应随机分布,在3端不存在连续3个G或C,因这样易导致错误引发。弓I物3端最好与目的序列阅读框架中密码子第一或第二位核苷酸对应,以减少由于密码子摆动产生的不配对。(5)在引

5、物内,尤其在3端应不存在二级结构。 两引物之间尤其在 3端不能互补,以防出现引物二聚体,减少产量。两引物间最好不存 在4个连续碱基的同源性或互补性。弓I物5端对扩增特异性影响不大,可在引物设计时加上限制酶位点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等.通常应在5端限制酶位点外再加1-2个保护碱基。(8)引物不与模板结合位点以外的序列互补。所扩增产物本身无稳定的二级结构,以免产生非特异性扩增,影响产量。(9)简并引物应选用简并程度低的密码子,例如选用只有一种密码子的Met, 3端应不存在简并性。否则可能由于产量低而看不见扩增产物。一般PCR反应中的引物终浓度

6、为0.2-1.0卩mol/L引物过多会产生错误引导或产生引物二聚体,过低则降低产量。利用紫外分光光度计,可精确计算引物浓度,在1cm光程比色杯中,26Onm下,引物浓度可按下式计算:X mol/L= OD260/ A(16000)+C(70000)+G(12000)+T(9600)X:引物摩尔浓度,A、C、G、T:引物中4种不同碱基个数。如何查找基因序列NC表示人类基因组 DNA的RefSeq。(链接序列)NM 表示 mRNA 的 RefSeq。NP表示蛋白质的RefSeq1-根据文献中已知的基因ID如果你在文献中看到你感兴趣的基因,而且文中还提到了该基因在Genbank中的ID号,那就好办了

7、,直接打开 http:/www.ncbi.nlm.nih.gov,在Search 后的下拉框中选择Nucleotide ,把Gen ba nk ID 号输入GO前面的文本框中,点 “ GO ,就可 以找到了。(如 GenBank accession number gi16151096) ”。2.根据已经获得的基因的相关信息进行查找打开http:/www.ncbi.nlm.nih.gov/在search后面的下拉框中选择 Gene,然后在中间的文本框中输入基因名称“ VEGF ,点击GO搜索结果出来了,点击箭头所指的Limits, Limits 的意思其实就是高级检索,你可以在这里对检索词进行很

8、多限制,这样能大大精简查询结果。我们接着来,在 Limits这个界面,先选择查询的限定范围:先选Gene name(基因名称);然后再选择Limit by Tax on omy (生物分类限定)中的 Homosapie ns (人类),然后再点击“GO。直接点击基因名称“ VEGFA就可以看到有关基因的信息了。需要指出的是,在 Gen ba nk中,基因有很多别名(Aliases ),和Ge nba nk中记录的名称有可能不一致。比如 在这里,VEGFA! Genbank中记录的基因名称,而它还有很多别名,比如MGC70609, VEGF(这就是我们要找的基因名称),VEGF-A, VPF;还

9、有,在这里可以看到该基因在染色体上的位置.再往下看,可以看至UGenomic regions, transcripts, and products,这里显示了该基因在基因组中的位置,以及转录本的生成情况:就看见了目的基因的mRNA勺链接(如NM_001025366.1 )和蛋白质的链接(如 NP_001020537.2 )这里得说两句,有的基因也许只有一个编码序列,但有的基因有很多的mRNA剪接体,但都是归在一个基因名称下面。比如,在 VEGF基因下面有 7个序列,分别是 vascular endothelial growth factorA isoform a, isoform c, iso

10、form d, isoform e, isoform f , isoform g, isoform bprecursor ,但是哪个是自己想找的基因呢?这就需要根据你自己查阅的文献以及在这些基 因序列后面的解释来确定了。如果我想找的基因是第一个序列即isoform a, 就可以点击NM_001025366.1,ncbi中查找基因序列的方法和三个号码ncbi首页,点击左侧 Genes&Expression进入后,点击中间页面 DATABASE里的GenBank, 进入 GenBank页面。选 CoreNuleotide。搜“ Saccharomyces cerevisiae tpS1一.例子:查

11、找酿酒酵母(Saccharomyces cerevisia)里的海藻糖合成酶基因(tps1)出耳J “Njlwnd 1 Ahrjiv otMedkincNdthJiiul Lisllutc* elJicallliPdbMedAll DalabasesBLASTOMIMBooksjTaxBrov/ser StructureSearch CoreNucl&otidevfor Saccharomyces cerevisiae tpIT 匚非丨 I CtCrctL即可出现很多条目,找到 Saccharomyces cerevisiae的就是NC_001134 了,点击后就进入该 基因所在染色体的界面了

12、,再在“编辑”中“查找”tpsl就可以看该基因所在的位置,再点击CDS或者GenelD:852423都可以出现相关链接!当然,如果你在文献查到目的蛋白的序列号女口NP_009684.1或者GeneID:852423,那分别在Search后选择Protein或者Gene也可以出现相关链接!二.基因CDS区界面的3个号码http:/www. ncbi. nlm. nih.gov/e ntrez/viewer.fcgi?val=50593115&from=488899&to=490386& view=gbwithparts找到后,我发现该界面有 3个标记,一个是 NC_001134,其次是gi:50

13、593115,最后是FEATURE中的gene中的/db_xref=“ GeneID:852423”,他们分别是什么号码,用在什么地方呢?尝试中,终于发现,在 Search Nucleotide ” 或者“ Core Nucleotide ”时,for 后面是 NC_001134,最终 go 到 该基因所在染色体全长序列的信息,所以NC_001134应该是该染色体的登录号吧?在 Search “Nucleotide ” 或者“ Core Nucleotide ”时,for 后面是 50593115,最终 go 到 该基因所在染色体全长序列的信息,所以50593115应该是该染色体的号吧?在Se

14、arch “Gene”时,for后面是852423,最终go到该基因的信息,所以 852423应该 是该基因的登录号吧?所以我们如果要记住目的基因在 ncbi中的位置就记住这个 GenelD!其他像NP_009684是基因编码的蛋白质的登录号。文献中查到的基因往往给的是Gene ID三引物设计第一步-我编码序列的方法在Search Gene”时,for后面是852423,最终go到目的基因的信息|AlltitabjwPutkl-fi:clI鼻P 叫呻吕4 旳诃电PW1CTjJI1S-earihu*d CD |。卿Same 左asvhLirnftsPrc.iL-iwJlr jJtixliJlui

15、jCl-jbuJid 2t-.nLDj即眄Full Pepofl* 渝严 2D * | Send 1口*WI; 1 Current ony 11 Geries Geriurnei. L Snp Geneview 0 氐D: TPS1Iof tr hi al -phat rrrfiph ph wwhlichth* vt&rjge -carbohydrateIm a Hiam trie f&riii:1$ Inducedby th* itrtf refpntf and rtprtiftdllb1 th Ra?p罰h力刑 |jSLihiiriafYt ?Guiw rinMiT旳PriiTiBi1* toui cflLucu LdijCJene typB口fntsn ccdirgstMuske-viyfeeOrgamlhmcbarc-et u

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号