NCBIBLAST使用

上传人:hs****ma 文档编号:504481571 上传时间:2022-07-30 格式:DOC 页数:19 大小:295.03KB
返回 下载 相关 举报
NCBIBLAST使用_第1页
第1页 / 共19页
NCBIBLAST使用_第2页
第2页 / 共19页
NCBIBLAST使用_第3页
第3页 / 共19页
NCBIBLAST使用_第4页
第4页 / 共19页
NCBIBLAST使用_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《NCBIBLAST使用》由会员分享,可在线阅读,更多相关《NCBIBLAST使用(19页珍藏版)》请在金锄头文库上搜索。

1、NCBI的BLast最好生物核酸的数据库NCBI是在NIH的国立医学图书馆(NLM)的一个分支。NLM是因为它在创立和维护生物信息学数据库方面的经验被选择的,而且这可以建立一个内部的关于计算分子生物学的研究计划。NCBI的任务是发展新的信息学技术来帮助对那些控制健康和疾病的基本分子和遗传过程的理解。 BLAST是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小于15秒的时间内对整个DNA数据库执行序列搜索。NCBI提供的附加的软件工具有:开放阅读框寻觅器(ORF Finder),电子PCR,和序列提交工具,Sequin和BankIt。所有的NCBI数据库

2、和软件工具可以从WWW或FTP来获得。NCBI还有E-mail服务器,提供用文本搜索或序列相似搜索访问数据库一种可选方法。 NCBI的BLast种类介绍? Gapped BLAST (2.0) 一种BLAST版本,允许在它产生的对齐(alignments)中存在缺口。统计有效性的评估是基於使用随机序列的优先模拟。在不久的将来,所有对Gapped BLAST的访问都要通过QBLAST。 ? QBLAST 一种新的系统,允许用户以他们方便的方式检索Gapped BLAST结果,并且可以用各种格式选项多次格式化他们的结果。这个系统也使NCBI更有效的使用计算资源,更好的为大家服务。到1999年秋季,

3、QBLAST系统用於所有的BLAST搜索。 ? PSI-BLAST 位点特异迭代BLAST 用蛋白查询来搜索蛋白资料库的一个程式。所有被BLAST发现的统计有效的对齐被总和起来形成一个多次对齐,从这个对齐,一个位置特异的分值矩阵建立起来。这个矩阵被用来搜索资料库,以找到额外的显著对齐,这个过程可能被反复迭代一直到没有新的对齐可以被发现。 ? PHI-BLAST 模式发现迭代BLAST 用蛋白查询来搜索蛋白资料库的一个程式。仅仅找出那些查询序列中含有的特殊模式的对齐。 ? BLAST两个序列 一个基於BLAST的工具,对齐两个核酸或蛋白的序列,产生一个成对的DNA-DNA或蛋白蛋白序列比较。 ?

4、 IgBLAST IgBLAST被开发出来以便於分析在GenBank中的免疫球蛋白的序列。它允许用blastp或blastn来搜索nr资料库或一个由免疫球蛋白生殖系变化区基因的特殊的资料库。搜索可以限制在人类或小鼠的基因。IgBLAST执行三个主要的功能1)报告与查询序列最相似的可变,D,或J区,2)根据Kabat et al.来注解免疫球蛋白domains(从FWR1到FWR3),3)对於搜索核酸或蛋白nr资料库,通过匹配IgBLAST的发现和最接近的生殖系变化区基因来简化识别相关序列的过程。 ? PowerBLAST PowerBLAST是一个程式,允许对非常长的序列进行快速的gapped

5、 BLAST搜索,它把序列分割开,对每个部分搜索,然後把结果组装起来。包含在Sequin中的PowerBlast版本使用了新的强大的gapped BLAST演算法,过滤和物种特异的输出特点还仍旧保留。 ? BLAST E-mail伺服器 基於e-mail的序列相似搜索服务,接受FASTA格式的核酸或蛋白序列。如果要获得帮助档,给blastncbi.nlm.nih.gov写一封只有内容为HELP的E-Mail。 ? 网路BLAST 一个WWW Entrez基於TCP/IP的客户-伺服器版本。直接通过Internet来连接NCBI的资料库来检索资料。有PC,Mac,Unix,版本的客户软体。 ?

6、单独的BLAST 下载可用於本地执行使用的BLAST。二进位版本有IRIX 6.2, Solaris 2.6, DEC OSF1 (ver. 4.0d), LINUX, 和 Win32系统。BLAST资料库同样可以下载。 专门的BLAST页面 ? BLAST人类染色体 人类染色体测序页面的一部分。 ? BLAST against Drosophila melanogaster genome sequence - see additional information on the Drosophila genome above. ? BLAST against dbSNP - additiona

7、l information about dbSNP is above. ? Microbial Genomes BLAST Databases - BLAST against finished and unfinished microbial genomes. ? BLAST against P. falciparum only, all Plasmodium, or all Toxoplasma in GenBank ? BLAST against P. falciparum 3D7 Genome Project finished and unfinished sequencesPrimer

8、-BLAST是NCBI的引物设计和特异性检验工具。Primer-Blast介绍Primer-BLAST,在线设计用于聚合酶链反应(PCR)的特异性寡核苷酸引物。Primer-BLAST可以直接从Blast主页(http:/blast.ncbi.nlm.nih.gov/)找到,或是直接用下面的链接进入:http:/www.ncbi.nlm.nih.gov/tools/primer-blast/这个工具整合了目前流行的Primer3软件,再加上NCBI的 Blast进行引物特异性的验证。Primer-BLAST免除了用另一个站点或工具设计引物的步骤,设计好的引物程序直接用Blast进行引物特异性验

9、 证。并且,Primer-BLAST能设计出只扩增某一特定剪接变异体基因的引物an important feature for PCR protocols measuring tissue specific expression(注:没办法准确的翻译,只好作罢,汗!)。Primer-BLAST有许多改进的功能,这样在选择引物方面比单个的用 Primer3和NCBI BLAST更加准确。Primer-BLAST的输入Primer-BLAST界面包括了Primer3和BLAST的功能。提交的界面主要包括三个部分:target template(模板区), the primers(引物区), 和sp

10、ecificity check(特异性验证区)。跟其它的BLAST一样,点击底部的“Advanced parameters”有更多的参数设置。模板(Template)在“PCR Template”下面的文本框,输入目标模板的序列,FASTA格式或直接用Accession Number。如果你在这里输入了序列,是用于引物的设计。Primer-BLAST就会根据你输入的序列设计特异性引物,并且在目标数据库(在specificity check区选择)是唯一的。引物(Primers)如果你已经设计好了引物,要拿来验证引物的好坏。可以在Primer Parameters区填入你的一条或一对引物。并且选

11、择好验证的目标数据库(在specificity check区选择)。根据需要可设置产物的大小,Tm值等。特异性(Specificity)在specificity check区,选择设计引物或验证引物时的目标数据库和物种。这一步是比较重要的。这里提供了4种数据库:RefSeq mRNA, Genome (selected reference assemblies), Genome (all chromosomes), and nr (the standard non-redundant database)。前两个数据库是经过专家注释的数据,这样可以给出更准确的结果。特别是,当你用NCBI的参考序

12、列作为模板和参考序列数据库作为标准 来设计引物时,Primer-BLAST可以设计出只扩增某一特定剪接变异体基因的特异引物。selected reference assemblies 包括以下的物种: human, chimpanzee, mouse, rat, cow, dog, chicken, zebrafish, fruit fly, honeybee, Arabidopsis, 和 rice。Nr数据库覆盖NCBI所有的物种。实例分析用人尿嘧啶DNA糖基化酶(uracil-DNA glycosylase genes, UNG, GeneID: 7374)的两个转录本序列作为一个例子来

13、分析。UNG1的序列长一点(NM_003362),UNG2的序列短一点(NM_080911,注:拿这两个基因的序列ClustalW一 下就可以了)。这里用UNG2的序列设计引物,选择RefSeq mRNA database,物种是Human,其它默认。结果如下图A-B所示,设计的引物只能扩增出UNG2。看上面的图,把“Allow primer to amplify mRNA splice variants”这个选项给勾上,出现的结果如下图-C所示,新的引物也可以扩增出UNG1(注:我试了一下,不能得到预期的结果,可能参数没设对)。Figure. Primer-BLAST results for

14、 UNG transcript variant 2. The NCBI Reference sequence NM_080911 was used as a template. Top panel: Primers specific to the single splice variant are reported by default with the mRNA RefSeq database limited to human sequences. Bottom panel: Primers that amplify both splice variants are found with t

15、he option to allow splice variants.(点击看大图)一些Tips1,在任何时候都要优先使用参考序列的Gi号或Accession 号(尽量不要Fasta格式的序列)。另外,确保你的序列是最新版本的(在填Accession Number时后面不加版本号就会自动拿最新的序列)2,就算你对整个序列的某部分感兴趣(如某条染色体上的某个区域),你也应该优化使用Gi号或Accession 号(Primer-BLAST有参数可以设置设计引物的范围,”Form-To”,如上面的第一幅图所示)。因为用Gi号或Accession 号,NCBI会自动读取该序列的一些注释数据,对引物的设

16、计更加有利。3,尽量使用没有冗除的数据库(如refseq_rna 或 genome database),nr数据库包括了太多的冗除的序列,会干扰引物的设计。4,请指定一个或几个PCR扩增的目标物种。如果不指定在所有的物种搜索,将会使程序变得很慢,引物的结果也会受其它不相关的物种影响。参考文献1. Steve Rozen and Helen J. Skaletsky (2000) Primer3 on the WWW for general users and for biologist programmers. In: Krawetz S, Misener S (eds) Bioinformatics Methods and Protocols: Methods in Molecular Biology. Hum

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号