文档详情

NCBI各数据库简介

汽***
实名认证
店铺
DOCX
38.27KB
约25页
文档ID:490862110
NCBI各数据库简介_第1页
1/25

NCBI各数据库简介本篇文献转自以下网址:/experiment/fenzi/237847.html随着ncbi数据库各种资源的涌现,NCBI已经成为科研工作者必 不可少的工具了那么各位小伙伴们,你能说出NCBI有多少数据库吗? 有哪些实用的工具吗?不知道的就进来看看吧!美 国 国 立 生 物 技 术 信 息 中 心 (National Center for Biotechnologylnformation),即我们所熟知的NCBI是由美国国立卫 生研究院(NIH)于1988年创办创办NCBI的初衷是为了给分子生物学家提供一个信息储存和处理 的系统除了建有 GenBank 核酸序列数据库(该数据库的数据资源来自全 球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生 物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还 可以提供众多功能强大的数据检索与分析工具目前, NCBI 提供的资源有 Entrez、 Entrez Programming Utilities、 MyNCBI、 PubMed、 PubMed Central、 EntrezGene、 NCBI Taxonomy Browser 、 BLAST 、 BLAST Link (BLink) 、 Electro nicPCR等共计36种功能。

而且都可以在 NCBI 的主页上找到相应链接,其中多半是由 BLAST 功能发展而来的1NCBI数据库更新进展1.1 PubMed搜索功能的增强NCBI 对 PubMed 进行了几项改进工作,改动最大的是搜索界面 和摘要浏览界面其中,搜索界面中新增了 “Advaneed Search”选项(这实际上是 对以往“Limits”和“Preview/Index”功能的整合),并且增加了一 个新的窗口,用户可以在此窗口下通过“论文作者名”、“论文所属 杂志名称”、“论文出版日期”等限定条件进行搜索而且,“论文作者名”和“论文所属杂志名称”还设有文本框自 动填充功能现在,在 PubMed 数据库中进行文本搜索的同时还可以立即通过 两个“内容传感器(content sensors)”进行分析一个“内容传感器”是根据作者姓名、所属杂志名称或杂志名缩 写、出版日期、卷号或刊号等信息进行分析,然后将符合条件的搜索 结果排列到结果列表的顶端另一个“内容传感器”是根据文章是否与用户给出的条件,例如 是否与某种药物相关,在NCBI的新增数据库PubMed Clinical Q&A 中进行搜索,然后给出搜索结果。

1.2 primer-BLAST 分析工具Primer-BLAST ( /tools/primer-blast/ )在设计出引物之后还在 某些相应数据库中进行 BLAST 搜索,因此可以得到特异性引物,扩增 出目的片段用户在给出DNA模板的同时还可以限定正向引物或反向引物,这 样,NCBI就只会给出另一条引物如果用户给出了模板DNA和两条 引物序列,Primer-BLAST就只会运行BLAST程序,帮助用户对引物 进行分析用户也可以只给出两条引物而不给出模板序列,这时 Primer- BLAST会通过BLAST程序分析出与这对引物最匹配的模板序列Primer-BLAST进行BLAST搜索的数据库包括RefSeq mRNA、 BLAST nr和12种模式生物基因组数据库1.3 BLAST的改进及更新NCBI 对 BLAST 进行了全新的改版,推出了最新的 web BLAST report在最新的BLAST比对结果页面中,“图形化概要(Graphic Summary)”、 “具体描述(Descriptions)”以及“序列比对 (Alignments)”等部分页面都可以展开和收起此外,网页上还提供了 “结果输出格式选项(Formatti ng)”和“结果下载选项(download)”,在下载选项中还新增了CSV格式下载。

这样,读者可以轻松地将 BLAST 的比对结果输入到表格处理软件 中去另外,BLAST比对结果页面上的“Alignments”部分还提供了每 一条命中序列在 Entrez GENE 中的相关信息,这些信息包括基因名称 来源物种以及在PubMed数据库中与该基因有关条目的数目等BLAST tree”结果输出模式可以测量不同序列间的距离,自动 收起亚类信息等现在,可以以 Newick 格式或 Nexus 格式下载 BLAST tree结果,也可以在进化树图中选择任一节点重新构树最后还要向读者介绍ncbi blast的一个新网址:URL:NCBI建 议读者都使用这个网址登陆NCBI BLAST,因为该BLAST使用更多的 计算机进行分析,也具有更强的系统容错能力1.4 En trez Ge ne改进及更新基因组注释工作当中有一项重要的工作就是定位基因重叠群序列 (contig sequences),即在染色体中找出某个基因的定位实际上基因组测序工作就是将许多基因重叠序列彼此拼接,最后 拼出“完整(中间会有一些缝隙)”的基因组图谱这项工作可以直接将某个基因与某段基因重叠群序列对应起来, 但不能直接将该基因与染色体联系起来,而这恰恰是生物学家最感兴 趣的地方。

因此,为了能让用户在搜索基因的同时,也能了解到一些该基因 在染色体中的定位情况,Entrez Gene推出了新的“Limits”服务,用 户可以使用该服务在基因组范围内进行基因搜索用户可以在某个物 种染色体的某个区域里进行基因搜索En trez Gen e会按以下三种顺序对搜索出的基因进行排序:1)按照基因名排序2)按照相关性排序,即按照结果与用户搜索所使用的关键词, 例如基因名称等的匹配程度排序3)按照基因重要性排序,即按照该基因在 PubMed 、 Homologene、Protein Clusters、OnlineMendelian Inheritance in Man(OMIM)或Bookshelf中文献数量的多少进行排序22ENTREZ搜索系统2.1 EntrezEntrez 数据库是一个整合了多个数据库的综合检索系统,它包含 了 35 个不同数据库的信息,共收录有超过350,000,000条记录(表 1)Entrez数据库支持使用简单的布尔查询(Boolean queries)方式进 行文本搜索,可以下载不同格式的数据资料,还可以按照生物学关系 提供与其它相关记录的链接这些链接给出的都是最简要的信息,例如会给出一条序列和报道 该序列的论文摘要,或者会给出一条蛋白质序列的编码DNA序列或该 蛋白质的3D结构图。

这种通过计算机运算,即基于比较序列相似性或PubMed中摘要 的相似性,所给出的相关链接信息可以以最快的速度提供给用户大量 的相关信息还有一种叫做“LinkOut”的功能将这种链接功能扩展到了与外部 数据库,例如各物种基因组数据库之间的链接Entrez中搜索到的数 据可以以多种格式输出,也可以打包下载或逐个下载2.2 My NCBIMy NCBI 功能是为了方便用户储存个人配置信息,例如搜索条件、 Lin kOut参数或文件出处等而设的用户登陆自己的My NCBI帐户后,就可以进行保存搜索设置、管 理邮件等操作了My NCBI中有一种称作“Collections”的功能可以 让用户储存搜索结果和文献结果BLAST 中也设有类似的功能,这样用户就可以使用同一条件进行 多次比对了同时往NCBI递交转录组、基因组等相关数据都需要注册, 获得自己的My NCBI账户!3BLAST比对系统可与在站点/Blast.cgi看到除常规BLAST的各种blast延伸版本Frlmtr-BlftSirG14IMI Alifrtco-$«aixh引皿 h 沖用 mll?r■Id your quayPe旳i pranff5 specify to your PCR^HTipl-sleCompare five acrass thar mtre qiainAnd corf^rv^ EmB®丐 wi yixr 5BqueficEGEO国BLASTV«cScreen匚 DARTSearch immunn^zibMiis ■=*idlcell recepwr 5«UCniX5Search i^nces 怡『ueciorc«ntam^at>on"ZE conwrw^OOTa*! isrchltKlure丁前聊t醺LMlMultiple Alpmtnt断酣右ayMOLE-BLAST3.1 BLASTBLAST 默认的比对信息数据库包括 NCBI 中的人类基因组数据库 和人类RefSeq数据库。

比对之后,BLAST会按照评分高低、序列相 似度对结果进行排序,另外 BLAST 还可以对小鼠数据库以及其它基因 组数据库进行比对蛋白质序列的默认数据库包括Gen Bank非冗余数据库、RefSeq、 Swiss-Prot、PDB、PIR 和 PRF 等此外,还包括这些数据库下的子 数据库以及其它一些专利数据库和诸如核酸数据库等环境样品数据库 (environmental samples)3.2 BLAST output formats标准的BLAST输出格式包括默认的配对比对格式(default pairwise alignment)、搜索定位的多序列比对格式(query-anchored multiple sequence alignment formats)、简单的可解析的 Hit Table 格式以及按照分类学给出的报告格式等—种叫做“按照同一性进行配对(Pairwise with identities)”的格 式能更好地突出目标序列与检索序列之间的差别而 Web BLAST 中提供的树状浏览格式则会按照搜索出的目标序 列与检索序列之间的距离不同将这些目标序列进行聚类,形成—幅树 状图来显示结果。

BLAST 比对之后给出的每—种格式的比对结果都会有—个分值和 E值用户也可以设定一个E值的阈值来筛选比对结果3.3 MegaBLASTMegaBLAST 也是一种 BLAST 程序,不过它主要是用来在非常相 似的序列之间(来自同一物种)比对同源性的使用者通过网页使用 MegaBLAST 进行批量比对操作,这比使用 标准的BLAST程序要快10倍MegaBLAST在NCBI基因组BLAST页面下是默认的搜索工具, 借助它能对增长迅速的Trace Archives数据库和标准BLAST使用的数据库进行快速检索NCBI 还为跨物种核酸序列快速搜索提供了 Discontiguous MegaBLAST,它使用非重叠群字段匹配算法(noncontiguous word match)来进行核酸比对Discontiguous MegaBLAST 比 blastx 等翻译后比对要快得多, 同时它在比较编码区时也具有相当高的敏感度3.4 Genomic BLASTNCBI在Map Viewer( /mapview/)中还有未已完成测序的物种 设有Genomic BLAST通过默认的Genomic BLAST对某个物种的基 因组序列进行blast比对,获得相关信息。

4文献资源4.1 PubMed数据库(文献下载的重要来源)目前,PubMed数据库中收录有自1860年以来20,400种生命科 学类杂志、刊物刊登过的超过1800万条的文献记录这些文献中有 980 万条摘要信息,最早的记录可追溯。

下载提示
相似文档
正为您匹配相似的精品文档