NCBI分子生物学数据库

上传人:人*** 文档编号:568443007 上传时间:2024-07-24 格式:PPT 页数:70 大小:5.74MB
返回 下载 相关 举报
NCBI分子生物学数据库_第1页
第1页 / 共70页
NCBI分子生物学数据库_第2页
第2页 / 共70页
NCBI分子生物学数据库_第3页
第3页 / 共70页
NCBI分子生物学数据库_第4页
第4页 / 共70页
NCBI分子生物学数据库_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《NCBI分子生物学数据库》由会员分享,可在线阅读,更多相关《NCBI分子生物学数据库(70页珍藏版)》请在金锄头文库上搜索。

1、NCBI分子生物学数据库分子生物学数据库应用简介应用简介NCBINCBI(National Center of Biotechnology (National Center of Biotechnology Information,Information,简称简称NCBI) NCBI) 。美国国立生物。美国国立生物技术信息中心技术信息中心NCBINCBI是是NIHNIH(National Institutes of National Institutes of HealthHealth,美国国立卫生研究院,美国国立卫生研究院 )的的NLMNLM(National Library of Medi

2、cine)美国国立医学图书馆美国国立医学图书馆的一个分支的一个分支NCBI简介简介美国国立医学图书馆(美国国立医学图书馆(NLMNLM)于)于19881988年年1111月月4 4日建立国家生物技术信息中心(日建立国家生物技术信息中心(NCBINCBI)。)。 NCBINCBI的的主要任务主要任务是:是:为储存和分析分子生物学、生物化学和遗传为储存和分析分子生物学、生物化学和遗传学知识创建自动化系统。学知识创建自动化系统。 从事研究基于计算机的信息处理过程的高级从事研究基于计算机的信息处理过程的高级方法,用于分析生物学上重要分子和化合物方法,用于分析生物学上重要分子和化合物的结构和功能。的结构

3、和功能。 促进生物技术研究者和医药治疗人员应用数促进生物技术研究者和医药治疗人员应用数据库和软件。据库和软件。 努力协作以获取世界范围内的生物技术信息。努力协作以获取世界范围内的生物技术信息。 NCBI主要任务主要任务主页网址 http:/NCBI简介简介NCBI首先创建GenBank数据库,在重点开发GenBank的同时,又于1991年开发了Entrez 数据库检索系统。该系统整合了GenBank、EMBL、PIR和SWISS-PROT等数据库的序列信息以及MEDLINE有关序列的文献信息,并通过相关链接,将他们有机地结合在一起。NCBI还提供了其它数据库,包括在线人类孟德尔遗传(OMIM)

4、、三维蛋白结构的分子模型数据库(MMDB)、人类基因序列集成(UniGene)、生物门类(Toxonomy) 等等等等数据库。(数值型、工具型) (看主页)。一、一、Entrez 系统系统All DatabasesEntrez系统系统(All Database)是是NCBI建立的建立的基于基于Internet网生物医学数据库的集成检索网生物医学数据库的集成检索系统(系统(搜索搜索引擎引擎)。涉及核酸序列、蛋白)。涉及核酸序列、蛋白序列、大分子结构、基因组图、基础医学序列、大分子结构、基因组图、基础医学及临床医学等内容数据库。包括及临床医学等内容数据库。包括Nucleotide,Protein,

5、Genome,Structure,OMIM,PopSet,Taxonomy以及以及PubMed在内的在内的35个数据库。个数据库。使用方法是选择好检索词输使用方法是选择好检索词输 入到入到for 后面的后面的框里,按框里,按go就可以了。(就可以了。(例例1)以)以presenilin 1为为搜索词。搜索词。作业:自己选一个搜索词回去试一试作业:自己选一个搜索词回去试一试http:/主页主页 Entrez系统现已改为系统现已改为All Databases 新的新的Entrez检索界面为用户检索这些数检索界面为用户检索这些数据库提供了很大的方便。因其最大的特据库提供了很大的方便。因其最大的特色在

6、于所有的数据库可在同一个检索界色在于所有的数据库可在同一个检索界面进行检索,其结果之间建有超级链接,面进行检索,其结果之间建有超级链接,可直接可直接进行交互访问进行交互访问使用。通过相关链使用。通过相关链接,接,Entrez将这些数据库有机地结合在将这些数据库有机地结合在一起,可以进行序列、结构、生物分类一起,可以进行序列、结构、生物分类及文献数据的相关交叉检索。及文献数据的相关交叉检索。 注注 意意 All Databases 在在NCBI主页)主页)的搜索框中(输入的搜索框中(输入presenilin 1)搜索)搜索的结果是一致的。的结果是一致的。 (一一) Nucteotide (核苷酸

7、序列数据库核苷酸序列数据库) 收集了多个来源核酸序列的数据库,包收集了多个来源核酸序列的数据库,包括来自美国括来自美国GenBank,英国,英国EMBL (欧洲分欧洲分子生物实验室子生物实验室),DDBJ(日本日本),RefSeq(参参考序列数据库)考序列数据库) ,的序列。每日,的序列。每日NCBI的工的工作人员将世界各地实验室提交的核酸序列数作人员将世界各地实验室提交的核酸序列数据以及与国际其他核酸数据库等交换获得的据以及与国际其他核酸数据库等交换获得的核酸序列数据加入到数据库中,其数据量呈核酸序列数据加入到数据库中,其数据量呈指数增长。指数增长。 二、数据库资源二、数据库资源所有已知的所

8、有已知的核苷酸核苷酸序列序列 与之相关的生物学信息与之相关的生物学信息 参考文献参考文献用用accession number,作者姓名,作者姓名,物种,基因物种,基因/蛋白名字,还有许多其蛋白名字,还有许多其他的文本术语来查询。他的文本术语来查询。例如:用基因基因/ /蛋白名字蛋白名字查找IL6IL6IL6NG 011640页面右侧页面右侧dian1dian2下拉下拉1dian32(二二) Genome (基因组数据库基因组数据库) 包括各种基因组、全部染色包括各种基因组、全部染色体、序列图及集成的遗传与物理体、序列图及集成的遗传与物理图谱。可通过该数据库浏览人类图谱。可通过该数据库浏览人类全

9、部基因组序列数据的图像。全部基因组序列数据的图像。 该数据库1990年初建于美国霍普金斯大学,是一个专门汇集存储人类基因组数据的数据库,其中包括了全球范围内致力于人类 DNA结构和100,000种人类基因序列研究的分析成果。对从事相关领域的研究人员具有重要的参考作用。目前,该库包括以下多种内容:人类基因组,包括基因、克隆、断裂点、细胞遗传标记物、易断位点,重复片段等。人类基因组示意图, 包括细胞遗传图关联图,辐射杂交图、综合图等。人类基因组内的变异, 包括基因突变和基因多态性,还有等位基因发生频次等数据资料。该数据库为文理中心和北京大学生命科学学院国家蛋白质重点实验室联合引进,在北京大学图书馆

10、设立了镜像服务器,面对 CALIS所有成员馆免费开放,用户免付国际网通讯费。数据库网址: 主页主页IL6点主页真核细胞进入此页点主页真核细胞进入此页 (三三) Protein (蛋白序列数据库蛋白序列数据库) 该数据库的蛋白质序列数据包该数据库的蛋白质序列数据包括来自括来自GenBank,EMBL,DU,BJ数据库的数据库的DNA序列的翻译序列的翻译编码产物,以及向编码产物,以及向PIR (蛋白信蛋白信息资源息资源),SWISS-PROT(蛋白质蛋白质序列注释知识数据库序列注释知识数据库),PRF (蛋蛋白研究基金数据库白研究基金数据库),PDB (蛋白蛋白数据库数据库)等数据库提交的蛋白序等

11、数据库提交的蛋白序列数据。列数据。 基因map view向向下下找找15显示结果(四四) EST (表达序列标签数据库表达序列标签数据库)expressed sequence tags 表达序列标签是指从不同组织来源的cDNA文库中随机挑选的克隆进行5或3端测序后得到的部分cDNA序列,长度一般为200500bp 表达序列标签(EST)在基因组作图、克隆基因、新基因的识别、蛋白质组研究等许多方面具有重要的用途. 2003年 第14卷 第01期,题目:表达序列标签及其应用 作者: 陈红歌, 贾新成,本文介绍了EST的制备方法,以及构建均一化cDNA文库的方法,并介绍了EST在以上各方面的应用.(

12、五五) GSS 是Genebank 的一个分之,与EST相似(六六) Structure (结构数据库结构数据库) 结构数据库或分子模型数据库(结构数据库或分子模型数据库(MMDBMMDB)包括了)包括了来自来自PDB(Protein Data Bank)数据库的由晶体数据库的由晶体衍射和核磁共振实验研究得到的大分子三维结构的衍射和核磁共振实验研究得到的大分子三维结构的信息。由于信息。由于Entrez系统的所有数据库间的交叉链接系统的所有数据库间的交叉链接,由此用户可以很方便地从网上浏览大分子的平面,由此用户可以很方便地从网上浏览大分子的平面图像或三维立体图像。图像或三维立体图像。 Cn3D

13、4.1 (七七) PopSet (种群组数据库种群组数据库) 该数据库收录来自种群研究、种系发生研究或该数据库收录来自种群研究、种系发生研究或突变研究的数据。包括核酸和蛋白质序列数据库突变研究的数据。包括核酸和蛋白质序列数据库 (八八) OMIM (人类孟德尔遗传数据库人类孟德尔遗传数据库) 该数据库收集了人类基因与遗传疾病的各种信该数据库收集了人类基因与遗传疾病的各种信息,包括原文、图片和参考信息,同事还可以链接息,包括原文、图片和参考信息,同事还可以链接到到Entre系统的系统的Medline数据库中相关文献和序列数据库中相关文献和序列信息。信息。此库为动态。此库为动态。作业以作业以Dow

14、ns syndrome为为例例检索检索点点1 (九九) Taxonomy (生生物物分分类类数数据库据库) 该数据库收录了在该数据库收录了在NCBI数据库中出现的所有数据库中出现的所有生物的核酸序列或蛋白序列,可按生物学门类进行生物的核酸序列或蛋白序列,可按生物学门类进行检索活浏览。检索活浏览。 (十十) SNP (单核苷酸单核苷酸 多态数据库多态数据库)基因组变异最常见的一种形式是单核苷酸多态性(single nucleotide polymorphism, SNP). 其应用范围较微卫星标记更加宽广,它对群体遗传学、制药业、法医学、癌症及遗传性疾病甚至进化的研究都将产生不可估量的影响。 国

15、际上较重要的网站有:国际上较重要的网站有:(1) dbSNP(/):该网站是由美国的NCBI主办的。它除了可接受各地发来的SNP申请注册外,也向公众免费提供对SNP的查询。(2) hGBASE():该网站建在德国,收集基因内SNP,研究者可通过检测出的序列查询SNP。(3) mIT SNP数据库():该网站是由美国麻省理工学院建立的。它包括数千条已经定位的SNP,可以通过指定染色体的某一区域查询SNP。 其它的其它的SNP站点还有:站点还有:华盛顿大学,网址是:,网址是:;美国人类基因组研究所,网址是:http:/About- nHGRI/Der/variat.htm。 (十一十一) UniS

16、TS (表达序列标签数据库表达序列标签数据库)(十二十二) EST (表达序列标签数据库表达序列标签数据库)EST EST (Expressed Sequence Tag)(Expressed Sequence Tag)表达序表达序列标签。(定义)列标签。(定义)STS STS 序列标签位点序列标签位点, , (Sequence Tagged Sites ,STS)数据库数据库(dbSTS)是是GenBank的的分库分库, e-PCRe-PCR工具是工具是UniSTSUniSTS资源库的一部分,资源库的一部分,可用来寻找一段目的可用来寻找一段目的DNADNA片断中的片断中的STSSTS标记标记

17、物,标记物资料包括引物序列、产物大小、物,标记物资料包括引物序列、产物大小、作图信息和别名。作图信息和别名。dbSTS是NCBI一种新的数据库,主要收录基因标志序列或序列标志位点和图谱数据。虽然dbSTS序列将并入GenBank,但是dbSTS中的注释更具综合性,包括有关实验者、实验条件和基因图谱定位等更为详细的信息。dbEST: GenBank+EMBL+DDBJ+PDB中EST部分的无冗余数据。dbSTS: GenBank+EMBL+DDBJ+PDB中STS部分的无冗余数据。(十三十三) PubMed(medline) (十四十四) PMC注意注意三、检索方法三、检索方法(一一)联合检索方

18、法联合检索方法 在在Entrez主页提供的检索框中输入一个或主页提供的检索框中输入一个或多个检索词,点击多个检索词,点击“Go”,即可开始对所有,即可开始对所有数据库同时进行检索。检索结果直接出现在数据库同时进行检索。检索结果直接出现在结果显示界面所有数据库名称的左侧。点击结果显示界面所有数据库名称的左侧。点击任一项结果都可进入相应数据库的显示界面。任一项结果都可进入相应数据库的显示界面。数据库名称右侧之后的数据库名称右侧之后的“?”可链接该数据库可链接该数据库的简短注释。下图中显示的简短注释。下图中显示apoptosis在各数在各数据库中的检索记录数,点击后可链接相应数据库中的检索记录数,点

19、击后可链接相应数据库中的记录显示。据库中的记录显示。 EntrezAll DatabasePubMedApoptosis(十五)(十五)Books(十六)(十六)JournalsStructureApoptosisCrystal Structure Of Caspase-7Crystal Structure Of Procaspase-7Limit 限限制制功功能能用用来来缩缩小小检检索索范范围围,除除去去不不需需要要的的部部分分,可可提提高高文文献献查查准准率率。Nucleotide与与Protein数数据据库库提提供供了了下下述述限制内容。限制内容。 (1) 字段限制字段限制 (All F

20、ields):可将检:可将检索范围限制在某一字段,如著者、基因索范围限制在某一字段,如著者、基因名称、生物体、序列长度及篇名词等,名称、生物体、序列长度及篇名词等,共有共有22项字段限制内容。项字段限制内容。 (2)选选择择排排除除某某些些种种类类的的序序列列:如如排排除除ESTs (表表达达序序列列标标签签)、GSS (基基 因因 组组 调调 查查 序序 列列 )、 patents(专专利利序序列列)等等。需需要要排排除除时勾选相应内容左侧之选框。时勾选相应内容左侧之选框。 (3)限制特殊的分子类型限制特殊的分子类型 (Molecule):包括基因组:包括基因组DNARNA,mRNA,rRN

21、A。 NucleotideLimit(现没有)(现没有) ProteinLimit (4)限限制制某某一一子子库库(Only From):可可选选择择的的子子库库有有RefSeq(NCBI的的参参考考序序列列计计划划),GenBank,DDBJ,EMBL等。等。 (5)限限制制在在特特殊殊的的基基因因位位点点(Gene Location):可可选选择择基基因因组组有有DNARNA、线粒体、叶绿体。、线粒体、叶绿体。 (6)限制序列修改限制序列修改(或出版或出版)的日期的日期(Modification Date):可根据需要填:可根据需要填清起止的时间。清起止的时间。 4其他功能其他功能 同同P

22、ubMed相似,在检索界相似,在检索界面可以使用面可以使用Cubby,Linkout等等功能。另外,在结果显示页还可功能。另外,在结果显示页还可通过通过“Link”链接链接Related Sequences,PubMed,Taxonomy及及Linkout等其他数据等其他数据库,以获得更多的信息。库,以获得更多的信息。 Protein数据库中提供的数据库中提供的“Blink”(BLAST Link)链接为链接为Entrez所有蛋所有蛋白序列在白序列在Blast数据库中的结果显示。它与数据库中的结果显示。它与“Related Sequences”链接不同,链接不同,Related Sequences链接显示了相似序列文献的题目,链接显示了相似序列文献的题目,而而Blink链接则显示其图形的信息,图中不仅链接则显示其图形的信息,图中不仅显示了该蛋白序列的主要信息,还提供了其显示了该蛋白序列的主要信息,还提供了其他不同的显示格式,如本次检索结果细胞色他不同的显示格式,如本次检索结果细胞色素素P450还原酶还原酶(Cytochrome P450 reductase)在各种生物中的分布,提供生物在各种生物中的分布,提供生物分类信息、分类信息、3D结构等。结构等。BLink Domains LinksBLinkDomainsProteinBlinkThanks !

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号