生物数据库幻灯片

上传人:E**** 文档编号:90118602 上传时间:2019-06-08 格式:PPT 页数:131 大小:4.58MB
返回 下载 相关 举报
生物数据库幻灯片_第1页
第1页 / 共131页
生物数据库幻灯片_第2页
第2页 / 共131页
生物数据库幻灯片_第3页
第3页 / 共131页
生物数据库幻灯片_第4页
第4页 / 共131页
生物数据库幻灯片_第5页
第5页 / 共131页
点击查看更多>>
资源描述

《生物数据库幻灯片》由会员分享,可在线阅读,更多相关《生物数据库幻灯片(131页珍藏版)》请在金锄头文库上搜索。

1、生物信息学数据库,数据库介绍与数据检索,1,生物信息学与功能基因组学,http:/www.bioinfbook.org,2 /131,面对堆积如山的生物学数据,3 /131,主要内容,一、分子生物学数据库简介 二、 NCBI ( Entrez)简介 子数据库,数据格式,数据检索,工具软件,4 /131,思考题:根据自己的知识和经验,你认为网上应该会有哪些分子生物学的数据库?数据库中应该存放哪些数据?应该提供什么类型的数据处理服务。 以下是一些关键词: DNA,RNA,Protein,Genome,物种,文献,疾病,结构,蛋白质家族,Gene,染色体。,5 /131,一、分子生物学数据库,分子生

2、物学数据库各自按照一定的目标收集和整理实验数据,并提供相关的数据查询、数据处理的服务,并大多提供网络服务。,建立生物分子数据库,生物分子数据 高速增长(HGP),分子生物学及其相关领域研究人员需要迅速获得最新实验数据,6 /131,生物数据分类,生物信息数据库种类繁多,就目前来看, 大体可以分为四个大类: 1.基因组数据库; 2.核酸和蛋白质一级结构序列数据库; 3.生物大分子(主要是蛋白质) 三维空间 结构数据库; 4.根据以上三类数据库和文献资料为基础构建的二次数据库。也称专门数据库、专业数据库或专用数据库。,一次数据库,7 /131,生 物 分 子 信 息,生物分子结构数据,生物分子功能

3、数据,最基本,直观,复杂,核酸序列数据,生物分子数据类型,蛋白质序列数据,8 /131,生物学数据库统计,Nucleic Acids Research杂志每年的第一期中详细介绍最新版本的各种数据库。 http:/nar.oxfordjournals.org/ http:/www.oxfordjournals.org/nar/database/c/,9 /131,1 核酸序列数据库 2. RNA 序列数据库 3. 蛋白质序列数据库 4.结构数据库 5. 基因组数据库(非脊椎动物) 6. 代谢酶相关产物 7. 人类和其他脊椎动物基因组 8. 人类基因和疾病 9. 其他数据和其他基因表达数据库 10

4、. 蛋白组资源 11. 其他分子生物学数据库 12.细胞器官数据库 13.植物数据库 14.免疫学数据库,10 /131,核酸序列数据库,国际上著名的一级核酸数据库 (1)美国生物技术信息中心的GenBank http:/www.ncbi.nlm.nih.gov/ (2)欧洲分子生物学实验室的EMBL http:/www.embl.org/ (3)日本遗传研究所的DDBJ http:/www.ddbj.nig.ac.jp/,11 /131,数据相同,GenBank数据库每天与欧洲分子生物学实验室的核酸序列数据库(European Molecular Biology Laboratory Nuc

5、leotide Sequence Database,EMBL)和日本的DNA数据库(DNA Data Bank of Japan DDBJ)进行数据交换,以保证数据库内容在全世界范围的同步性。,12 /131,特殊类型核酸序列数据库:,非编码RNA数据库(ncRNA); 表达序列标签数据库(dbEST); 序列标签位点数据库(dbSTS); miRBase ; tRNAdb等。,13 /131,基因组相关数据库:,人类基因组数据库(HGD); 基因组序列数据库(GSDB); 基因组在线数据库(GOLD)等。,14 /131,核酸三维结构数据库:,核苷酸三维结构数据库(NDB); 普纳大学核酸结

6、构数据库(BNASDB)等。,15 /131,基因表达数据库:,基因表达库(GEO); 斯坦福微阵列数据库(SMD); ArrayExpress; CGED; GXD; BodyMap 等。,16 /131,人类基因突变及疾病相关数据库:,人类基因变异数据库(HMGD)、人类遗传双等位基因序列数据库(HGBASE)、人类孟德尔遗传在线(OMIM)、国际单体型计划(HapMap)、人类单核苷酸多态性数据库(dbSNP)、肿瘤基因数据库(TGDB)、疾病关联数据库(GAD)、癌症基因数据库(CGAP)、人类表观遗传数据库(HEP)、人类DNA甲基化与癌症数据库(MethylCancer)等。,17

7、 /131,蛋白质序列数据库,随着分子生物学的发展,人们获得了越来越多关于蛋白质序列、结构和功能的信息。世界各国的生物学家和计算机科学家合作利用这些信息构建了蛋白质序列数据库、蛋白质三维结构数据库、蛋白质组数据库(二维凝胶电泳数据库)、信号传导及蛋白质-蛋白质相互作用相关数据库、DNA和蛋白质相互作用数据库等蛋白质相关数据库。,18 /131,常用的蛋白质序列数据库:,PIR MIPS Swiss-Prot UniProt,19 /131,蛋白质功能、结构域和蛋白质家族有关的数据库:,PROSITE InterPro Pfam ProDom SMART 等,20 /131,蛋白质三维结构相关数

8、据库:,PDB BioMagResBank SWISS-MODEL Repository ModBase CATH SCOP ReLiBase TOPS SWISS-3DIMAGE BioImage等,21 /131,蛋白质二维凝胶电泳数据库:,WORLD-2DPAGE Phoretix links,22 /131,信号传导及蛋白质-蛋白质相互作用相关数据库:,DIP INTERACT ProNet KEGG CANSITE SPAD CSNDB等,23 /131,DNA和蛋白质相互作用数据库:DPInteract 蛋白质翻译后修饰相关数据库: O-GlycBase、PhosphoBase、R

9、ES蛋白质等蛋白质,24 /131,UniProt-通用蛋白质资源库,(http:/www.uniprot.org/)是存储和链接其他蛋白质数据库的资源库,并且是蛋白质序列和具有综合功能注释目录的中心资源库。使用UniprotKB可以检索准确、可靠的蛋白综合信息。使用UniRef可以减少冗余,加速序列相似性搜索。使用UniParc可以检索存档序列和它们来源的数据库。,25 /131,http:/www.uniprot.org (蛋白数据库),26 /131,MIPS数据库,慕尼黑蛋白质序列信息中心(MIPS)(http:/www.helmholtz-muenchen.de/en/ibis),它

10、的重点工作是基因组生物信息学,特别注重基因组信息系统分析,包括应用生物信息学方法注释基因组、表达分析和蛋白质组学方面研究。MIPS支持和维护一系列基因组数据库以及系统,可以提供细菌、真菌和植物基因组比较分析服务。在该站点提供基因组分析工具、数据库检索系统、表达分析、蛋白相互作用等网络服务。,27 /131,http:/www.helmholtz-muenchen.de/en/ibis,28 /131,其他重要的蛋白质序列数据库:,PRINTS Pfam,29 /131,PRINTS,PRINTS(http:/www.bioinf.manchester.ac.uk/dbbrowser/PRINT

11、S/index.php)是蛋白基序指纹图综合数据库,每个指纹图都是使用数据扫描程序ADSP或VISTAS序列分析软件包反复优化后定义的。数据库中有两种类型指纹图,根据指纹图的复杂性分为简单和复合指纹图:简单指纹图基本上是单一的基序,而复合指纹图包含多个基序。,30 /131,Pfam,蛋白质一般是由一个或多个功能区域组成,这些功能区域通常称作域(domain)。在不同的蛋白质中不同的域以不同的组合出现,导致在自然界发现多种多样组成成分的蛋白质。识别出现在蛋白质中的域可以了解蛋白质的功能。 Pfam数据库(http:/pfam.sanger.ac.uk/)是一个大的蛋白质域家族集合,每个家族是用

12、多序列比对和隐马模型(HMMs)分析结果的代表。,31 /131,http:/www.pdb.org/ (结构数据库),32 /131,http:/www.ensembl.org/index.html,33 /131,ENSEMBL简介,ENSEMBL旨在开发一种能够对真核生物基因组进行自动诠释(automatic annotation)并加以维护的软件。该计划由英国Sanger研究所Wellcome基金会及欧洲分子生物学实验室(EMBL)所属分部欧洲生物信息学研究所(EBI)共同协作运营。 该计划开放所有源信息,所有由该计划所产生的数据及软件都可以免费及自由地从网络上获取并使用。 该计划所开

13、发并使用的大部分软件是用Perl语言编写的,并基于BiopPerl的基础框架。其他基因组计划亦可轻易使用Perl语言的应用程序接口(Application programming interface,API)。,34 /131,http:/www.geneontology.org/,biological process生物过程 molecular function分子功能 cellular component细胞组分。,35 /131,National Center for Biotechnology Information (NCBI) www.ncbi.nlm.nih.gov,二、NCBI

14、,子数据库,数据格式,数据检索,工具软件。,36 /131,NCBI www.ncbi.nlm.nih.gov,美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI) NCBI成立于1988年,其主要工作是开发以GenBank为代表的数据库,进行计算生物学研究,开发用于分析基因组数据的软件工具,发布生物医学信息。 Entrez是NCBI著名的用于提取序列信息的工具,它将科学文献、DNA和蛋白质序列数据库、蛋白质三维结构数据、种群研究数据以及全基因组组装数据整合成一个高度集成的系统。类似于EBI的SRS,是一个查询、提取

15、和显示系统。,37 /131,首页,38 /131,学习利用NCBI,http:/www.ncbi.nlm.nih.gov/books/bv.fcgi?rid=handbook,39 /131,sitemap【旧版本】,40 /131,第一个子数据库GenBank介绍,http:/www.ncbi.nlm.nih.gov/genbank,41 /131,简介,GenBank is the NIH( 美国国立卫生研究院) genetic sequence database, an annotated collection of all publicly available DNA sequenc

16、es ( Nucleic Acids Research, 2011 Jan;39(Database issue):D32-7 ). There are approximately 126,551,501,141 bases in 135,440,924 sequence records in the traditional GenBank divisions and 191,401,393,188 bases in 62,715,288 sequence records in the WGS division as of April 2011. The complete release notes for the current version of GenBank are available on the NCBI ftp site. A new release is made every two months. GenBank is part of the International Nuc

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号