生物信息学数据库

上传人:飞*** 文档编号:51991738 上传时间:2018-08-17 格式:PPT 页数:92 大小:8.24MB
返回 下载 相关 举报
生物信息学数据库_第1页
第1页 / 共92页
生物信息学数据库_第2页
第2页 / 共92页
生物信息学数据库_第3页
第3页 / 共92页
生物信息学数据库_第4页
第4页 / 共92页
生物信息学数据库_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《生物信息学数据库》由会员分享,可在线阅读,更多相关《生物信息学数据库(92页珍藏版)》请在金锄头文库上搜索。

1、*复旦大学图书馆文献检索教研室生物信息学数据库生物信息学数据库 Bioinformatics databaseBioinformatics database*复旦大学图书馆文献检索教研室一、概述一、概述生物信息学的定义生物信息学是一门交叉科学,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。 (美国人类基因组计划实施五年后的总结报告)*复旦大学图书馆文献检索教研室二.生物信息学数据库种类:n nNucleic Acids Research杂志每年的第一 期中详细介绍最新版本的各种数据库。n

2、在2000年1月1日出版的28卷第一期115种通 用和专用数据库。n至2009年,生物信息学数据库总数已达1170 个。*复旦大学图书馆文献检索教研室n nNucleic Acids Research杂志 http:/nar.oxfordjournals.org/*复旦大学图书馆文献检索教研室http:/www.oxfordjournals.org/n ar/database/c/*复旦大学图书馆文献检索教研室*复旦大学图书馆文献检索教研室*复旦大学图书馆文献检索教研室*复旦大学图书馆文献检索教研室相关数据库及其主要分类相关数据库及其主要分类1 1核酸序列数据库 2. RNA 序列数据库 3.

3、 蛋白质序列数据库 4. 4.结构数据库 5. 基因组数据库(非脊椎动物) 6. 代谢酶相关产物 7. 人类和其他脊椎动物基因组 8. 人类基因和疾病 9. 其他数据和其他基因表达数据库 10. 蛋白组资源 11. 其他分子生物学数据库 12.细胞器官数据库 13.植物数据库 14.免疫学数据库*复旦大学图书馆文献检索教研室核酸序列数据库核酸序列数据库n内容包括世界上所有已公布的核酸序列及其翻译产物序列报告和相关注释 国际核酸序列委员会协作组:nGenBank美国基因数据银行http:/www.ncbi.nlm.nih.gov/ nEmbl 欧洲分子生物实验室 http:/www.ebi.ac

4、.uk/embl.html nDDBJ日本核酸数据库http:/www.ddbj.nig.ac.jp整合平台:Entrez 综合数据库 http:/www.ncbi.nlm.nih.gov序列通过正式递交进入数据库未正式发表文献以前,数据库予以保密*复旦大学图书馆文献检索教研室蛋白质序列数据库蛋白质序列数据库nSWISS-PROT (瑞士日内瓦大学)蛋白质序列数据库 http:/www.Expasy.ch内容包括序列及功能信息、蛋白识别、蛋白质结构预测 及其他功能nNCBI 蛋白质数据库 包括所有蛋白质序列,及其翻译产 物序列 http:/www.ncbi.nlm.nih.gov/entrez

5、nPIR 蛋白质序列信息资源库(美、德)nhttp:/pir.georgetown.edu *复旦大学图书馆文献检索教研室Swiss-Prot蛋白疏水特性图*复旦大学图书馆文献检索教研室蛋白质结构数据库蛋白质结构数据库nPDB Protein DataBank,美国Brookhaven国家实验室管理生 物大分子三维空间结构原子坐标数据库 http:/www.rcsb.org/pdb/ nNCBI STRUCTURE MMDB (Molecular Modelling DataBase ),包含了从PDB获取的实验确定的生物高聚物结构分子 模型数据库 nSCOP (Structural clas

6、sification of proteins) 英国医学研究 会(MRC)剑桥分子生物学实验室开发的蛋白质结构分类 数据库。包含描述蛋白质域的家族、超家族、折叠、等级 等信息。http:/scop.mrc-lmb.cam.ac.uk/scop *复旦大学图书馆文献检索教研室基因组数据库图谱和显示器基因组数据库图谱和显示器n主要内容:有基因组结构、基因单位、基因组图谱等(遗 传图、叠连群图、放射杂交图等)n分布:由各国基因组研究中心组建,分布在世界各地的信 息中心、研究机构。代表性的有:n美国人类基因组数据库GDBnhttp:/www.gdb.orgn美国NCBI基因组数据库Genomes ht

7、tp:/www.ncbi.nlm.nih.gov n英国人类基因图谱数据库 HGMPGenomeWebnhttp:/www.hgmp.mrc.ac.uk/genomeWeb/n美国人类基因组资源整合体系 http:/www.ncbi.nlm.nih.gov/genome/guide/human/*复旦大学图书馆文献检索教研室人类疾病与基因数据库nOMIM 孟德尔遗传信息数据库nhttp:/www.ncbi.nlm.nih.govnCGAP The Cancer Genome Anatomy Project 肿瘤基因组图谱知识库 http:/www.ncbi.nlm.nih.gov/ncicga

8、p 美国国 立癌症研究所为解剖肿瘤细胞分子而建立 。 *复旦大学图书馆文献检索教研室生物信息学相关分析工具生物信息学相关分析工具nBLAST 序列相似性对比nPRIMER 引物设计 n蛋白质结构预测数据库 (EMBL)根据已知蛋白 质序列,预测同族二级、三维等结构n蛋白质功能预测数据库 (EMBL )根据已知蛋白 质序列,预测蛋白质功能*复旦大学图书馆文献检索教研室我国生物信息相关网站我国生物信息相关网站n中国生物信息网 http:/www.biosino.orgn国家南方基因研究中心 http:/ http:/n中国生物技术信息网http:/ 中国科学院(上海文献中心) http:/,htt

9、p:/ hug/hug/*复旦大学图书馆文献检索教研室三三. . 生物信息学数据库检索生物信息学数据库检索n集成检索系统:n Entrez系统(整合库)美国生物技术信息中心研制nhttp:/www.ncbi.nlm.nih.govn SRS系统(Sequence Retrieval System)欧洲分子生物学实验室开发 http:/srs.ebi.ac.uk/n可开放式安装100多个数据库,北京大学安装了78个数据库*复旦大学图书馆文献检索教研室1.EntrezNCBI综合数据库n n是是19911991年由美国生物信息技术中心(年由美国生物信息技术中心( National National

10、 Center Center for for Biotechnology Biotechnology Information,NCBIInformation,NCBI)()( http:/www.ncbi.nlm.nih.govhttp:/www.ncbi.nlm.nih.gov)*复旦大学图书馆文献检索教研室Entrez 用途n检索大分子生物学数据n获取GenBank, EMBL等数据库的核酸序列;n获取Swiss-port,PIR,PRF,PDB等蛋白质序 列;从核酸序列翻译到蛋白质的序列;n获取基因和染色体图谱;蛋白质三维结构 数据及大分子模式(MMDB)等其他生物信 息数据库检索。nP

11、ubMed书目文献数据。例:人类获取人类血小板衍生因子的序列例:人类获取人类血小板衍生因子的序列n n关键词:关键词:Pdgf homo sapiensPdgf homo sapiensn n限定字段:基因定义(标题)限定字段:基因定义(标题)*复旦大学图书馆文献检索教研室*复旦大学图书馆文献检索教研室Entrez生命科学搜索引擎*复旦大学图书馆文献检索教研室Entrez Entrez 跨库检索跨库检索*复旦大学图书馆文献检索教研室检索字段限制分子类型选择基因位置限定序列片段限定数据更新,日期限定功能栏核酸序列检索核酸序列检索*复旦大学图书馆文献检索教研室序列存取号基因定义数据库标识符*复旦大

12、学图书馆文献检索教研室代码物种来源参考文献特性*复旦大学图书馆文献检索教研室原序列复制 后,可到 BLAST中 进行相似性 对本*复旦大学图书馆文献检索教研室2. BLAST 序列相似性检索n nBasic Local Alignment Search ToolBasic Local Alignment Search Tooln n是核酸和蛋白质序列的局部对准相似是核酸和蛋白质序列的局部对准相似 性检索工具性检索工具。*复旦大学图书馆文献检索教研室序列相似性检索序列相似性检索n nBlastBlast是为从相同和不同的有机体中,提供是为从相同和不同的有机体中,提供 对比核酸或蛋白质序列,寻找相

13、似性序列片对比核酸或蛋白质序列,寻找相似性序列片 断的工具。断的工具。n n通过寻找不同基因的相同序列片段,可以推通过寻找不同基因的相同序列片段,可以推 断最新测定的基因功能、预测基因家族的新断最新测定的基因功能、预测基因家族的新 成员、探索基因的进化关系,预测蛋白质代成员、探索基因的进化关系,预测蛋白质代 码和翻译产物的功能和定位。码和翻译产物的功能和定位。*复旦大学图书馆文献检索教研室基本对比 选择对比程序基因组对比特殊对比*复旦大学图书馆文献检索教研室将序列数 据库中的 复制序列 在此粘贴*复旦大学图书馆文献检索教研室序列对比报告对比资源类似性图谱*复旦大学图书馆文献检索教研室对比图谱报

14、告数据库标识符基因定义类似性积分E值为匹配期 望值。说明可 以找到与搜索 序列相匹配的 其它序列的几 率。E值越接 近零,越不可 能找到其它的 匹配序列,其 背后的含义就 是E值越少, 匹配度越好*复旦大学图书馆文献检索教研室点击可得待检序列 与库存序列对排基因表达库链接单基因库基因信息库*复旦大学图书馆文献检索教研室人类染色体上的抗肿瘤基 因序列对排表*复旦大学图书馆文献检索教研室对排序列 不一致处序列对排报告*复旦大学图书馆文献检索教研室3.NCBI structure3.NCBI structure提供为研究蛋白质三维提供为研究蛋白质三维(3D) (3D) 结构集成的二结构集成的二 个数

15、据库个数据库: : n n分子模型数据库分子模型数据库(MMDB),(MMDB),提供关于各种蛋提供关于各种蛋 白质的结构信息白质的结构信息; ; n n蛋白质域数据库蛋白质域数据库(CDD),(CDD),提供在提供在 proteins(CDs)proteins(CDs)内保存的功能领域序列和结构对内保存的功能领域序列和结构对 准表达目录。准表达目录。这两个数据库让科学家检索和观看结构这两个数据库让科学家检索和观看结构, ,从从 结构上查找特定蛋白质的相似蛋白质,并且辨结构上查找特定蛋白质的相似蛋白质,并且辨 认功能位点。认功能位点。*复旦大学图书馆文献检索教研室StructureStruct

16、ure检索步骤检索步骤第一步:在Entrez sturcture检索栏中直接输入的检索词包括:PDB 代码, 蛋白质名字, 作者, 或期刊名。第二步:通过Entrez 列阵搜寻,得出检索初步结果 也许出现多个指定的蛋白质存在的记录, 它们反映了 不同的实验性技术情况, 并且出现或缺乏各种各样的配合 基或金属离子。 记录也许并且包含全长分子的不同片段。另外,还有许多突变体蛋白质结构,用户要注意筛选。 检索结果同时包含了 PDB记录,包括实验性描述, PDB 代码。*复旦大学图书馆文献检索教研室第三步:显示结构概略页第三步:显示结构概略页 n n观察次要结构观察次要结构 Secondary StructureSecon

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号