生物信息学蛋白质序列数据库包其郁

上传人:ap****ve 文档编号:120485881 上传时间:2020-02-06 格式:PPT 页数:72 大小:2.60MB
返回 下载 相关 举报
生物信息学蛋白质序列数据库包其郁_第1页
第1页 / 共72页
生物信息学蛋白质序列数据库包其郁_第2页
第2页 / 共72页
生物信息学蛋白质序列数据库包其郁_第3页
第3页 / 共72页
生物信息学蛋白质序列数据库包其郁_第4页
第4页 / 共72页
生物信息学蛋白质序列数据库包其郁_第5页
第5页 / 共72页
点击查看更多>>
资源描述

《生物信息学蛋白质序列数据库包其郁》由会员分享,可在线阅读,更多相关《生物信息学蛋白质序列数据库包其郁(72页珍藏版)》请在金锄头文库上搜索。

1、六 蛋白质序列数据库六 蛋白质序列数据库 UniProUniPro nSwiss Prot n n TrEMBLTrEMBL n n PIR PSDPIR PSD The mission of UniProt is to provide the scientific community with a comprehensive high quality and freely accessible resource of protein sequence and functional information 1 1 Swiss Prot n n SWISS PROTSWISS PROT由瑞士日内

2、瓦大学医学生化系于由瑞士日内瓦大学医学生化系于19781978年创建 后来与欧年创建 后来与欧 洲分子生物学实验室合作 由瑞士生物信息学研究所 洲分子生物学实验室合作 由瑞士生物信息学研究所 Swiss Institute Swiss Institute of Bioinformaticsof Bioinformatics SIBSIB 和欧洲生物信息学研究所 和欧洲生物信息学研究所 EBIEBI 共同维护和 共同维护和 管理现已整合进管理现已整合进UniProtKB Swiss Prot a a 所有序列条目都经过有经验的分子生物学家和蛋白所有序列条目都经过有经验的分子生物学家和蛋白 质化学

3、家通过计算机工具并查阅有关文献资料仔细核质化学家通过计算机工具并查阅有关文献资料仔细核 实 实 SWISS PROTSWISS PROT的特点的特点 b b 每个条目包含条目基本信息 分类信息 每个条目包含条目基本信息 分类信息 描述蛋白质的生物来源 描述蛋白质的生物来源 引用文献信息 引用文献信息 注释 蛋白质序列等注释 蛋白质序列等 如 如 ampG ampG c c 蛋白质注释蛋白质注释 包括蛋白质的功能 翻译后修饰 如糖基化和磷酸化包括蛋白质的功能 翻译后修饰 如糖基化和磷酸化 结构域和结合位点 二级结构 如 结构域和结合位点 二级结构 如 螺旋和螺旋和 片层 片层 四级结构 如同聚体

4、和异聚体 与其它蛋白质序列的 四级结构 如同聚体和异聚体 与其它蛋白质序列的 相似性 蛋白质序列残缺与疾病的关系 序列冲突和变异相似性 蛋白质序列残缺与疾病的关系 序列冲突和变异 体等信息 体等信息 d SWISS PROT d SWISS PROT中尽可能中尽可能减少冗余序列减少冗余序列 e e 与其它与其它3030多个数据库建立了交叉引用多个数据库建立了交叉引用 其 其 中包括核酸序列数据库 蛋白质序列数据中包括核酸序列数据库 蛋白质序列数据 库和蛋白质结构数据库等 库和蛋白质结构数据库等 f f 利用利用序列检索系统 序列检索系统 SRSSRS 可以方便地检索可以方便地检索 SWISS

5、PROTSWISS PROT和其它和其它EBIEBI的数据库 的数据库 2 TrEMBL2 TrEMBL TrEMBLTrEMBL数据库建于数据库建于19951995年 意为年 意为 Translation Translation from EMBLfrom EMBL 该数据库采用该数据库采用SwissProSwissPro数据库格式 其数据来数据库格式 其数据来 源于源于 n n EMBLEMBL核酸序列数据库 或核酸序列数据库 或GenBankGenBank DDBJDDBJ 中所有编码 中所有编码 序列经计算机程序自动翻译的蛋白质序列经计算机程序自动翻译的蛋白质 n n 从文献中查到的从

6、文献中查到的 n n 或向或向SWISS PROTSWISS PROT递交的并未整合到递交的并未整合到SWISS PROTSWISS PROT的蛋白质的蛋白质 序列序列 3 PIR PSD3 PIR PSD n n 蛋白质信息资源 国际蛋白质序列数据库 蛋白质信息资源 国际蛋白质序列数据库 the Protein Information Resource International the Protein Information Resource International Protein Sequence DatabaseProtein Sequence Database PIR PSDPI

7、R PSD n n 由蛋白质信息资源 由蛋白质信息资源 PIRPIR 慕尼黑蛋白质序 慕尼黑蛋白质序 列信息中心 列信息中心 MIPSMIPS 和日本国际蛋白质序列 和日本国际蛋白质序列 数据库 数据库 JIPIDJIPID 共同维护 共同维护 PIRPIR是最早的数是最早的数 据库 现已并入据库 现已并入UniProt Knowledgebase UniProt Knowledgebase n n 是一个全面的 非冗余的 经过专家注释的公共是一个全面的 非冗余的 经过专家注释的公共 蛋白质序列数据库 蛋白质序列数据库 PIR PSDPIR PSD收集已发表的蛋白收集已发表的蛋白 质序列 来源

8、 参考文献和特征信息等 质序列 来源 参考文献和特征信息等 她的注她的注 释中还包括一些原始递交记录中没有的相关信息释中还包括一些原始递交记录中没有的相关信息 如 如在遗传图谱的位置 内含子位置 以及和其在遗传图谱的位置 内含子位置 以及和其 他序列 结构 基因组和引文数据库 如他序列 结构 基因组和引文数据库 如MedlineMedline PDBPDB和和TIGRTIGR等 的相互参照等 的相互参照 n n PIR PSDPIR PSD的另一个重要特征是其的另一个重要特征是其对蛋白质超家族对蛋白质超家族 的分类 提供序列的等级聚类信息 揭示序列间的分类 提供序列的等级聚类信息 揭示序列间

9、的进化关系 的进化关系 4 UniPro4 UniPro n n 蛋白质信息资源 蛋白质信息资源 PIRPIR 欧洲生物信息学 欧洲生物信息学 研究所 研究所 EBIEBI 和瑞士生物信息学研究所 和瑞士生物信息学研究所 SIBSIB 合作 于 合作 于20022002年共同组建世界蛋白质年共同组建世界蛋白质 资源 资源 the Universal Protein Resourcethe Universal Protein Resource UniProUniPro n n UniProUniPro把把Swiss ProtSwiss Prot TrEMBLTrEMBL和和PIRPIR等蛋白等蛋

10、白 质数据库整合在一起 是目前国际上最全质数据库整合在一起 是目前国际上最全 面的蛋白质信息库 面的蛋白质信息库 The UniProt Knowledgebase UniProtKB nThe UniProt Knowledgebase continues the work of Swiss Prot TrEMBL and PIR PSD by providing an expertly and richly curated protein database nConsisting of two sections UniProtKB Swiss Prot UniProtKB TrEMBL U

11、niProt Reference Clusters UniRef nTheUniProt Reference Clusters UniRef provide clustered sets of sequences from UniProtKB and selected UniParc records nIt provide complete coverage of sequence space at several resolutions and speed similarity searches via sequence space compression by merging sequen

12、ces that are 100 UniRef100 90 UniRef90 or 50 UniRef50 identical nUniRef90 and UniRef50 yield a database size reduction of approximately 40 and 65 respectively providing significantly faster sequence searches UniProt Archive UniParc nCapture all publicly available protein sequence data and contains a

13、ll the protein sequences from the main publicly available protein sequence databases UniParc is the most comprehensive publicly accessible non redundant protein sequence database nYou can instantly find out whether a sequence of interest is already in the public domain and if not identify its closes

14、t relatives nYou can always trace the source database because UniParc cross references their accession numbers You can observe sequence changes in all the source databases nUniParc records are not annotated 5 Uni Pro 5 Uni Pro 数据检索数据检索 七 疾病相关基因数据库七 疾病相关基因数据库 1 1 OMIMOMIM n n OMIMOMIM Online Mendelia

15、n Inheritance in ManOnline Mendelian Inheritance in Man 是美 是美 国国Jonhs HopkinsJonhs Hopkins大学大学Dr Victor A McKusickDr Victor A McKusick等人建等人建 立和编辑的有关立和编辑的有关人类基因和遗传病目录的电子版人类基因和遗传病目录的电子版 n n 于本世纪于本世纪6060年代创立 旨在为临床医师和遗传病年代创立 旨在为临床医师和遗传病 研究工作者提供服务 研究工作者提供服务 n n OMIMOMIM包含大量的及时更新的有关人类基因及其包含大量的及时更新的有关人类基因及

16、其 突变序列数据和遗传病的临床特征等信息和相关突变序列数据和遗传病的临床特征等信息和相关 参考文献 参考文献 OMIMOMIM数据库基本信息数据库基本信息 n n MIM MIM 概述 克隆 概述 克隆 基因结构 物理图 基因结构 物理图 基因功能 基因功能 生化特征 生化特征 分子遗传学 分子遗传学 动物模型 动物模型 等位突变 等位突变 参考文献 参考文献 编辑史等 编辑史等 n n Eztrez gene Eztrez gene 分类 分类 参考序列 蛋白质等参考序列 蛋白质等 n n Link outLink out P53P53基因的基因的OMIMOMIM检索结果 检索结果 2 2 GeneCardsGeneCards n n GeneCardsGeneCards数据库是由以色列数据库是由以色列WeizmannWeizmann科学研究所 科学研究所 Weizmann Institute of ScienceWeizmann Institute of Science 和 和CrownCrown人类基因组中心 人类基因组中心 Crown Human Genome CenterCr

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号