第三讲:Uniprot蛋白数据库及其他蛋白质分析工具

上传人:20****03 文档编号:152318887 上传时间:2020-11-22 格式:PDF 页数:20 大小:514.41KB
返回 下载 相关 举报
第三讲:Uniprot蛋白数据库及其他蛋白质分析工具_第1页
第1页 / 共20页
第三讲:Uniprot蛋白数据库及其他蛋白质分析工具_第2页
第2页 / 共20页
第三讲:Uniprot蛋白数据库及其他蛋白质分析工具_第3页
第3页 / 共20页
第三讲:Uniprot蛋白数据库及其他蛋白质分析工具_第4页
第4页 / 共20页
第三讲:Uniprot蛋白数据库及其他蛋白质分析工具_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《第三讲:Uniprot蛋白数据库及其他蛋白质分析工具》由会员分享,可在线阅读,更多相关《第三讲:Uniprot蛋白数据库及其他蛋白质分析工具(20页珍藏版)》请在金锄头文库上搜索。

1、第三讲 Uniprot蛋白数据库及其他蛋白质 分析工具 2013/03/19 Uniprot数据库 Uniprot(Universalproteinresource)是蛋白 质序列的联合数据库。 SIB:SwissInstituteofBioinformatics EBI:EuropeanBioinformaticsInstitute PIR:ProteinInformationResource 2002年三家联合形成了Uniprot SwissProt 1986年建立 低冗余度 功能导向 由SwissInstituteofBioinformatics和EBI共同 建立并维护 TrEMBL T

2、rEMBL=TranslationfromEMBL EBI建立并维护 是一个自动数据库 冗余度高,可信度低 UniprotKB 部分经过专家注释的数据库 具有很高的可信度 包括两部分UniprotKB/SwissProt和 UniprotKB/TrEMBL UniprotKB/SwissProt包括539,165条序列 UniprotKB/TrEMBL包括29,769,971条序列 具有非冗余性 Uniparc 非冗余性 给予序列的特异性,非同一物种的相同序 列被认为是同一个蛋白质 每一条序列被給予一个特异的编号 Uniparc INSDCEMBLBank/DDBJ/GenBank nucle

3、otidesequencedatabases Ensembl EuropeanPatentOffice(EPO) FlyBase HInvitationalDatabase(HInv) InternationalProteinIndex(IPI) JapanPatentOffice(JPO) ProteinInformationResource(PIRPSD) ProteinDataBank(PDB) ProteinResearchFoundation(PRF)RefSeq Saccharomyces GenomeDatabase(SGD) TheArabidopsisInformationR

4、esource(TAIR) TROME USPatentOffice(USPTO) UniProtKB/SwissProt,UniProtKB/SwissProtproteinisoforms,UniProtKB/TrEMBL VertebrateandGenomeAnnotationDatabase(VEGA) WormBase UniRef 包括UniRef100, UniRef90和UniRef50 分别包括了相似度为100%,90%和50%的序 列的总和 UniMES UniMES是metagenomics和环境生物学的序 列数据库 其中的数据可能是未知的 UniMES提供UniRef

5、类似的聚类功能 Uniprot的应用 在质谱领域有广泛的应用 因为其序列的非冗余性 举例:质谱分析 举例:Pyruvate:ferredoxin oxidoreductase subunitalphafromPyrococcus furiosus 蛋白质的结构域二级库 根据序列比对的策略不同存在较多的蛋白质序 列二级库,比如ProSite,PRINT,ProDom,Pfam, Gene3D,PANTHER,PIRSF,Tigrfams等等 目前诸多蛋白质序列二级库已经被整合到 Interpro数据库中 利用Interpro可以查找并鉴定蛋白质的结构 域,可能的功能基团以及预测其生理功能等 举例

6、:查询actinlikeprotein,找到其三维结构 和功能 举例:查询4Fe4Sclusterbindingsite 蛋白质序列分析interproscan 蛋白质的保守结构域 举例:利用interpro分析genesymbol为 MA0658的蛋白质,并预测它可能结合什么 cofactor pI和分子量的预测 http:/web.expasy.org/compute_pi/ 举例:预测大肠杆菌中WrbA的pI和分子量 对信号肽的预测 SignalP 4.0 http:/www.cbs.dtu.dk/services/SignalP/ 利用神经网络和HMM模型预测信号肽 VKLIMFLLM

7、VPLFSYLAAASLRVLSPNPASCDSPEL GYQCNSETTHTWGQYSPFFSVPSEISPSVPEGCR 对膜蛋白和跨膜区域的预测 一般来说是一个20AA长的alphahelix TMpred http:/www.ch.embnet.org/software/TMPRED_f orm.html TMHMM http:/www.cbs.dtu.dk/services/TMHMM/ msyntslgls enivaalcyp vgwlsglffl llerknkfvr fhamqsvllf mpialfiflv awiptigwfi adgagmtaml lilipmymaf rgskfkipii gniaynfayg e ExPASy SIB运作的一个蛋白质专业网站 蛋白质结构和功能的分析与预测 已知序列已知序列 已知名称已知名称寻找序列寻找序列 Blast寻找相似 蛋白功能 Blast寻找相似 蛋白功能 利用Uniprot 分析结构域 利用Uniprot 分析结构域 利用Interpro 分析结构域 利用Interpro 分析结构域 分析蛋白质 的MW和pI 分析蛋白质 的MW和pI 分析蛋白质 的位置 分析蛋白质 的位置 阅读相似蛋 白的文献 阅读相似蛋 白的文献 提出蛋白质 功能的假说 提出蛋白质 功能的假说

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号