《生物信息学原理与方法第九讲蛋白质序列分析与预测》由会员分享,可在线阅读,更多相关《生物信息学原理与方法第九讲蛋白质序列分析与预测(28页珍藏版)》请在金锄头文库上搜索。
1、第二讲第二讲 蛋白质序列分析与预测蛋白质序列分析与预测生物信息学生物信息学 原理与方法原理与方法目录一、基本方法二、在线工具在线工具-ExPASyExPASy 系统简介系统简介一、基本方法二、二、ExPASy 系统简介系统简介1.Protein identification and characterization 蛋蛋白白质识别与特证描述质识别与特证描述2.DNA - Protein 将将DNA序列序列翻译成翻译成蛋白蛋白质质序列序列3.Similarity searches 序列类似性检索(已讲)序列类似性检索(已讲)4.Pattern and profile searches 模式模式的
2、的搜索搜索5.Post-translational modification prediction 翻翻译译后修饰预测后修饰预测6.Topology prediction 空间结构预测空间结构预测7.Primary structure analysis 一级结构分析一级结构分析8. Secondary structure prediction 二级结构预测二级结构预测9.Tertiary structure 三三级结构预测级结构预测10. Sequence alignment 序列比序列比对(已讲)对(已讲)11. Biological text analysis 生物生物学文本学文本分析(分
3、析(不讲不讲)1.Protein identification and characterization 蛋白质识别与特证描述蛋白质识别与特证描述1-1 AACompIdent - 以氨基酸组织识别蛋白质1-2 AACompSim -比较Swiss-Port条目与其他条目的差异1-3 MultiIdent -以等电点、分子量、氨基酸组成、序列特征及肽指纹数据识别蛋白质。1-4 PeptIdent 以肽指纹数据识别蛋白质、等电点、实验测定的分子量、以Swiss-Prot中所有蛋白质的理论肽来比较使用者指定的肽质谱,提供数据库的注释。1-5 TagIdent以等电点、分子量和序列特征识别蛋白质,并
4、检出与所给等电点和分子量最接近的蛋白质序列列表。 1-6 FindMod 预测可能的蛋白质翻译后修饰及肽中单个氨基酸可能被取代。将实验测定的肽质谱与指定的Swiss-Prot序列中的理论肽或用户输入的序列作比较,质谱的差异以作出更佳的蛋白质特征描述。1-7 GlycoMod -以实验测定的质谱预测蛋白质可能出现的寡多醣结构。1-8 GlycanMass - 以寡多醣结构预测其质谱。1-9FindPept -由实验质谱识别蛋白质中的肽,并考虑到人工化学修饰、翻译后修饰以及蛋白酶自体溶解等因素。1-10PeptideMass-以Swiss-Prot 、TrEMBL 条目或用户提供的序列來预测其肽质
5、谱及翻译后修饰。1-11PeptideCutter 由所提供的蛋白质序列来预测可能的蛋白酶剪切位点或化学剪切位点。1-12IsotopIdent 预测肽、蛋白质、多核苷酸或化学组成的理论同位分布1-13PepMAPPER-由英中的UMIST提供的肽质谱分析工具。1-14Mascot 由Matrix Science Ltd.,提供的序列搜索、MS/MS离子及肽质谱识别。1-15PepSea -由Protana, Denmark提供的从肽质谱和肽序列识别蛋白质。1-16PeptideSearch -由EMBL Heidelberg提供的肽质谱识别工具。1-17ProteinProspector -
6、由UCSF提供的多种质谱分析工具。1-18PROWL -由Rockefeller和NY Universities提供蛋白质化学性质及质谱仪资源。1-19PFMUTS -由MALDI提供,显示肽片段中可能出现的单氨基酸或两氨基酸突变。1-20CombSearch -一种试验性的的蛋白质识别工具集成系统。2.DNA - Protein 将将DNA序列序列翻译成翻译成蛋白蛋白质质序列序列 2-1Translate - 将DNA序列翻译成蛋白质序列。 2-2Transeq 使用EMBOSS 软件包将DNA序列翻译成蛋白质序列。 2-3Graphical Codon Usage Analyser 以图形
7、方式显示密码子偏向性 2-4BCM search launcher 以六种框架翻译DNA序列 2-5Backtranslation 将蛋白质序列翻译成DNA序列 2-6Genewise 比较蛋白质序列与基因组的DNA序列,允许内含子和读框错误 2-7FSED 读框错误检测 2-8LabOnWeb -使用Compugen LEADS clusters延伸EST、表达模式及ESTs序列分析。 2-9List of gene identification software sites 列出基因识别的软件。3.Similarity searches 相似相似搜索搜索3-1 BLAST3-2 Bic u
8、ltra -Smith/Waterman序列搜索3-3MPsrch - EBI的Smith/Waterman序列比对。3-4DeCypher Smith/Waterman序列搜索3-5Fasta3 EBI的FASTA version 3 3-6FDF - Smith/Waterman序列搜索3-7PropSearch 使用氨基酸组成来进行结构同源搜索。4.Pattern and profile searches 模式模式的的搜索搜索4-1InterPro Scan - 在PROSITE, Pfam, PRINTS及其他家族和功能域数据库中集成检索。4-2ScanProsite - 对PROSI
9、TE或Swiss-Prot 和TrEMBL的模式序列进行搜索。4-3MotifScan - 对蛋白质模式数据库中的序列(包括PROSITE)进行搜索。4-4Frame-ProfileScan -对蛋白质模式数据库中的序列(包括PROSITE)进行短的DNA序列搜索。4-5 Pfam HMM search-在Washington University及Sanger Centre对Pfam数据库进行搜索。4-6 FingerPRINTScan - 对PRINTS 数据库进行蛋白质指纹搜索。4-7 FPAT - 蛋白质数据库中的表达搜索。4-8 PRATT - EBI 及ExPASy的识别蛋白质保守
10、模式4-9 PPSEARCH - EBI的对PROSITE进行序列搜索。4-10 PROSITE scan PBIL的对PROSITE进行序列搜索。4-11 PATTINPROT - 在PBIL搜索一段蛋白质序列或蛋白质数据库中的模式。4-12 SMART EMBL的简单分子结构研究工具。4-13 TEIRESIAS - IBM的从不匹配的(unaligned)蛋白质或DNA序列生成蛋白质模式。4-14 Hits 蛋白质序列与motifs的关系。5.Post-translational modification prediction 翻译后修饰预测翻译后修饰预测5-1ChloroP - 叶绿体
11、转换肽的预测。5-2LipoP - Gram阴性细菌脂蛋白质和信号肽的预测5-3MITOPROT 预测线粒体的目标序列。5-4PATS 预测apicoplast的目标序列5-5PlasMit- 预测Plasmodium falciparum的线粒体转换肽5-6Predotar 预测线粒体和质体的目标序列5-7PTS1 预测peroxisomal targeting signal 1 containing proteins5-8SignalP 预测信号肽剪工切位点。 5-9 NetOGlyc 预测哺乳动物粘蛋白的糖化位点。5-10NetNGlyc 预测人类N型蛋白质糖化位点。5-11DictyO
12、Glyc 预测粘菌O型蛋白质糖化位点。5-12YinOYang - 真核生物蛋白质序列的O-beta-GlcNAc的粘附位点。5-13big-PI Predictor -预测GPI的修饰位点5-14DGPI - 预测GPI的锚合点和剪刀切位点(鏡像站)。5-15NetPhos - 预测真核生物蛋白质上Ser, Thr 及 Tyr phosphorylation位点。5-16NetPicoRNA - 预测picornaviral proteins上蛋白质剪切位点。5-17NMT 预测N-terminal N-myristoylation5-18Sulfinator 预测酪胺酸硫化位置。5-19S
13、UMOplot 预测SUMO蛋白质附着位置。 6.Topology prediction 空间结构预测空间结构预测6-1PSORT 预测蛋白质次细胞的位置。6-2TargetP -预测蛋白质次细胞的位置。 6-3DAS -利用Dense Alignment Surface法预测原核生物的跨膜区。6-4HMMTOP -预测蛋白质的跨膜螺旋及空间结构。6-5PredictProtein -预测蛋白质的跨膜螺旋及空间结构。 6-6SOSUI -预测跨膜区。 6-7TMAP 基于多序列比对的跨膜区预测。6-8TMHMM -预测蛋白质的跨膜螺旋。6-9TMpred -预测蛋白质的跨膜区及蛋白质方向。6-
14、10TopPred 2 -膜蛋白的空间结构预测。7.Primary structure analysis 一级结构分析一级结构分析7-1ProtParam -蛋白质序列的物化性质分析(氨基酸、原子组成、等电点.等)7-2Compute pI/Mw -以Swiss-Prot或TrEMBL条目或用户的序列计算理论的等电点和分子量。7-3MW, pI, Titration curve 计算等电点及组成并可见其滴定曲线图。7-4REP 搜索蛋白质重复片段。7-5REPRO 检测蛋白质序列的重复片段。7-6 Radar -检测蛋白质序列的重复片段。7-7SAPS 蛋白质序列的统计学分析。7-8Coils
15、 蛋白质的卷曲预测。7-9Paircoil 蛋白质两级卷曲螺旋预测。7-10Multicoil 蛋白质两级或三级卷曲螺旋预测。7-112ZIP -亮氨酸拉链的预测。7-12PESTfind PEST区域的预测。7-13HLA_Bind 预测MHC type I (HLA) peptide binding。7-14SYFPEITHI -预测MHC type I and II peptide binding。7-15ProtScale 氨基酸比例图(疏水性及其相关参数等)7-16Drawhca 蛋白质序列疏水性聚类分析HCA (Hydrophobic Cluster Analysis)点阵图7-1
16、7Protein Colourer 给氨基酸序列着色工具7-18Three To One 将三码的氨基酸序列转换成一码氨基酸序列工具。7-19Colorseq 将所选择的蛋白质序列以红色突出。7-20HelixWheel / HelixDraw 用蛋白质片段表示环状螺旋结构7-21 RandSeq 随机蛋白质序列生成器8. Secondary structure prediction 二级结构预测二级结构预测8-1AGADIR 预测肽链螺旋结构算法。8-2APSSP 高级蛋白质二级结构预测服务器。8-3GOR Garnier1996年开发的蛋白质二级结构预测。8-4HNN 神经网络方法预测蛋白
17、质二级结构。8-5Jpred 趋同法预测蛋白质二级结构。8-6JUFO 神经网络法从序列预测蛋白质二级结构。8-7nnPredict -蛋白质二级结构预测。8-8PredictProtein -蛋白质二级结构预测。8-9Prof 利用Cascaded Multiple Classifiers进行蛋白质二级结构预测。8-10PSA -蛋白质二级结构预测。8-11SOPMA -蛋白质二级结构预测。8-12SSpro 利用双向重复神经网络预测蛋白质二级结构。 9.Tertiary structure 三三级结构预测级结构预测9-1三级结构分析(Tertiary structure analysis)
18、 9-1-1iMolTalk 一个交互式的蛋白质结构分析服务器 9-1-2MolTalk 一个结构生物信息学计算环境9-2 比较建模(Comparative modeling) 9-2-1SWISS-MODEL 一个自动基于知识的蛋白质建模服务器。 9-2-23Djigsaw 基于已知结构同源蛋白的三级结构建模。 9-2-3CPHmodels 基于同源蛋白自动神经网络建模服务器。 9-2-4ESyPred3D 采用神经网络的自动同源建模程序。 9-2-5Geno3d 蛋白质三维结构自动建模。 9-2-6SDSC1 蛋白质同源结构建模服务器。9-3穿过建模(Threading)9-3-13D-P
19、SSM 采用经过二级结构信息(Foldfit)处理的一维和三维序列模式进行蛋白质折叠识别。9-3-2Fugue 序列结构同源识别。9-3-3Libellula 采用神经网络方法评价折叠识别结果。9-3-4LOOPP 采用序列到序列、序列到结构和结构到结构的算法。9-3-5SAM-T02 基于HMM的蛋白质结构预测。9-3-6Threader 蛋白质折叠识别。9-3-7ProSup 蛋白质结构附件。9-3-8SWEET 从saccharides序列构建其三维模型。9-4 从头建模(Ab initio) 9-4-1HMMSTR/Rosetta 从序列预测蛋白质三维结构。9-5三 维 结 构 预 测
20、 评 价 ( Assessing tertiary structure prediction)9-5-1Anolea 原子非局部环境评价。9-5-2Biotech Validation Suite for Protein Structures 9-5-3EVA 原子蛋白质结构预测评价9-5-4LiveBench 结构预测服务器的连续Benchmarking。9-5-5PROCHECK 蛋白质结构的stereochemical质量证实。9-5-6What If 用于突变预测、结构验证、分子图示的蛋白质结构分析程序。9-6分子建模显示工具 9-6-1Swiss-PdbViewer 显示、分析、添加蛋白质三维结构的程序 9-6-2Astex Viewer 9-6-3MolMol 9-6-4Rasmol 9-6-5VMD 10. Sequence alignment 序列比序列比对对