生物-第六章利用蛋白质进行预测的方法

上传人:woxinch****an2018 文档编号:45448848 上传时间:2018-06-16 格式:PPT 页数:59 大小:943KB
返回 下载 相关 举报
生物-第六章利用蛋白质进行预测的方法_第1页
第1页 / 共59页
生物-第六章利用蛋白质进行预测的方法_第2页
第2页 / 共59页
生物-第六章利用蛋白质进行预测的方法_第3页
第3页 / 共59页
生物-第六章利用蛋白质进行预测的方法_第4页
第4页 / 共59页
生物-第六章利用蛋白质进行预测的方法_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《生物-第六章利用蛋白质进行预测的方法》由会员分享,可在线阅读,更多相关《生物-第六章利用蛋白质进行预测的方法(59页珍藏版)》请在金锄头文库上搜索。

1、第 六 章 利用蛋白质进行预测的方法*第一节 概述20世纪60年代后期,Anfinsen首先发现去折 叠蛋白或者说变性(denatured)蛋白质在允许重新 折叠的实验条件下可以重新折叠到原来的结构, 这种天然结构(native structure)对于蛋白质行使 生物功能具有重要作用,大多数蛋白质只有在折 叠成其天然结构的时候才能具有完全的生物活性 。自从Anfinsen提出蛋白质折叠的信息隐含在蛋 白质的一级结构中,科学家们对蛋白质结构的预 测进行了大量的研究,运用适当的算法,从氨基 酸序列出发,预测蛋白质的结构。Date1.意义n一种生物体的基因组规定了所有构成该生物体 的蛋白质,基因规

2、定了组成蛋白质的氨基酸序 列。虽然蛋白质由氨基酸的线性序列组成,但 是,它们只有折叠成特定的空间构象才能具有 相应的活性和相应的生物学功能。了解蛋白质 的空间结构不仅有利于认识蛋白质的功能,也 有利于认识蛋白质是如何执行其功能的。确定 蛋白质的结构是非常重要。 Date意义n分析蛋白质结构、功能及其关系是蛋白质组计 划中的一个重要组成部分。n研究蛋白质结构,有助于了解蛋白质的作用, 了解蛋白质如何行使其生物功能,认识蛋白质 与蛋白质(或其它分子)之间的相互作用,对 于生物学还是对于医药学都是非常重要。n新发现的蛋白质分子,通过结构分析,可以进 行功能注释,指导进行功能确认的实验。n通过蛋白质的

3、结构分析,确认功能单位,为设 计新的蛋白质或改造已有蛋白质提供可靠的依 据,同时为新的药物分子设计提供合理的靶分 子结构。Date2. 蛋白质折叠结构n蛋白质序列由相应的核酸序列所决定,通过对基因的 转录和翻译,将原来四字符的DNA序列,根据三联密 码规则翻译成20字符的蛋白质氨基酸序列。n蛋白质具有不同的长度、不同的氨基酸排列和不同的 空间结构。蛋白质中相邻的氨基酸通过肽键形成一条 伸展的链,肽链上的氨基酸残基形成局部的二级结构 ,各种二级结构组合形成完整的折叠结构。n在蛋白质的空间结构中,序列上相距比较远的氨基酸 可能彼此接近。n在水溶液中,由于氨基酸残基的疏水性,肽链折叠成为 特定的三维

4、结构。氨基酸疏水片段位于于分子的内。Date例: 酪氨酸磷酸酶的蛋白质序列 Date例: 酪氨酸磷酸酶的蛋白质序列的二级结构 H H 代表螺旋,代表螺旋,E E 代表折叠,代表折叠,B B表示表示桥,桥,G G表示表示310310螺旋,螺旋,I I表示表示螺旋,螺旋,T T表示氢表示氢 键转角,键转角,S S代表转向代表转向 Date例:酪氨酸磷酸酶的蛋白质序列的三级折叠结构Date3. 蛋白质结构预测问题n寻找一种从蛋白质的氨基酸线性序列到蛋白质所 有原子三维坐标的映射。 n自然界实际存在的蛋白质是有限的,并且存在着 大量的同源序列,可能的结构类型也不多,序列 到结构的关系有一定的规律可循。

5、因此,蛋白质 结构预测是可能的。Date蛋白质结构预测的核心问题n序列结构功能.-Gly-Ala-Glu-Phe-.功能Date4. 蛋白质结构预测的两大类方法:n(1)理论分析方法q通过理论计算(如分子力学、分子动力学计算) 进行结构预测。n(2)统计的方法 q对已知结构的蛋白质进行统计分析,建立序列到以 级结构结构的映射模型,根据映射模型直接从氨基酸 序列预测结构。 q包括:n经验性方法n结构规律提取方法n同源模型化方法Date5. 蛋白质功能结构的分析流程Date6. 蛋白质预测免费工具nNCBI: BLAST提供的工具(已介绍)nExPASy: Expert Protein Analy

6、sis Systemhttp:/www.expasy.org/瑞士生物信息院提供的蛋白质在线分析工具,包括:蛋白数据库(SWISS-PROT)蛋白分析工具:蛋白质辨识、蛋白序列、结构分析、 同源性分析、DNA-蛋白质转换、一级结构分析、二 级结构分析、三级结构分析、跨膜序列预测、信号肤 等。http:/cn.expasy.org/tools/此外还提供了多数知名分析工具。Date第二节 蛋白质辨识1、AAComIdent n功能:利用氨基酸组成识别未知蛋白质。n前提:如只有蛋白的氨基酸组成、pI值和分子 量,就可用AACompIdent寻找相似蛋白。n过程:将查询蛋白与库中已知蛋白进行比较,

7、给出相似蛋白及其打分。n该程序需输入蛋白质的氨基酸组成、等电点pI 和蛋白质分子量、正确的物种分类等关键词。n有6种氨基酸框架可选择,不同的框架对分析 方式有一定的影响。DateAACompIdentn对数据库中的每一个序列根据序列组成差异打 分,询结果由电子邮件返回,共有3级列表:所列蛋白只考虑物种分类不考虑pI和分子量。不考虑物种分类、pI和分子量的全体蛋白。即考虑物种分类,也考虑pI和分子量。蛋白质RRF-ECOLI(P16174)EMAIL结果实例 注意:零分表明查询序列与提出的序列完全相符, 打分越低相似性越高。Date2. AACompSimn与AACompIdent以实验室所得的

8、氨基酸组成 为依据进行搜索不同,AACompSim使用 SWISS-PROT蛋白质的序列为依据,将用户要 查询的蛋白与SWISS-PROT数据库中的蛋白 质的序列进行比较、辨识,检测蛋白质之间的 微弱关系。n与AACompIdent算法类似,该算法也提供了4 种氨基酸的组合方式(Constellation)供用户选 择,查询时用户需要在4种氨基酸组合中挑选其 一,输入所要查询蛋白的SWISS-PROT ID、物 种。n查询结果输出与AACompIdent类似,见P121Date3. PROPSEARCHn如果序列的相似性小于特异性阈值25%,通常的蛋白质 辨识工具就难以辨识其功能和结构的相似性

9、。如查询 蛋白是一个新蛋白,也不能用序列对比的方法查询。nPROPSEARCH方法可解决上述问题。 PROPSEARCH忽略了蛋白质的氨基酸残基顺序,利 用蛋白的氨基酸组成来检测蛋白质之间的联系。它使 用了144种不同的物化属性,如:分子量、巨大残基 含量、小残基含量、平均疏水性、平均电荷、所选择 的二肽集团的含量等进行分析。n这些物理属性集合被称为“查询向量“,PROPSEARCH 将“查询向量“与目标数据库(SWISS-PROT)中“向量 数据库“逐个进行比较,然后给出计算结果。n利用PROPSEARCH查询十分简单,可在线分析。访问PROPSEARCH的Web页面和Expasy的连 接进

10、行计算,用EMAIL返回结果。DatePROPSEARCH查询结果nE-mail输出结果包括3个部分:n解释性材料n距离分值(DIST)与整个目标数据库的直方图。DIST列是 距离分 值,表示查询序列与PROPSEARCH找到的属于同 一家族的序列之间的相似性程度,该分值通常表明具有相 似的功能,分值越低,相似度越大,零分表示完全相似。n分值在0.01.3,相似度为99.9%,分值在10.011.2相似度为 80%。“Number of hit”列给出的是数据库中具有该分值 的蛋白数目。n查询结果综合表 “DIST“结果按距离分值顺序排列;“ID“ 为该蛋白在SWISS-PROT中的标识; “

11、LEN2“表示该蛋白 与查询蛋白重叠的序列的长度;“POS1“、“POS2“是重叠 序列的起始、终止位点;“pI“是计算出该蛋白的pI值;“DE“ 是SWISSPROT中对该蛋白的描述。Date4. PepMAPPERnPepMAPPER(Protein Mapper)是利用质谱 (MS)技术获得信息,通过测量被特定蛋白酶消 化得到的肽段进行数据库比较,进行蛋白质辨 识分析的工具。n该方法不需全部或部分测序,显著的减少了实 验时间。n用户登陆PepMAPPER网页,在线输入蛋白的 物种分类、所用的消化酶、质谱中得到的粒子 类型、每个肽段的电荷数、肽段的pI值等。Date第三节 序列的物理性质1

12、、Compute pI/MW(ExPASy)n Compute pI/MW是计算输入序列等电点和分子量的工具。n分子量的计算是把序列中每个氨基酸的平均分子量加在一起,在加 上一个水分子的分子量。该工具使用时非常简单,可上网输入查询 序列。n可用2种输入方法:把序列整理为FASTA格式,该工具会自动计算全序列的pI值和 分子量;提供SWISSPROT标识,即ID(如G3PZHUMAN)或SWISS- PROT/TrEMBL注册号:AC(如zP04406)。在计算结果中,该工具会 提醒用户是计算全序列还是中间某一片段,如果是片段,请输入N端 和C端位置,结果中该工具不仅给出pI值和分子量,还提供该

13、条目的 描述和物种记录。Date3-磷酸甘油醛脱氢酶(G3P2-HUMAN,p04406),查询其 100200氨基酸残基的分子量和pI值的结果Date2. PeptideMassnPeptideMass工具针对肽段图谱进行分析,主 要用来预测蛋白质在与特定的蛋白酶或化学试 剂作用下的内切产物。n这些蛋白酶和试剂包括:胰蛋白酶(Trysin)糜廉蛋白酶(Chymotrypsin)LysC、ArgC、Asp N、Glu C溴化氰。另外,半光氨酸和甲硫氨酸可在计算产物肽段 之前加以修饰。DatePeptideMassn分析可用一段原序列,也可提供SWISSPROT标识,|如果是后者,Peptide

14、Mass工具还能利用SWISS- PROT库中的信息进行改进计算:除去信号序列、在剪 切之前引入已知的翻译后的修饰等。然后用户在“Select an enzyme,一项中选择想要的酶 。nPeptideMass工具将输出的结果列成表格,其中包括 输入蛋白的pI理论值和分子量,SWISSPROT库中相关 变种的分子量、位点、修饰后的分子量和信息,肽片段 的序列。n 示例结果Date3. SAPSnSAPS(Statistical Analysis of Protein Sequence) 是瑞士实验癌症研究院提供的蛋 白质序列统计分析方法,用于查询序列的统计 信息。n将查询蛋白序列提交给SAPS

15、 Web服务器, 对 查询序列分析,输出该蛋白的物理化学性质信 息,如:各种氨基酸的含量、整个序列电荷分布 、正负电荷聚集区分析、高疏水性区域和跨膜 区段、重复序列、周期性等分析结果。Date第四节 二级结构和折叠类型n蛋白质的二级结构是指蛋白质分子中某一段肽链的局 部空间结构。主要为:-螺旋(-helix)、折叠( pleated sheet)、 转角( -turn)、无规则弯曲 (Random Coil)。n在许多蛋白质分子中,可发现2个或3个具有二级结构 的肽段,在空间上相互接近,形成一个具有特殊功能的空间结构,称为基序(Motif)。n一个基序总有其特征性的氨基酸序列,并发挥特殊的功

16、能。一级结构是二级结构的基础,有时蛋白质分子中起 关键作用的氨基酸残基缺失或被替代,都会严重影响空 间构象乃至生理功能,如,由蛋白质分子发生变异产生 的“分子病“。研究蛋白质的二级结构对确定蛋白质空 间结构有重要意义。Date二级结构和折叠类型n己知蛋白质的性质和结构信息可以到SWISS- PROT或PHD数据库中检索。n对新发现的蛋白质或功能未知的基因产物进行 分析,首先用BLAST或其他工具在公共数据库 中进行相似性搜索,寻找相匹配的蛋白质。n当无法找到匹配蛋白质,或有时虽然找到 一个 有统计学意义的匹配蛋白质,但序列中记录也 没有其二级结构的信息。n因此,利用二级结构和折叠类型的预测工具可 以预测出序列折叠成-螺旋和 -折叠的能力、 可能存在的基序以及功能结构域。Date二级结构和折叠类型n蛋白质二级结构的预测方法与核酸序列预测类 似, 大多采用了“神经网络”算法,在计算过程中 ,通过已知数据库中数据作为训练样本进行学 习,然后进行预测。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 机械/制造/汽车 > 汽车维修/保养

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号