蛋白质和RNA结构预测PPT课件

上传人:日度 文档编号:153234685 上传时间:2020-11-27 格式:PPTX 页数:81 大小:1.33MB
返回 下载 相关 举报
蛋白质和RNA结构预测PPT课件_第1页
第1页 / 共81页
蛋白质和RNA结构预测PPT课件_第2页
第2页 / 共81页
蛋白质和RNA结构预测PPT课件_第3页
第3页 / 共81页
蛋白质和RNA结构预测PPT课件_第4页
第4页 / 共81页
蛋白质和RNA结构预测PPT课件_第5页
第5页 / 共81页
点击查看更多>>
资源描述

《蛋白质和RNA结构预测PPT课件》由会员分享,可在线阅读,更多相关《蛋白质和RNA结构预测PPT课件(81页珍藏版)》请在金锄头文库上搜索。

1、第七章 蛋白质和RNA结构预测,生命科学与技术学院 阎 爱 侠,1,蛋白质是重要物质基础,人体的所有组织器官都会有蛋白质,蛋白质是生命的物质基础。蛋白质是人体的主要“建筑材料”。没有蛋白质的供给,人就不可能从34千克的新生儿长成5060千克重的成年人。 一般说,蛋白质约占人体全部质量的18,最重要的还是其与生命现象有关。蛋白质和核酸是生命存在的主要形式。,2,面对堆积如山的生物学数据,3,4,蛋白质的功能,蛋白质是调控和实现所有生物功能的分子机器。 例如: 结构蛋白-胶原酶-维持和增强结缔组织 机械酶-肌浆球蛋白-实现宏观和微观上的运动 各种酶-参与生理功能 某些蛋白质与DNA或RNA相互作用

2、产生新的蛋白质,5,蛋白质折叠,蛋白质是线性的氨基酸合成的结果,但在生物体内会迅速折叠成一个紧密的球状结构。 1.大多数蛋白质只有在折叠成天然球状结构的时候才能具有完全的生物活性。 2.去折叠(变性)蛋白质在允许重新折叠的实验条件下可以折叠到原来的结构。,6,重大挑战性问题,蛋白质的结构预测! (目前,还没有一个算法能够很好地预测出一个蛋白的三维结构形状),7,蛋白质结构预测,通过计算(如分子力学、分子动力学等)来进行结构预测 (1)对于天然蛋白结构和未折叠结构,两者之间的能量差非常小(1kcal/mol 数量级) (2)研究蛋白质结构的计算量非常大,8,7.1 氨基酸,蛋白质由20种不同大小

3、、形状和化学特性的氨基酸组成。 氨基酸结构:,9,蛋白质是由二十种不同的氨基酸构成的 20种标准氨基酸都是L-氨基酸 特征:L-氨基酸分子中的碳(分子中第2个碳)结合着一个碱性的氨基和一个酸性的羧基,此外C还结合着一个H原子和一个侧链基团(用R表示)。 每一种氨基酸的R都是不同的,侧链上的碳依次是第3、4、5和6位碳。,10,A.疏水氨基酸(hydrophobic amino acid) B.极性氨基酸(polar amino acid) C.带电氨基酸(charged amino acid),氨基酸通常按性质被分为3类,11,疏水性氨基酸,这类氨基酸的侧链大多或者全部由碳原子和氢原子组成,因

4、此这些氨基酸就不太可能与水分子形成氢键。如:酪氨酸、色氨酸、苯丙氨酸等。,酪氨酸,苯丙氨酸,色氨酸,12,极性氨基酸,这类氨基酸的侧链通常由氧原子和/或氮原子组成,它们比较容易与水分子形成氢键。如甘氨酸、半胱氨酸、酪氨酸等。,甘氨酸,半胱氨酸,酪氨酸,13,pH值表示溶液中H+浓度的负对数。 55,000,000个水分子中有一个水分子离解成H+和OH-,与之相对应的浓度是110-7M,因此中性溶液的pH=7。 生理条件(pH7附近)下氨基酸呈现兼性离子形式,pH,14,和水分子相似,许多氨基酸的侧链也含有可离解的质子。氨基酸的pKa值是一个表示氨基酸释放其可离解质子的相对难易程度的量。 当pH

5、值比氨基酸的pKa值小一个pH单位时,大约会有90%的氨基酸被质子化;当pH值比氨基酸的pKa值小两个pH单位时,大约会有99%的氨基酸被质子化。,pKa,15,pKa,16,pKa,17,利用Handerson-Hasselalch公式,可算出在任一pH条件下一种氨基酸的各种离子的比例: 质子受体 pH = pKa + log - 质子供体,18,蛋白质的等电点是指当这种蛋白质在溶液中的静电荷为零时溶液的pH值。蛋白质的等电点可以反映组成这种蛋白质的氨基酸的总体信息。例如如果蛋白质的pI7,我们就可以知道蛋白质中的碱性氨基酸比酸性氨基酸多。,对R侧链基不解离的氨基酸: pI = (pKa1+

6、pKa2)/2,pI,19,甘氨酸滴定曲线,20,几种氨基酸的解离常数和等电点,21,7.2 多肽的组成(一级结构),几个氨基酸组成的氨基酸链称作肽,一条较长的氨基酸链通常称为多肽或者蛋白质。当两个氨基酸实现共价结合的时候,一个氨基酸的氨基丢失一个氢,同时另一个氨基酸丢失一个氧和一个氢,脱水生成肽键。,22,7.2 多肽的组成(一级结构),与DNA 分子和 RNA 分子一样,多肽也具有特定的方向性。多肽的氨基端(N端)具有一个氨基,同时在羧基端(C端)具有一个羧基。 蛋白质序列通常被认为是从N端起始,然后逐渐向C端发展的。 组成蛋白质的氨基酸序列完全决定了蛋白质的三维形状和理化特性,也最终决定

7、了它的生物功能。,23,7.3 二级结构,作用 估计蛋白的结构类型 提高同源模建的准确性 三级结构预测的起点 方法 Chou-Fasman(经验参数法) Garnier(GOR法),24,二级结构,25,7.3 二级结构的类型,(1) 螺旋: 肽链主链绕假想的中心轴盘绕成螺旋状,一般都是右手螺旋结构,螺旋是靠链内氢键维持的。每个氨基酸残基(第n个)的羰基与多肽链 C 端方向的第4个残基(第4+n个)的酰胺氮形成氢键。,26,7.3 二级结构的类型,(2)折叠: 肽键平面折叠成锯齿状, 相邻肽链主链的N-H 和 C=O 之间形成有规则的氢键, 在-折叠中, 所有的肽键都参与链间氢键的形成, 氢键

8、与-折叠的长轴呈垂直关系.,27,7.3 二级结构的类型,(3)转角: 蛋白质二级结构类型之一,由4个氨基酸残基组成,其中第一个残基的 CO 基团和第四个残基的 NH基团之间形成氢键,使多肽链的方向发生“U”形改变。,28,有些蛋白质中含有大量的螺旋 如血红蛋白和肌红蛋白 而一些蛋白质中则不含或者仅含很少的 螺旋 如铁氧蛋白 有些蛋白质的二级结构以折叠为主 如免疫球蛋白 例:肽链Ala(A)-Glu(E)-Leu(L)-Met(M) 倾向于形成螺旋 肽链Pro(P)-Gly(G)-Tyr(Y)-Ser(S)则不会形成螺旋,29,7.3.1 骨架柔性,多肽链中氨基酸的非侧链原子构成了蛋白骨架。骨

9、架中共价键的键长和平面键角或多或少都是固定的。只有两个键可以旋转: (1) 氨基氮原子和碳原子之间形成的键的旋转角 (); (2)碳原子和羧基碳原子之间形成的键的旋转角 ();,30,旋转角,phi (N-C) psi (C C(羟基)),31,一个蛋白质的构象可以通过每个氨基酸的和角来表示,但是物理上并不能确实观察到所有的和角,因为一些和角的组合可能导致骨架上相邻残基侧链原子的空间碰撞。 Ramachandran图显示了除甘氨酸残基外的其他氨基酸残基中允许出现的和值。,Ramachandran图,甘氨酸没有侧链,因此甘氨酸残基允许出现的和值的范围比其他氨基酸残基都要大。,32,预测二级结构的

10、算法中使用了多种计算方法如神经网络、离散态模型、隐马尔科夫模型、最近邻分类和进化计算等。 目前大多数二级结构预测的算法都是对一系列由BLAST、FASTA和CLUSTALW算法产生的经过比对的序列进行二级结构预测。 现在的二级结构预测算法,如 PHD 和 Predator,将蛋白序列和每个氨基酸的相对保守程度作为输入,预测准确率能达到70%-75%。,7.3.2 预测的准确度,33,每种氨基酸出现在各种二级结构中倾向或者频率是不同的 例如:Glu 主要出现在螺旋中 Asp 和 Gly 主要分布在转角中 Pro 也常出现在转角中,但是绝不会出现在螺旋中 所以可以根据每种氨基酸残基形成二级结构的倾

11、向性(Chou-Fasman)或者统计规律(GOR)进行二级结构预测,蛋白质二级结构预测方法,34,该方法由 Chou 和 Fasman 在 70年代提出来,是一种基于单个氨基酸残基统计的经验预测方法。通过统计分析,获得的每个残基出现于特定二级结构构象的倾向性因子,进而利用这些倾向性因子预测蛋白质的二级结构. 每个氨基酸都有几个构成参数,P(a),P(b) 和 P(turn), 分别表示相应的氨基酸形成螺旋、折叠和转角的偏向性。另外,每个氨基酸同时也有4个转角参数f(i), f(i+1), f(i+2), f(i+3), 分别对应于这种氨基酸出现在发夹转角第一、第二、第三和第四位的频率。,Ch

12、ou-Fasman法,35,36,(1) 寻找所有相邻的6个残基中至少4个残基的 P(a) 100的区域。 (2) 对于 (1) 中发现的每一个区域,从区域两端向外延伸,直至出现 4 个连续残基的P (a) 5,并且区域的P(a) P(b),那么这样的一个区域就被预测为螺旋。,螺旋的预测规则,37,折叠的预测规则,(1) 寻找所有相邻的6个残基中至少4个残基的P(b) 100的区域。 (2) 对于(1) 中发现的每一个区域,从区域两端向外延伸,一旦所有的区域延伸结束后,当一个区域中所有残基的P(b)的均值大于100 并且P(b) P(a) 时,这个区域就预测为折叠。,假如预测出的螺旋区域与预测

13、出的折叠区域有重叠的话,那么如果重叠区域的P(b) P(a),就预测为折叠;反之,则预测为螺旋。,38,(1)对于每个位于i位置上的残基计算它的转角偏向性P(t)。计算方法如下: P(t) = 第i位上的残基的 f(i) 值 第 i+1位上的残基的 f(i+1)值 第i+2位上的残基的 f(i+2) 值第 i+3 位上的残基的 f(i+3)值 (2)若一段区域内的氨基酸满足如下条件,就预测这段区域是一个从第i位氨基酸开始的发夹转角。 a. P(t) 0.000075; b. 从第i位到第i+3位的4个残基的P(turn)参数的平均值100; c. 从第i位到第i+3位的4个残基的P(turn)

14、 P(a),且 P(turn) P(b);,转角的预测规则,39,是一种基于信息论和贝叶斯统计学的方法。 GOR将蛋白质序列当作一连串的信息值来处理。 GOR方法不仅考虑被预测位置本身氨基酸残基种类的影响,而且考虑相邻残基种类对该位置构象的影响。,GOR方法,40,GOR方法将序列中的每一个残基与和它N端紧邻的8个残基以及和它 C 端紧邻的 8个残基一起考虑,通过对已知的二级结构的蛋白样本的分析,计算出中心残基的二级结构分别为螺旋、折叠和转角时每种氨基酸出现在窗口中各个位置的频率,产生一个 1720 的得分矩阵。然后预测序列中每个残基形成这些二级结构的概率。 GOR 方法的预测准确率约为 65

15、%。,GOR方法,41,序列窗口 中心残基,GOR方法考虑窗口中各个残基对中心残基二级结构的支持程度,42,(1)三级结构 一个折叠的多肽链的整体三维形状称为蛋白质的三级结构。,7.4 三级结构和四级结构,43,(2)四级结构 几个多肽相互作用形成一个功能蛋白质,多酶复合物中也会出现蛋白质与蛋白质的相互作用,这种分子间相互作用称为蛋白质的四级结构。,7.4 三级结构和四级结构,44,(1) 理论分析方法 通过理论计算(如分子力学、分子动力学计算)进行结构预测。 (2)统计的方法 对已知结构的蛋白质进行统计分析,建立序列到结构的映射模型,进而对未知结构的蛋白质根据映射模型直接从氨基酸序列预测结构

16、。 包括: 经验性方法 结构规律提取方法 同源模型化方法,7.4 三级结构和四级结构预测方法,45,影响三、四级结构的几类作用力:,(1)疏水性 疏水作用力通常被认为是蛋白质折叠成一个紧密球状结构的几种基础力之一。 大多数蛋白质的天然结构都有一个疏水核心和一个与溶液相接触的表面,疏水核心中掩藏了疏水残基,使得它们与溶液相隔离,而与溶液相接触的表面大多或者全部由极性残基和带电残基组成。 镰刀形细胞贫血症正是由于球蛋白表面的单个残基由带电的谷氨酸突变到疏水的缬氨酸,就导致了细胞形态的彻底变化,最终使人产生贫血、劳累甚至是坏疽的严重病症。,46,(2)二硫键 当两个半胱氨酸残基中的巯基相互靠近时,它们可以被氧化而产生共价的二硫键,从而将在蛋白质一级结构中可能相距很远的残基交

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 工作范文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号