基于联合残基模型的蛋白质折叠模拟

上传人:E**** 文档编号:114475901 上传时间:2019-11-11 格式:PDF 页数:100 大小:5.80MB
返回 下载 相关 举报
基于联合残基模型的蛋白质折叠模拟_第1页
第1页 / 共100页
基于联合残基模型的蛋白质折叠模拟_第2页
第2页 / 共100页
基于联合残基模型的蛋白质折叠模拟_第3页
第3页 / 共100页
基于联合残基模型的蛋白质折叠模拟_第4页
第4页 / 共100页
基于联合残基模型的蛋白质折叠模拟_第5页
第5页 / 共100页
点击查看更多>>
资源描述

《基于联合残基模型的蛋白质折叠模拟》由会员分享,可在线阅读,更多相关《基于联合残基模型的蛋白质折叠模拟(100页珍藏版)》请在金锄头文库上搜索。

1、华中科技大学 博士学位论文 基于联合残基模型的蛋白质折叠模拟 姓名:何毅 申请学位级别:博士 专业:理论物理 指导教师:肖奕 20080101 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 I 摘 要 摘 要 蛋白质结构预测和蛋白质折叠机制的研究是相当有挑战性并且吸引人的研究方 向。尽管在过去的几十年里面,蛋白质折叠研究已经取得了相当大的进步,但是, 直至现在,蛋白折叠的研究里仍有相当多未能完全解决的问题。本论文主要是采用 一种用以研究蛋白质折叠的简化模型联合残基模型(UNRES)来研究蛋白质的折 叠路径,并在研究折叠路径的同时来改进我们所使用

2、的联合残基模型。我们的工作 有助于对蛋白质折叠机制的进一步认识和联合残基模型的改进。具体的讲,我们做 了以下几个方面的工作: 1) 采用联合残基模型对 Trptophan Zipper 2(Trpzip2)蛋白的折叠路径进行了研 究。我们发现对 Trpzip2 这样一个由 12 个氨基酸组成的小肽段,它从直链结构(非 天然态)折叠到天然结构有两种折叠机制:拉链模式和拉链疏水塌缩同时发生的 模式,而每种路径是以一定概率出现的。拉链模式发生的概率约为 72%,这也说明 了为什么实验上观察到的都是拉链模式,因为实验上总是观测到出现概率最大的事 件。另外,我们发现 Trpzip2 的折叠过程可能是二态

3、的过程,也可能是三态的过程。 我们的研究有助于理清目前发卡折叠机制中存在的矛盾。 2) 采用联合残基模型研究了较大蛋白的折叠过程。我们选取了长度为 120 个氨 基酸的 6 螺旋蛋白 1Q2Z, 模拟了 48 条长为 110 纳秒的 1Q2Z 折叠的独立分子动力 学轨道,并且所有这些模拟轨道均从直链开始。这个蛋白成功折叠到它的天然结构 并且整个折叠过程可以用以下几步来描述。首先是迅速地在局部形成二级结构同时 伴以疏水塌缩,然后各个局域螺旋片段之间开始聚合在一起,最后再把各个聚合体 拼装成正确的三级结构。我们同时发现这个蛋白的前半段(前三个螺旋)和后半段 (后三个螺旋)能独立折叠到它们的天然结构

4、。我们还发现如果把这个 6 螺旋蛋白 切成三段,每个片段都有一定独立折叠的能力。这说明这个蛋白很可能是由更小的 蛋白或多肽片段进化而来的。 3) 将 1Q2Z 蛋白切成不同长度的片段,并采用联合残基模型对这些片段进行了 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 II 独立的动力学模拟。从我们的模拟中可以看出,三个螺旋组成的片段的稳定性好于 两个螺旋组成的片段。从我们序列比对的结果中也可以看出,1Q2Z 具有两对称性。 所以, 我们有理由推断 1Q2Z 可能是有两个三螺旋结构单元组成的。 并且, 在这些 1Q2Z 片段折叠的过程中,这些片段展

5、现出了与 1Q2Z 蛋白相似的折叠过程。 4) 研究了联合残基模型可能的权重参数空间的范围。因为一些新的能量项参数 和温度依赖性的加入使得联合残基模型拥有更高的精度和可靠性,但是同时使得我 们必须要重新确定联合残基力场各项的权重参数。因此,必须有一个用以力场优化 的初始点。为了这个目标,我们随机在力场权重构成的参数空间里取了一百个初始 点,并采用了分层次的筛选机制来得到理想的初始点。一个包含 13 个测试蛋白的测 试集用来测试随机产生的初始点的折叠能力。利用我们筛选出的力场权重集,大部 分测试集里的蛋白可以产生类天然结构。而且,从我们的结果可以看出,随机搜索 力场参数空间是可行的,并且我们设计

6、的分层次的筛选法则也是有效的,它可以用 于力场参数的粗选。同时,我们建议进行更大规模的筛选以获得更好的初始点 本研究工作受国家自然科学基金(No.30525037 和 No.30470412)资助。 关键词关键词:蛋白质 简化模型 分子动力学 折叠机制 力场优化 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 III Abstract Study protein folding and protein folding mechanisms is a very difficult but also attractive task. In the p

7、ast decades, protein folding research has achieved lots of successes, but there are still many problems need to be solved. My research is focused on studying protein folding mechanisms with United-Residue (UNRES) model and improving UNRES force field. Our research can help people understanding both

8、small peptides and real proteins folding mechanisms. We also did some researches about UNRES force field. More detiales about my research are listed as following: 1)We employed UNRES to study a short peptide: Trptophan Zipper 2(Trpzip2) folding mechanisms. We find that this small peptide folds from

9、extended structure to native structure following two folding mechanisms: zipper and simultaneously zipper )/ Y Y Y F XRTE X YRT dV V = (2.3) 在这里 YY Y VdV = (2.4) 公式里面的各项参数分别是:(; )E X Y表示原始的 (包含所有原子) 的能量函数,R 是气体常数,T是绝对温度, Y 是变量Y的整个积分空间, Y V是这个空间的体 积。 这里,我们先要讲一下关于这个“重要”和“不太重要”的变量划分的区域。 在联合残基模型里面主要的自由度

10、包括:虚拟键夹角,虚拟键扭转角和描述侧 链方向的角度 SC 和 SC 。而相比上面的自由度,次重要的自由度包括参与统计联 合残基链并支配全原子链和溶剂运动的变量。这些自由度包括溶剂的自由度,侧链 在遵守侧链质心约束的的情况下X的子空间,主链二面角和在遵守C原子的 约束下侧链的子空间。最后,我们最好使用角度来绕CC ?虚拟键旋转肽基 团,因为这些角度的变化影响C原子链的位置从而会影响虚拟键夹角。 图 2.2 对绕CC 虚拟键旋转的肽基团的角度 (1) 和 (2) 的定义。 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 17 一般来讲,方程(2.3

11、)表示的函数可以用数字办法来估计,但是这是不太切合实 际的,因为要计算这个多维积分的计算量相当的巨大(这个计算量与全局搜索全原 子原始势能函数的全局最小计算量差不多)。因此我们必须借助其他的方法。在之 前的文章里面我们采用了累积展开RFE成不同的量级的多体项。这里我们继续贯彻 这个方法,而且我们进一步先采用集合展开,然后再引入Kubo提出的用于集合展 开的广义累计展开,而且把它用于具体的多肽链。 接下来让我们把第二级自由度Y分成 12 , n y yy,这里n是简化表示里面相 互作用点的个数,这样 i y定义的是简化模型里第i个相互作用点内部的运动。现在 我们可以表示出全原子系统里属于简化模型

12、相互作用点表示的相互作用能量: 1 ; 111 (; )(;)(;) nnk ikkik jlkt kiklij kkl E X YEX yEX yy = =+ 1 (;) N ii i X z = = (2.5) 这里集合 12 , n 包含相互作用点1,2,n所有的原子的索引,因此, (1)/2Nn=+是在全原子表示下所有能量组分 12 , N 的个数,这里 ii zy=或 者(;) kl yy是根据 i 是一个内部或者相互作用点之间的能量来定的。每个能量组份 或者是在给定的拓展的点内部的或者是介于两个给定拓展的点之间所有原子之间的 相互作用之和。这里没有特别的要求说必须要怎么划分这些能量

13、项。例如,你可以 为了方便而合并其中的一些项或者说直接把原子的相互作用定义为能量组份,这些 依赖于我们是考虑的相邻相互作用点还是长程相互作用。这里唯一严格的要求就是 所有能量组份的和要等于系统的总能量。 在图2.3里面,我们进一步强调一下能量的划分。 我们能合并方程(2.3)和(2.5),那么RFE可以表示成为: 1 11 ()lnexp(;) N iiy i y y F XX zdV V = = (2.6) 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 18 这里1/ RT=。现在,我们又把()F X分成许多因子的和,每一个因子代表一定 数目

14、的组分相互作用: (1)(2)(3) ()()()() iijijk iijij k F XfXfXfX =+ ? ( ) 1 2 12 () n n n i ii iii fX + ? ? (2.7) 这里,我们采用括号来表示指数函数的平均,因子 ( ) 1 2 k k i ii f ? 同样采用 12 f k iii ,如下面方程所定义的: 图 2.3 把肽链的相互作用分解成为如上方程所表示的肽链的能量组份在得到多肽链的 UNRES 力 场的过程中。为了清晰,只有被选中的相互作用才被虚线表示。侧链之间的相互作用能 (包括水 分子的溶剂体积,这里没有明显表示出来) , SCSC E是对能量函

15、数方程(2.1)的 SCSC U起贡献的。 同样的,介于序列上被超过一个氨基酸分离的属于肽基团的原子的相互作用( pp E),同样,有 介于肽基团和侧链之间的( SCp E)相互作用其贡献到 pp U和 SCp U。介于侧链原子和侧链和邻近 肽基团( loc SC E)的相互作用贡献到 rot U。邻近的相互作用的肽基团能量 loc back E贡献到 b U。因为肽 基团被假设是顺式,所以肽基团内部的能量是常数,不贡献到任何能量项。 华 中 科 技 大 学 博 士 学 位 论 文 华 中 科 技 大 学 博 士 学 位 论 文 19 ( ) 1 212 k f kk i iiiii f = ? ( ) 1 1 12 12 1 12 12 1 ( 1) ( 1) k k ll l k k l l iii iii iii iii m mml mmml mk i mmml mmml mk i F = = = = ? ? (2.8) 这里 21 ( ) , 12 , () k k k i iiiii FX = 1 11 lnexp(;) k l ll ii y y X zdV V = = (2.9) ( y V 是变量 12 , k iii yyy的子空间的体积) 是只包含部分组分相互作用的RFE。以 上两方程表示的前三个因子可以

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号