Markov state models of biomolecular conformational dynamics

上传人:德****1 文档编号:1080556 上传时间:2017-05-27 格式:PDF 页数:9 大小:529.05KB
返回 下载 相关 举报
Markov state models of biomolecular conformational dynamics_第1页
第1页 / 共9页
Markov state models of biomolecular conformational dynamics_第2页
第2页 / 共9页
Markov state models of biomolecular conformational dynamics_第3页
第3页 / 共9页
Markov state models of biomolecular conformational dynamics_第4页
第4页 / 共9页
Markov state models of biomolecular conformational dynamics_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《Markov state models of biomolecular conformational dynamics》由会员分享,可在线阅读,更多相关《Markov state models of biomolecular conformational dynamics(9页珍藏版)》请在金锄头文库上搜索。

1、 生物分子构象动力学马尔可夫状态模型 学 院 化工学院 专 业 生物工程 2 班 学 号 3012207279 姓 名 龚世鹏 2015 年 7 月 3 日 Markov state models of biomolecular conformational dynamics 生物分子构象动力学马尔可夫状态模型 原文 John D Chodera and Frank Noe 译 者 龚世鹏 学号 3012207279 最近 , 马尔科夫( MSMs)模型已被应用于实践当中,采用从分子动力学模拟中获取的数据,再现了长期生物分子统计构象动力学。使用一组原子分子动力学模拟, MSMs 可预测长期范围

2、内动态和静态数量 (例 如 ,毫秒),每一个模拟都很短,解决了在分子动力学模拟中著名的样本问题。除了提供可预测量化模型外, MSMs 极大的便利了生物分子机制的观测(例如折叠动力学和功能动力学,并且促进了单分子和动力学实验整体之间的定量比较。方法论和软件包的变化使模型的建立更加贴近于日常实践 。这里,我们回顾了最近的实践领域的进步,思考了理论和方法论的进步,新软件工具,以及最近该模型在生物分子和生物物理学领域的运用,并分析了仍然存在的挑战。 1.简介 使用分子动力学模拟研究生物分子体系并不是项简单的工作。研究不仅需要准确处理分子内和分子间的相互作用,恰当模拟化学环境,而且和稳定整合所要求的时间

3、步数(一般为飞秒)相比,生物分子折叠和生物分子功能的时间尺度(通常为毫秒到秒)十分的长。即使在昂贵的组合专用机床的帮助下,模拟轨迹也几乎不能达到生物分子时间尺度的需要,更不用说使统计特征超过加单观察 的要求。 对于时间尺度问题,人们探索了各种不同的解决方案,许多实践者进了行多种比需要时间尺度 更短 的模拟,从中提取了随机动力学信息,已建立一个离散随机模型,这种模型可以描述长期统计动力学,这些马尔可夫状态模型( MSMs)使用两种对象描述了生物分子体系的随机动力学:第一种为高纬度分子状态空间的离散化,通常分成 n 个不想交构象集合 1s ,.ns ;第二种为离散状态之 间随机转换的模型,通常使用

4、有条件转换概率描述,此概率使用轨迹 xt 模拟进行估测, 并且定义转移矩阵 P( ijp ): ijp ()=Prob( jtjt sxsx | ) ( 1) 其中,为 转移矩阵 构建后的滞后时间或观测间隔。近 期有文献强调(见下方),在检测 MSM 近似精度和利用情况时,滞后时间可以成为重要的参数,更大数值的可以提供更高精确度,但却具有更粗糙的时间分辨率。 根据简单的本征值问题,转移矩阵 P 使得到稳定分布: TTP . ( 2) 这是 MSMs 的一个关键特征,当矩阵 P( ijp ) 仅包含条件转换概率时(它可以从长度短轨迹处计算,通常数量级要短于最长的松弛时间尺度),总体稳定分布仍可以

5、从 P中计算。即使使用短轨迹进行构建后它在开始时并不均衡,但 MSM 成功的揭示出了该体系的平衡热力学和动力学特性。此外,识别出合适的状态空间离散化的工作也并不简单, MSM在解决样本问题时,具有其他方法所不具有的优势,慢序参量不需要具有先验性。 MSMs 另一个重要特征为,许多有关数量值可以简单的从中得到计算。一个理论性的简单方法为,在时间分辨率为的情况下, 使用 转移矩阵 P 得到离散轨迹,从与每一个离散状态有关的结构中模拟分子构型。此外,任何服从该处理方式的观测分子也可使用含有 P 在内的代数方程计算,不需要使用这种采样方式。后一种方法避免了轨迹取样,根据给出的实验,经常可以对所观测时间

6、行为的主要作用有更多深刻理解。关键元素为转移矩阵的特征值 i 和特征向量 ir : iii rPr ( 3) 其中特征值转换为分子松弛时间尺度, )(ln/ iit ,特征向量表明在此时间尺度条件下,发生了何种结构变化(图 1)。通过 MSMs 理解动态分子实验时,二元性的作用非常大。 最近,有两本书编写了关于 MSM 理论和应用。第一本综合性的调查了目前马尔可夫状态模型构建的理论和应用,第二本侧重于数 学和理论方面的改进。 为数不少的文献评论或综述了马尔可夫状态模型的基本内容,本文则重点关注早期评论文献发表后出现的理论革新和应用。 2.近期理论和方法论的改进 2.1 范式转换:从最大化亚稳定

7、性到近似特征空间 许多年来, 根据一种离散状态动力学应当最大程度接近马尔可夫性(无记忆性),人们期望构建一个亚稳定最大化的状态空间离散化,这推动着 MSM 构建技术的发展。为了达到此目标,大多数方案试图将映射的离散状态使用期数值最大化,以保证后续状态转化与早前转化历史的关联系降到最低。 近期的理论研 究表明,将 MSM 认为是全部状态空间的马尔科夫算子(转化算子或动态传播算子)的离散最大化更为有效,而不是认为其是位置和速度的离散最大化。结果表明,状态离散化的基本目标从最大化使用期变为了找到统计长期动态学的最大接近值。 举一个双潜井的例子来说。将使用期最大化会导致构建出一个双状态模型,一个分区的

8、位置在两个井之间的转化状态处。在转化状态附近引进另一个分区可以降低离散状态的使用期,但是会确实增加模型的近似精度,这需要让他跟好的近似于马尔科夫算子的特征空间。此外,所选出的有关动态过程可以近似于任意精度。 2.2 特征值和特征向量 由于 MSMs 的特征向量可以紧密接近于相应的与大特征值相关联的的马尔科夫算子的特征函数, MSMs 可以准确近似长期分子动态成为了重要发现。当特征函数描述结构性再组合时,这些所观察时间的马尔科夫算子特征值 )(i 就会与复杂的分子松弛时间尺度有关。 这一方面也为发现 MSMs 和相关方法之间的基础性联系提供了方便。举个例子,根据过阻尼郎之万动力学且以近似于这些特

9、性函数为目标构造的一个扩散映射,该扩散映射用于改良过 的探索构象空间的方法,这种构象空间的特征函数进程缓慢。 根据以上观察,不难发现根据 MSMs 得出的松弛时间尺度(时间率)的系统性估测错误与 MSM 离散与马尔科夫算子函数的近似度有关。无论是分子动力学模拟还是生物物理学实验,几乎所有的比率的理论都试图以相似方法从轨迹数据中提取转化率,许多经典比率理论的内在错误可以根据这个函数近似错误计算。 2.3 变分法 将 MSMs 看做可以近似马尔科夫算子特征函数的方法,它可以与量子化学平行,该方法的目标是近似汉密尔顿函数的特征函数和特征值。最近发现瑞丽瑞兹法辩 分原则(量子化学的基本概念)在分子构象

10、动力学的一个方法近似,在 MSMs 构造中出现的特征函数近似问题可以转化为广义的特征问题。这种构想表明,出基础函数是马尔科夫算子真是特征函数的线性组合外,基于 MSM 的松弛时间尺度是可以被估测的。基于聚集模拟数据的标准脆性划分 MSMs 是一种特殊案例,在这种案例中选出用于辩分优化的基组,组合在离散 MSM 状态中可成为常量的一组函数。 该观察结构有着深远的影响。正如更好的基组可以在量子化学中产生更好的计算模型,所以 MSM 基组构造可以产生更好更有信息量的分子动力模型。可以 讨论量子力学法中的相似处和不同处,并且通过高斯基组在多肽动力学近似值上使用变分原则。变分法在研究更有效率更有信息量的

11、基组方面比高纬度坐标空间的泰森多边形分区法更加适宜。 2.4 用于离散化的坐标空间 从生物分子模拟数据中构造准确 MSMs 的主要难点在于需要对统计错误和系统性近似错误进行平衡:一个精细的分区可以将近似错误最小化,轨迹数据的有限数量一位这精细分区将会增加统计错误。在该领域中一个重要问题在于采用何种距离测度和聚类法可以为再此产生良好的马尔科夫算子主导特征函数近似值创造条件。早期研究采用扭 转角度,笛卡尔坐标(尽可能根据翻译 /扭转参考结构),或者其他坐标法的主要成分。另一种流行的方法是采用成对最小均方根差( RMSD)法。在检测不同动力学状态中,溶剂自由度也很难把握。 所有方法所共有的问题在于,

12、他们它提出了先验距离测度。由于轨迹数据的数量通常因实践模拟实践而受到限制,此矩阵下的高度相似的立体基阵都彼此动态相关。固定矩阵具有缺点,为了保证动态相关性通常需要很小的临近域,这可能造成需要大量不可能实现的数据量来建立高质量的 MSM。因此,群落扎到了一种数据优化过的距离算法,该矩阵通过从轨迹中了 解都动态相似性,可以增加临近域的相似度。例如,一个使用动态且具有辨识力的算法的项目中,广义加权平法欧几里得法得到了优化。在最近的研究中,提出了另一种可以离散扩散算子的方法,这和在生物细胞中运送小分子有关。 随着延迟时间相关性的研究的出现,得出了一个重大突破,该研究也被成为时间滞后或以时间 -构建 -

13、为基础的独立成分分析。( tICA 或 TICA)。两组独立的再此发现了该方法,将输入的坐标(例,扭转,距离,联系)转化为集体坐标,并对其进行“缓慢”处理,以此可以为 MSM 构建提供一种优秀的降维法。这可以理解为主 要成分分析的一般性结论,因为它可以在输入坐标的瞬间或时间滞后相关矩阵中解决普遍的特征值问题。该方法还可以解决和输入坐标一致的基组特殊选择中的变分问题。 2.5 完整分区对比核心 如何将最高纬度轨迹数据最好的映射到离散状态标签的序列上,近期的研究已经解决了该问题,其中有序的估测了 MSM 的转化矩阵。大多数最近的 MSM 研究都构建了一个泰森多边形棋盘格局用以分配将立体基阵分配到离

14、散状态中。另一种方法是以核心为基础的映射法,使用了广为熟悉的过渡渠道对群落抽样,但是该方法第一次引入 MSM 构建。有人将不完整的 空间分区定义为高度亚稳定的核心,这种在不同的亚问题盆之间。根据遇到的不同核心,连续性轨迹因计数的变化而离散,但是会保留在两个盆区之间的中间区域遇到的核心的联系。其后表明核心离散方案具有里程碑式的作用,而那些核心就是里程碑。在 MSM 框架中,这种核心映射法可以作为基础函数有效使用核心提交者函数,通常当核心数很小时,可以得到转移算子特征函数的较好近似值。但是,在变高纬度立体基阵空间中辨识核心的普遍方法还未有研究结果。 2.6 MSM 估测 一旦高纬度估计被映射到状态

15、的离散序列中,就可以通过估测状态间的离 散定力学的动力模型得到 MSM。在大多数情况下,从轨迹数据中得出的滞后时间被用于估测条件转移率矩阵。早前的方法根据状态 -状态 时间关系方程估测转移率,但是近期 MAM 法的应用大大增强。通常,转移矩阵智能根据最大联系的状态子集进行估测,并重复使用最大估测函数以保持细节平衡。 为了评估 MSM 模型的统计不确定性和它的预测,不仅需要考虑最可能的转移举证,需要使用所有在统计上和数据一致的矩阵。通过马尔科夫链蒙特卡罗( MCMC)法可以很容易达到此目标。最近的刊物表明稳定性分布是如何得到进一步应用以限制 转移矩阵 的 空间的。 在离散状况十分充足可以允许使用较短的滞后时间时,通过使用从不同交换尝试中得到的短轨迹片段,也可以直接平行调和模拟中直接构建 MSM。通过引入动态再权重法这种方法随后进行了优化,可以在所有温度下使用数据,也可以使 MSM 在温度下捕捉连续依赖性。 2.7 MSMs 粗粒化 一个接近一个生物分子系统统计动态的 MSM 拥有成百上千个离散状态。为了从中获得可以理解

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号