结构生物信息学6-三级结构预测

上传人:我** 文档编号:115722501 上传时间:2019-11-14 格式:PPT 页数:76 大小:4.81MB
返回 下载 相关 举报
结构生物信息学6-三级结构预测_第1页
第1页 / 共76页
结构生物信息学6-三级结构预测_第2页
第2页 / 共76页
结构生物信息学6-三级结构预测_第3页
第3页 / 共76页
结构生物信息学6-三级结构预测_第4页
第4页 / 共76页
结构生物信息学6-三级结构预测_第5页
第5页 / 共76页
点击查看更多>>
资源描述

《结构生物信息学6-三级结构预测》由会员分享,可在线阅读,更多相关《结构生物信息学6-三级结构预测(76页珍藏版)》请在金锄头文库上搜索。

1、生物信息学培训班 结构生物信息学 蛋白质三级结构预测 张张 法法 中国科学院计算技术研究所中国科学院计算技术研究所 2013-3-312013-3-31 生物信息学培训班 Outline 背景简介 蛋白质结构预测算法 常用软件介绍 生物信息学培训班 蛋白质三级结构 序列 结构 功能 蛋白质结构的意义: l蛋白质所具有的功能取决于蛋白质的空间结构。蛋白质分 子的生物学功能是蛋白质的天然构象具有的属性或所表现 的性质,因此研究蛋白质分子的空间结构和生物学功能的 关系在分子生物学中占据突出的地位 蛋白质结构的应用: 背景简介 l1.预测蛋白质的功能 l3.蛋白质-蛋白质的相互作用 l5.结构域边界

2、l2.底物结合位点 l4.药物设计 l6.指导定点突变 生物信息学培训班 确定蛋白质结构的方法 确定蛋白质结构的方法 核磁共振X射线晶体衍射结构预测冷冻电镜 小分子量蛋白蛋白质复合体小分子量蛋白膜蛋白和超大 分子复合体 背景简介 生物信息学培训班 X-射线晶体衍射技术背景简介 测定衍射斑点位置和强度 衍射相角 分子的构象 电子密度图 生物信息学培训班 X-射线晶体衍射技术 优点: l测定结果可靠; l速度快; l不受样品大小限制,无论多大的蛋白,或者复合体,(蛋 白质、RNA、DNA、小分子等等),只要能够结晶就能够 得到其原子结构。 缺点: l必须进行结晶;很多蛋白质很难(甚至无法)结晶;

3、l晶体中的蛋白质分子构象是静态的,无法测定不稳定的过 渡态的构象。 背景简介 生物信息学培训班 核磁共振技术测定蛋白质结构 预测 背景简介 生物信息学培训班 核磁共振技术测定蛋白质结构 背景简介 优点: l能研究溶液中的蛋白质结构; l能提供大量有关动态的信息; l测定结果与X射线技术非常接近。 缺点: l只能测定较小的蛋白质结构; l很难获得蛋白质分子完整的三维结构。 生物信息学培训班 蛋白质结构预测的意义 问题:寻找从氨基酸序列到蛋白质所有原子三维坐 标的一种映射 理论方面:蛋白质折叠的机制 应用方面:了解蛋白质分子的结构 实验测定方法的局限性 蛋白质结构测定和序列测定严重脱节 l蛋白质序

4、列与PDB中已测定的结构数量相差2个数量级 l蛋白质结构的试验测定费时费力,成功率非常有限 l大量的蛋白质结构不能通过实验方法测得 背景简介 生物信息学培训班 蛋白质结构预测的依据 实验结果证明:蛋白质的结构由蛋白质序列所决定。 背景简介 自然界实际存在的蛋白质是有 限的,并且存在着大量的同源 序列,可能的结构类型也不多 ,序列到结构的关系有一定的 规律可循。 结构保守性序列保守性 PDB中结构数量在增加,但是蛋 白质的结构类型(Fold)的数量 几乎没有增加。(1200) Anfinsen原理:蛋白质链会以自由能最低的方式形成三维结 构。(1972年诺贝尔化学奖) 生物信息学培训班 蛋白质三

5、维结构的表示法 欧式空间 l原子坐标 Coordinates (x, y, z) uC 坐标确定后backbone的自由度很小 u侧链排放有一定的自由度 l距离矩阵 u坐标距离矩阵, 距离矩阵坐标 u镜像问题,丢失了手性 u相邻的C 距离为3.8 A 左右(特例:cis-proline 2.8A) uk*L个C-C距离便可恢复出L个C的坐标 背景简介 1234 103.8 6.0 8.1 23.803.8 5.9 36.0 3.803.8 48.1 5.9 3.80 1 2 3 4 6.0 8.1 5.9 3.8 3.8 3.8 3.8 生物信息学培训班 蛋白质三维结构的表示法 角空间 l扭转

6、角(Torsion angle) uphi-angle (): N-C bond upsi-angle (): C-C bond l键长 背景简介 1234 103.8 6.0 8.1 23.803.8 5.9 36.0 3.803.8 48.1 5.9 3.80 1 2 3 4 6.0 8.1 5.9 3.8 3.8 3.8 3.8 欧式空间的表示法可以与角空间的表示法互相转换 生物信息学培训班 蛋白质的折叠过程 背景简介 朝自由能E最低的构造折叠,形成稳定的氢键,静 电以及范德华相互作用,产生二级结构 螺旋 平行/反平行 生物信息学培训班 蛋白质结构分类 数据库 Sequence DB:

7、NR Uniprot pFam 分类 序列相似性 Sequence alignment 背景简介 生物信息学培训班 蛋白质结构分类 背景简介 数据库 Sequence DB: NR Uniprot pFam 分类 序列相似性 Sequence alignment Structure DB Scop PDB Protein Data Bank CATH 人工 人工自动全自动 分类 几何信息进化信息层次聚类 结构相似性 structure alignment 2/3的结构分类是重合的 FSSP 生物信息学培训班 蛋白质结构分类 背景简介 数据库 Sequence DB: NR Uniprot pF

8、am 分类 序列相似性 Sequence alignment Structure DB Scop PDB Protein Data Bank CATH 人工 人工自动全自动 分类 几何信息进化信息层次聚类 结构相似性 structure alignment 2/3的结构分类是重合的 FSSP Seq-Stru alignment Structure prediction 生物信息学培训班 蛋白质结构分类 背景简介 数据库:PDB/ Class/ Fold/ Architecture/ Domain/Motif/Superfamily/Family 分类: Class: 二级结构分类(all ,

9、 all , +, /, etc) Fold (architecture) : 二级结 构的形状走向(barrel, sandwich, etc) domain: 结构中有功能的部分 比如 binding, cleaving, spanning sites motif : 小的或者特定的二级结 构比如一个 - loop Family:考虑拓扑结构实 验的或者生物特性 Superfamily:在family基础 上,还考虑进化关系 All All + / PDB ID: 2FOX CLASS: / FOLD: Flavodoxin-like sandwich Superfamily: Flavo

10、proteins FAMILY: Flavodoxin-related Sandwich TIM barrel Protein Data Bank 生物信息学培训班 Outline 背景简介 蛋白质结构预测算法 常用软件介绍 生物信息学培训班 蛋白质结构预测的主要方法 理论分析方法 预测算法 l该类方法假设蛋白质分子天然构象处于热力学最稳定,能 量最低状态。从原则上来说,我们可以根据物理、化学原 理,通过计算来进行结构预测。 l考虑蛋白质分子中所有原子间的相互作用以及蛋白质分子 与溶剂之间的相互作用,通过理论计算(如分子力学、分 子动力学)蛋白质分子的能量最小状态。 l实际不可行: u自然的蛋

11、白质结构和未折叠的蛋白质结构,两者之间的 能量差非常小 u蛋白质可能的构象空间庞大,针对蛋白质折叠的计算量 非常大 u计算模型中力场参数的不准确性也是一个问题 生物信息学培训班 蛋白质结构预测的主要方法 统计分析方法 l对已知结构的蛋白质进行统计分析,建立序列到结构的映 射模型,进而对未知结构的蛋白质根据映射模型直接从氨 基酸序列预测结构。 l经验性方法: u根据一定序列形成一定结构的倾向进行结构预测 l结构规律提取方法 u从蛋白质结构数据库中提取关于蛋白质结构形成的一般 性规则,指导建立未知结构的蛋白质的模型。 l同源模型化方法 u通过同源序列分析或者模式匹配预测蛋白质的空间结构 或者结构单

12、元(如锌指结构、螺旋-转角-螺旋结构、 DNA结合区域等)。 预测算法 生物信息学培训班 Template-free 从头计算 Ab Initio,Denovo 在Ramachandran plot 指导 下旋转, ,搜索自由能最低 如果两个蛋白质的序列比较相似, 则其结构也有很大可能比较相似。 如果序列相似性75,则可以得 到较高精度的预测结构。 缺点是只能处理和模板库中蛋白质 序列相似性较高的情况。 蛋白质结构预测的主要方法 预测算法 Template-based 同源建模 Homology Modeling 序列足够相似,属同源蛋白 ,则整体结构会很相似 折叠识别 Fold Recogn

13、ition Threading 识别与目标序列有关的结构片段 组合片段,搜索自由能最低 生物信息学培训班 Template-free Template-based 同源建模 Homology Modeling 序列足够相似,属同源蛋白 ,则整体结构会很相似 折叠识别 Fold Recognition Threading 识别与目标序列有关的结构片段 组合片段,搜索自由能最低 从头计算 Ab Initio,Denovo 在Ramachandran plot 指导 下旋转, ,搜索自由能最低 从蛋白质结构数据库中挑选蛋白质 结构建立折叠子数据库,以折叠子 数据库中的折叠结构作为模板; 将未知序列与

14、模板进行匹配,通过 计算打分函数值判断匹配程度,其 中打分最高的被认为是最可能采取 的折叠结构。 蛋白质结构预测的主要方法 预测算法 生物信息学培训班 Template-free 从头计算 Ab Initio,Denovo 在Ramachandran plot 指导 下旋转, ,搜索自由能最低 依据是热力学理论,即求蛋白 质三维结构稳定的状态,也就 是能量最小的状态; 由于巨大的计算量,这种方法 并不实用。 蛋白质结构预测的主要方法 预测算法 Template-based 同源建模 Homology Modeling 序列足够相似,属同源蛋白 ,则整体结构会很相似 折叠识别 Fold Reco

15、gnition Threading 识别与目标序列有关的结构片段 组合片段,搜索自由能最低 生物信息学培训班 蛋白质结构预测流程 预测算法 生物信息学培训班 蛋白质同源模建算法 主要思想: 预测算法 l对于一个未知结构的蛋白质,找到一个已知结构的同源蛋 白质,以该蛋白质的结构为模板,为未知结构的蛋白质建 立结构模型 基本依据: l任何一对蛋白质,如果序列等同部分超过30%,则它们具有 相似的三维结构,即两个蛋白质的基本折叠相同,只是在 非螺旋和非折叠区域的一些细节部分有所不同。 l若序列的等同部分超过60%,则预测结果将接近于实验得到 的测试结果。 l一般如果序列的等同部分大于30%,则可以期

16、望得到比较好 的预测结果。 生物信息学培训班 蛋白质同源模建算法 同源建模(Homology modeling): 预测算法 l又称比较建模(comparative modeling); l基本假设是蛋白质分子结构具有某种规则性,其可能三维 结构的基本形态种类有限,各个形态是由几种特定的氨基 酸序列所构成; l利用已知的蛋白质三维结构(可能由NMR或X-ray确定的结 构)为模板,模拟出未知结构蛋白质序列的空间结构; l一般来说,当未知结构蛋白质序列(target protein)和模板 (template)间的相似性越高,所仿真出来的结构正确性、可 信度也就越高。 生物信息学培训班 蛋白质同源模建算法的步骤 同源建模方法6个步骤: 预测算法 1.搜索结构模板:选择参考的蛋白质分子(Template,T) 2.序列比对:将目标分子(Target)和参

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号