第五章_药物发现的虚拟筛选方法课件

上传人:笛音 文档编号:51484908 上传时间:2018-08-14 格式:PPT 页数:59 大小:8.72MB
返回 下载 相关 举报
第五章_药物发现的虚拟筛选方法课件_第1页
第1页 / 共59页
第五章_药物发现的虚拟筛选方法课件_第2页
第2页 / 共59页
第五章_药物发现的虚拟筛选方法课件_第3页
第3页 / 共59页
第五章_药物发现的虚拟筛选方法课件_第4页
第4页 / 共59页
第五章_药物发现的虚拟筛选方法课件_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《第五章_药物发现的虚拟筛选方法课件》由会员分享,可在线阅读,更多相关《第五章_药物发现的虚拟筛选方法课件(59页珍藏版)》请在金锄头文库上搜索。

1、第五章第五章 药物发现中的虚拟筛选药物发现中的虚拟筛选1第一节 概述2发 表 论 文 数 目搜寻的基本要素: 搜寻标准;化合物 库;计算方法基本方法3两类方法4数据库第二节 小分子结构的化学信息学处理化学信息学Chemoinformatics,chemical informatics,Cheminformatics, chemi-informatics利用计算机信息处理技术对化学分子结构和相关 信息进行管理的一种综合性技术和学科,应用化 学信息学可促进化学信息的获取、转化与共享。5一、2D和3D分子结构的计算机处理方法 化学分子结构的层次6(一)以一维形式表示 对2D结构进行编码储存和交换化学

2、结构式数 据的命名法 SMILES( Simplified Molecular Input Line Entry System,简化分子线性输入系统) SLN(Sybyl linear notation,Sybyl线性标记法)78SMILES 按化合价模型,每个原子被氢原子饱和;双键 用=表示;三键用#表示;环化分子用闭合原子 序号表示;芳香环中不饱和原子用小写字母表 示,分支用括弧表示甲烷CH4 C 乙醇C2H5OH CCO 氰化氢HCN C#N 环已烷C6H12 C1CCCCC1 吡啶C5H5N n1ccccc12-Propanol CC(O)C(二)以二维形式表示9 连接表表示1011(

3、三)以三维形式表示1、直接坐标法 用迪卡尔坐标直接存储每个原子的三维坐标 (x, y, z)2、内坐标法 每个原子位置以与其他原子间的3个相对位 置关系表示距离、夹角、二面角12(四)分子存储格式及其相互转换每一软件系统都有自己的分子存储格式 MDL公司的MOL格式 Tripos公司的MOL2格式 剑桥晶体数据库CSD的FDAT和CIF格式 蛋白质数据库PDB的PDB格式(ENT格式)13 基本存储:分子的元素组成、原子坐标、原子连接关系 还能存储:分子子结构信息,能适用于生物大分子原子电荷信息,调用时不必再计算确定特定原子化学环境的原子类型信息14二、化合物数据库的生成和管理输入 搜寻和检索

4、 管理 输出15ISIS (Integrated Scientific Information Management System)MDL的综合性结构和反应管理软件由三个主要分软件组成: (1) ISIS/DRAW用于输入结构式和搜寻询问条 件 (2) ISIS/BASE用于生成局部数据库及处理信息 (3) ISIS/HOST主服务器应用程序,进行通讯连 接,集中数据库数据并作处理162D结构输入计算机绘制化学结构式 首先输入原子和键的骨架结构 ,原子数、电荷会自动变为上 下标 软件的模板中收集大量分子片 段 可智能分析结构式,处理结构 式的编码和变换 还可有附加功能,如自动命名 、化学计算、

5、光谱分析等172D结构转化为三维结构18常用化合物数据库 FCD (Fine Chemicals Directory) MDL 维护。收载约90 000化合物数据,包括化学系统名、俗称、分子式、分子量 、供应商、价格、CAS登录号、纯度等。可通过结构式或 其它任何数据检索 ACD (Available Chemicals Directory)MDL维护。FCD数据库加上可大批量供货的化学品信息。目前有25万 个化合物 CSD(Cambridge Structure Database) 20多万个结晶 的3D结构实验数据及相关数据 ZINC database19ZINC20第三节 靶标大分子的生

6、物信息学处理 生物信息学基于数学、生命科学、化学和计算机科学的交叉学科利用计算机信息处理技术对大量生物大分子作信息获 取、加工、储存、分类、检索与统计分析,揭示生物 大分子的分子结构、功能、同源性和进化关系推动生命科学的发展,为创新药物的研究和开发奠定 基础21生物信息学的内容建立可贮存和管理大 量生物信息学数据集 的数据库 处理大量数据的算法 和统计方法分析和解释不同类型 的生物数据,如RNA 、DNA和蛋白质序列 、蛋白质结构、基因 表达以及生化途径22生物信息学的应用一、核酸和蛋白质的序列分析( sequence analysis)(一) 单个序列分析 根据单个氨基酸的物化性质推测整个蛋

7、白质的性 质,也可预测二级结构出现的可能性23 根据统计值:Glu经常出现在-螺旋中;Val常在 -折叠中发现, Pro通常不出现于-螺旋中和 折 叠中,而倾向在回折中24(数值=1代表偏好处于平均;1代表偏好大于平均;1代表偏好小于平均)(二)双重序列比较序列比对sequence alignment25序列对比可以用各种矩阵表达并作相似性 打分,两个残基越相似则打分值越高(三)多重序列比对 multiple sequence alignment26H.X. Liu, et. al. MOLECULAR PHARMACEUTICS 2010,7,1,75-85多重序列比对可以从 细节上更多揭示

8、保守 模式和结构信息, 可 采用多种统计算法进 行多重序列比对二、蛋白质三维结构预测27主要预测方法281、从头预测法(ab initio prediction)采用理论计算(分子力学、分子动力学、量子化学)方 法,直接从分子和原子参数计算出蛋白质分子的稳定构 象。理论上最理想的方法,但计算量极大,对于实际分子的 计算超过能力范围。29比较分子模拟法comparative molecular modeling 同源模建homology modeling 同源蛋白法protein homology building 根据已知的蛋白质三维结构来预测可能的三维结 构基于知识的预测 同源蛋白有着相似的

9、来源、相似的结构和生物功 能。通过比较蛋白序列的相似性,按同源蛋白的 三维结构为模板,构建未知蛋白的结构 一般要求同源性在30%以上,特别是在结合区域 同源性要好302、同源蛋白模建法homologous model步骤:(1)根据未知蛋白质的序列,寻找同源蛋白(2)二重或多重序列对比(3)找出共同的二级结构区域,构建骨架(4)对初始模型作能量优化(5)判断结构合理性313、穿针引线法,线串法,线程法,折叠识别( threading,fold recognition)根据已知的蛋白质三维结构来预测可能的三维结 构基于知识的预测 可应用于进化非常疏远的结构预测 未知蛋白序列与折叠库中已知结构的蛋

10、白序列作 匹配计算,将序列吻合的三维结构模块串连起来 ,得到整个蛋白三维结构3233三、代表性生物信息学数据库(一)核酸数据库 GenBankNIH所属国家生物技术信息中心NCBI Nucleic Acid Database(NDB) 由European Molecular Biology Laboratory( EMBL)创建,现由 英国剑桥的欧洲生物信息学研究所( European Bioinformatics Institute, EBI)维护 DNA Data Bank of Japan(DDBJ)日本国立遗 传学研究所的日本信息生物学中心(Center forInformation

11、Biology, CIB)开发维护三大库可交互34(二)蛋白质数据库 PDB ( Protein Data Bank at Brookhaven National Laboratories ) 美国 Research Collaboration for Structural Bioinformatics, RCSB开发维护的多肽、酶、病 毒、碳水化合物和核酸的三维结构数据35http:/www.pdb.org/第四节虚拟筛选(virtual screening )计算机辅助筛选(computer-aided screening)计算机筛选(screening in silico)三维结构搜寻(

12、three-dimensional structure searching)虚拟: 计算机上进行不需要化合物,只需结构 化合物数据库实际分子的索引;虚拟分子;类药性分子36一、基于靶点结构的虚拟筛选对接 target-based virtual screening docking3738虚拟筛选3940虚拟筛选的具体流程41包括4个步骤:受体模型的建立;小分子库的产生;计算机筛 选和命中化合物的后处理。 第一步,受体模型的建立: 蛋白质结构的准备是虚拟筛选的重要一步。虚拟筛选的蛋 白靶标的结构可以从PDB库 (http:/www.rcsb.org/pdb/index.html)中直接下载使用

13、也可以通过和家族中同源蛋白的序列、结构信息比较,同 源模建而得1)大分子结构获取2、靶点处理: 加氢原子、加电荷、带电残基的质子化42第二步,建立小分子数据库(最为常用的小分子数据库 Zinc数据库) 3D结构转化 结构优化 加电荷 类药性分析 多样性分析43第三步,对接和打分,这一步是虚拟筛选的核心步骤。 对接操作就是把每个小分子放到受体蛋白的配体结合位 点,优化配体构象和位置,使之与受体有最佳的结合作 用,给最佳结合构象打分,对所有化合物根据打分排序 ,然后从化合物库中挑出打分最高的小分子。 能量和空间匹配44第四步,最后一步是命中化合物的后处理 通过计算分子的类药性质ADME/T (吸收

14、absorption 、器官分布distribution、体内代谢metabolism、排泄 excretion 和毒性toxicity)性质的估算,排除那些不具 有类药性质的分子。 可以利用一些经验规则如“五规则” 等,快速排除 那些不适合进一步药物开发的分子。 通过以上四步处理,大部分分子从化合物库中剔除,形成 一个合理大小的化合物库,仅对这些适合成药的化合物或 购买、或合成、或分离得到,然后再进行实际的生物测试 。 45例: SARS冠状病毒3C-like蛋白酶抑制剂的发现熊兵等人结合同源模建、分子虚拟筛选的方法设 计了抗SARS冠状病毒3C-like蛋白酶的抑制剂。 SARS冠状病毒3

15、Clike蛋白酶在SARS病毒其他功能蛋 白的形成过程中起重要作用,阻断SARS病毒3Clike 蛋白酶的作用可以阻止SARS病毒的复制,并最终达到 治疗SARS的目的 。46在TGEV的主蛋白酶三维晶体结构的基础上,构建了 SARS病毒的3Clike蛋白酶三维结构 SARS病毒的3C-like蛋白酶的三维模建结构 47通过序列联配和采用MOLCAD/SYBYL活性位点分析,表明SARS病 毒3C-like蛋白酶和TGEV主蛋白酶两者的结合口袋比较类似 同一结构家族的组织蛋白酶抑制剂分别与SARS冠状病毒3C-like蛋白酶 和TGEV的主蛋白酶的复合物模型如图,从图中可以看出两者的作用模式也

16、是十分类似。SARS病毒3C-like蛋白酶和TGEV主蛋白酶与抑制剂结合图 48在SARS病毒3C-like蛋白酶活性位点确定之后,再通过查 询MDDR (MDL Drug Data Report)数据库得到了73个蛋 白酶抑制剂的小分子数据,对SARS病毒3C-like蛋白酶和 TGEV的主蛋白酶进行了分子对接参数的调节和优化。 结果表明大多数分子与两个蛋白酶的结合相似,并且对 DOCK打分进行相关性分析,表明结合能力较为一致。 在优化好的3C-like蛋白酶的三维结构模型和DOCK对接程序参数的基础上,对含有数十万多个小分子化合 物库。 49用DOCK 4.0初筛,从每一个数据库筛选结果中选择 DOCK打分前1000名的分子,进一步做类药性分析和

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号