药效团模建及三维结构数据库搜寻 7.1 分子三维结构数据库简介 7.1.1 蛋白质结构数据库PDB 蛋白质结构数据库PDB(protein Data Bank),由美国Brookhaven National Lab开发,是国际唯一的生物大分子结构数据库主要收集的数据来源于X-光晶体衍射和核磁共振(NMR)的数据,提供免费的数据库检索和下载任务,并且PDB数据还可以从发行的光盘获得 PDB数据库以文本文件的方式存放数据,每个分子各用一个独立的文件除了原子坐标外,还包括物种来源、化合物名称、结构递交者以及有关文献等基本注释信息此外,还给出分辨率、结构因子,温度系数、蛋白质主链数目、配体分子式、金属离子、二级结构信息、二硫键位置等和结构有关的数据 可以用RASMOL、Spdbv等分子图形软件来进行分析和图像显示 PDB结构库是药物设计的一个重要的结构来源 可以直接从这儿得到生物大分子靶标的三维结构或高同源性蛋白的结构 http:/www.rcsb.org/pdb/ 7.1.2 小分子数据库 小分子数据库收集了各种已知的合成小分子化合物或从天然产物中提取的化合物结构以及用计算机方法产生的虚拟化合物,在计算机辅助药物设计中,主要用于基于分子性质、药效基团和分子对接的数据库搜索。
一 ) 剑桥小分子数据库 剑桥结构数据库(Cambridge Structural Database, CSD)是基于X-光和中子衍射实验唯一的有机小分子及有机金属分子晶体结构数据库 是发展新的药物、材料及化学化工产品的一个有力的工具详细的信息可以浏览其网站www.ccdc.cam.ac.uk ( 二 ) MDL数据库 (1)ACD数据库 现有化学品目录三维结构数据库(ACD-3D)为标准的现有化学品目录数据库(ACD)提供了三维结构模型使用三维结构查寻现有化学品目录数据库,可以有效地查找到能买到的具有潜在活性的候选化学品,而不需再去合成 ACD-SC是MDL公司为了迎合高通量筛选而开发的数据库 ,这一数据库提供了化学品供应商所能够提供的超过一百五十万个化合物的三维结构及相关信息这些信息包括:纯度、形态、等级、可提供的数量、价格、供应商的地址、电子邮件、及各地的代理商等详尽信息ACD-SC每个季度更新一次 (2) 药物数据报道三维结构数据库(MDDR-3D) 该数据库是在标准MDL药物数据报道数据库(MDDR)中加入三维结构模型三维结构特征和生物活性资料相结合的查寻,可以用来探索结构和活性之间的关系、验证药效基团假设、确定组合化学的框架。
MDDR-3D含有大量信息,并且覆盖面广,这些特点使得它成为辅助合理药物设计的有效工具,是从最新研究中产生新思路的最佳源泉 (3)综合药物化学三维结构数据库(Comprehensive Medicinal Chemistry-3D) 它是根据Pergammon出版的综合药物化学一书所载的信息发展而成的 综合药物化学三维结构数据库含有7,900多种化合物,包括它们的二维结构、三维模型以及重要的生化特征所有这些化合物曾作为药物试剂进行过人体实验数据包括药物名称同义词、药物分类、LogP值和pKa值,还包括美国化学文摘社(CAS)登录号和参考文献 综合药物化学三维结构数据库中的药物信息中含有已知的和人们关注的生物活性,从而使它成为一种探索构效关系(SAR)、假定和改进药效基团特性等十分有用的工具 (4)NCI-3D数据库 美国国家癌症研究院(NCI)将其测试过的21万多种具有2D和3D结构的化合物制成了文本文件每个化合物都有CAS登录号MDL将该数据库进行了转换,以便与ISIS连用这些资料属于公用范畴 (5)AIDS数据库 AIDS数据库中包括了经过美国国家癌症研究院(NCI)测试过AIDS抗过滤性病原体活性的42,687个化合物的数据,数据内容除了有NSC号、CA登记号、化学名等基本信息外,还包括了EC50值、LC50值、活性等级以及化合物二维、三维结构等药物研究者非常关心的信息。
同时,作为MDL的公共数据库之一,购买了ISIS/Host的用户只需和MDL签订一份使用协议就可免费使用该数据库,更详细的信息请查询MDL数据库网站http:/ ( 三 ) 天然产物数据库 天然产物,特别是其新颖的结构,是创新药物设计重要的来源之一,China Natural Product Database (CNPD) 是创腾科技有限公司和中国科学院上海药物研究所联合开发的中国天然产物数据库,天然产物库包含近60000条化合物商业版数据库包含12521条记录选用ISIS Base作为数据库管理软件一方面它可以提供天然产物三维结构信息,利用分子对接技术,我们可以寻找到与特定受体有特异结合的天然产物,从而开发出高效、高选择性的天然产物药物,同时也可以研究天然产物在体内的作用机理另一方面,数据库还可以提供植物来源、传统功用、参考文献等重要信息随着中草药中的天然产物数据的积累,还可以扩展成中药方剂库,有利于中药方剂作用机制的研究天然产物数据库界面图 现有供虚拟筛选的商业化合物数据库 数据库库名称公司化合物数网址ACD-3DMDL409,123http:/ 2,000,000http:/ 科技&上海药药物研究所45,055http:/ Corporation50,000http:/ Company5,000http:/ Ltd162,609http:/ Scientific, Inc.3,425http:/ Cambridge Crystallographic Data Center272,000 http:/www.ccdc.cam.ac.uk/3D Molecular Modeling Database, Tokyo University1,000http:/triton.ps.toyaku.ac.jpNCI Drug Information System 3D Database, National Cancer Institute400,000http:/dtp.nci.nih.gov/NCI Database250251http:/129.43.27.140/ncidb2/SPECS200,000http:/ http:/blaster.docking.org/zinc/byvendor.shtml7.2 类药性分析 化合物的类药性(druglike)研究犹为重要,并且被广泛地应用到组合化学库的合成和小分子数据库的虚拟筛。
Walters 和Murcko定义化合物类药性为:含有和大多数现有药物分子相同的结构功能团或物理性质 Lipinski对2245个WDI数据库中已经到达临床II期以上的药物分子的结构特征进行了系统的研究,提出了著名的预测化学物口服生物利用度的“五倍律”规则: 1. 简单的计算方法 n 分子量MW 小于等于 500; n 油水分配系数 logP小于等于 5; n 氢键供体数小于等于5;n 氢键受体数小于等于10; 如果化合物有两条规则不满足,则该化合物的口服生物利用度可能有较大的问题,不过这个规则只适用于被动转运的情况,对抗生素、抗真菌药、维生素等药物不满足 Opera等进一步发现: 药物分子的可旋转键小于等于8,环的数目不大于4 类药性相关参数的范围 参数最小最大LOGP25分子量200500氢键给 体05氢键 受体0 10摩尔折射率40130旋转键 数目08重原子数目2070极性表面积0120电荷22 Ghost等从6304个CMC数据库中确定了分子量、摩尔折射率和重原子个数的范围 2.功能基团的方法 药物分子和非药分子之间的结构有一些显著的不同,在CMC和MDDR数据库中的药物分子比ACD数据库中的非药分子有更多的功能基团 Muegge等提出了一种基于药效基团过滤(pharmcophore point fliter) 的方法来鉴别化合物的类药性,药效基团包括胺、氨基化合物、醇、酮、砜、磺胺基、羧酸基、氨基甲酸、胍、脒、脲、酯。
药效基团过滤模型I (pharmcophore point fliter I)的方法用来区别药物和非药物分子,基本的规则包括:1.药效基团连在一起或被少于两个重原子分开计数为一个;2. 少于两个或多于七个药效基团的小分子无法筛选出来;3. 吡咯和二嗪类除外的胺认为药效基团;4. 剔除含多于一个羧酸基团的化合物;5. 剔除含没有环的化合物;6.同一环上的胺基看成一个药效基团 大多数药物都符合药效基团过滤I规则,如MDDR和CMC数据库中2/3的药物分子可以识别出来而ACD数据库中只有1/3被鉴别为药物 7.3 药效基团及三维结构数据库搜寻 药效基团(3D-Pharmacophore)指这些在药物分子识别中起重要作用的原子和基团及它们的三维空间排列 药效基团模型间接给出了受体活性结合口袋的形状、静电以及构象特征 经典的药效基团包括氢键供体、氢键受体、带电或离子基团、疏水基团、芳香基团以及这些原子或基团的空间距离、角度和二面角等几何限制等 三维药效基团模型的构建有两种方法 1)靶标的结构不明了,只能从配体的信息中构建三维药效基团模型 2)基于靶标的结合位点的结构,当靶标的结构和有一定活性的配体已知时,药效基团模型可以直接从靶点和配体复合物的结构中得到。
7.3.1 基于配体的药效团模型如果没有受体的结构,三维药效基团模型的构建包括两步 第一步是分析已知配体确定药效基团的基本特征 第二步联配小分子的活性构象得到最佳的药效团特征 同一靶标的一系列小分子的药效基团的构建一般步骤包括: (一) 配体的选择 配体的选择将大大地影响药效基团的结果,一般考虑三个方面的因素:配体的有无活性,所选的配体集的大小和分子的多样性1)配体有无活性与否 在大多数方法中,仅仅考虑有活性的配体,并且认为配体的活性是一样的,例如Crandell-Smith, RAPID 和HipHop方法;有些方法把没有活性的配体也考虑进来,通过比较活性分子和无活性的构象和体积,得到影响活性的必要的结构特征;如DISCO方法还有一种方法就是就是利用一系列不同活性配体的构建药效基团,HypoGen (2)配体集的大小 大多数方法一般只处理分子数少于100的配体集,如HipHop、HypoGen、MPHIL和RAPID;有一种方法从众多的小分子中提炼出一个较小的分子集,通过对小分子的活性进行排序,选择活性最好的一部分小分子,这种方法的缺点就是忽略了不少小分子并且影响很大SCAMPI方法是一种从10002000个配体中构建药效基团的方法。
3)分子的多样性 为得到一个合理的药效基团模型,小分子集需要尽可能多的结构多样性这有助于知道哪些是影响小分子结合因素,剔除的配体应该对所构建的模型没有太大的影响但是需要记住的很不一样的小分子配体可能结合在不同的结合部位,所以可能导致一个错误的药效基团 (二) 构象分析 一般的方法就是药效基团通过配体全构象空间中提取一系列的构象来构建 1)低能构象2)模式识别和构象搜索的方法结合在一起,如GASP和GAMMA (三) 特征的提取 药效团特征的提取主要包括三方面的因素 基于原子: 这是一种最简单的形式,如定义一个特征为一个特定原子类型的原子的三维座标 基于拓扑: 原子被组合为某些拓扑特征如苯环和羰基 基于功能 :原子被组合为某些具有重要作用的化学功能特征,如 氢键受体、氢键给体、中性基团、酸性基团、芳香环和疏水基团 代表化学基团最简单的方式 就是它们的中心的位置,一般,中性基团,酸性基团,氢键供体与给体的中心通常通过一个实际原子的位置来定义,而疏水区域或芳香环的中心定义为基团的质心 化学基团更精确的表示 就是一些几何特征也显示出来,如氢键的给体和供体用一个矢量来表示;矢量给出了配体和受体非共价键的方向;如果氢键的方向不明确,其范围通过一个矢量集或球集来表示;另外,用球集来代表疏水基团、平面来代表芳香环。
四) 结构提取 把所提取配。