第12章 结构信息与QSAR课件

上传人:w****i 文档编号:91525438 上传时间:2019-06-29 格式:PPT 页数:117 大小:19.38MB
返回 下载 相关 举报
第12章 结构信息与QSAR课件_第1页
第1页 / 共117页
第12章 结构信息与QSAR课件_第2页
第2页 / 共117页
第12章 结构信息与QSAR课件_第3页
第3页 / 共117页
第12章 结构信息与QSAR课件_第4页
第4页 / 共117页
第12章 结构信息与QSAR课件_第5页
第5页 / 共117页
点击查看更多>>
资源描述

《第12章 结构信息与QSAR课件》由会员分享,可在线阅读,更多相关《第12章 结构信息与QSAR课件(117页珍藏版)》请在金锄头文库上搜索。

1、12.1 结构与物性数据的采掘 12.1.1 QSAR中常用的结构参数及理论计算 12.1.2 Internet上的结构化学信息资源 12.2 2D-QSAR 12.2.1 多元线性回归 12.2.2 模式识别方法 12.2.3 人工神经网络 12.2.4 支持向量机简介 12.3 3D-QSAR:CoMFA和CoMSIA 12.4 3D以上的QSAR简介,结构与物性的关系是结构化学的重要内容, 也是化学中一个带有根本性的基础理论问题。获取所需的结构信息,并与物性数据关联,得到定量构效关系(QSAR)或定量构性关系(QSPR),进一步指导化学实践,这个问题涉及计算化学、化学信息学、化学计量学等

2、多种学科。 认识到化合物的性质与其结构相关,并可借数学来描述,是19世纪后期的事。20世纪40年代,Hammett提出线性自由能关系, 开QSAR研究之先河。但真正推动这种研究大规模开展的是Hansch等人在20世纪60年代对药物分子QSAR的创造性研究,其主要目的是减少药物合成与试验的盲目性,提高研发效率,降低研发费用。,计算机辅助药物设计(CADD)自然成为十分活跃的研究领域。 CADD依据的基本原理是受体-配体关系。按照是否已知和利用受体的三维结构数据,CADD方法分为两类: 1. 不依赖于受体三维结构的方法。如2D的Hanch方程、3D的CoMFA和CoMSIA等。 2. 依赖受体三维

3、结构的方法:在已知受体三维结构的情况下,有针对性地进行分子设计,代表性方法有Ludi、Leapfrog、GRID、DOCK等。,构效关系(或构性关系)研究是用某些数学方法将结构参数与活性(或物性)数据关联起来:,结构参数,物性,QSAR/QSPR,合成,应用,物性,结构,这种关系可以看做是下列循环中的一部分:,对一个具体问题,QSAR研究选择哪些结构参数,往往是成败的关键。结构参数也称为变量、特征或描述符。常用的有以下几类: 1. 拓扑描述符:反映分子中原子及化学键的类型、数目及其在二维空间的连接关系。常用的拓扑指数有分子连接性指数、Randic分枝指数、Winer指数等,可用一些程序,例如T

4、OPIX来计算。,2. 几何描述符: 反映分子三维结构的几何特征,例如分子体积、分子表面积、分子立体参数等。许多计算化学程序可给出这类参数,例如,在HyperChem中,用菜单命令Compute QSAR Properties打开下列对话框,选择要计算的参数即可。,3. 电子描述符: 如电负性、HOMO能级、LUMO能级、超离域度、原子电荷密度、原子半径、电荷-半径比、键级,。计算这些参数是量子化学最好的用武之地。,4. 理化描述符:物质的理化特征可用物理化学参数来描述,如化合物的疏水参数、熔点、沸点、蒸气压、溶解度等,这些参数多半是实验数据,但有些也可以计算出来。,用HyperChem计算A

5、spirin分子的疏水参数logP,5. 谱图描述符:例如,化合物某种基团中13C的NMR化学位移, 质谱上的质荷比me, 振动光谱或电子光谱上的吸收峰波数,等等。 6. 化学组成描述符:例如,某类无机物或有机物的化学组成、某些元素含量的比值等。 ,1. 通用资源搜索引擎 通用资源搜索引擎很多,多数已为人们熟知。例如 百度 http:/ Google http:/.hk Yahoo http:/www. Yahoo. comsciencechemistry lnfoSeek http:/www. infoseek. com AltaVista http:/www. altavista.digi

6、tal. com Excite http:/www. excite. com Lycos http:/www. lycos. com ,2. 化学资源导航系统 这种导航系统非常多,仅举数例:,中国科学院化工冶金研究所计算化学开放实验室 化学信息资源导航系统ChIN(新版本) http:/ 中国科学院上海有机化学研究所 http:/202.127.145.116/hxwzdh.htm,美国加州大学洛杉矶分校(UCLA)化学和生物化学系 http:/www.chem.ucla.edu/chempointers.html 从该网站提供的链接, 可以很快找到大量的化学信息.,在化学信息数据库中, 化学

7、结构数据库占有很大的比例。如果熟悉这些网站或数据库,不必使用搜索引擎就可直接链接。本节摘要介绍,以供参考。,化学结构数据库,美国国家标准与技术研究院(NIST)开发: Chemistry WebBook http:/webbook.nist.gov/chemistry/,印第安纳大学分子结构中心 http:/www.iumsc.indiana.edu/ 晶体结构和分子图来源,中国科学院计算机化学开放实验室 http:/202.127.145.116/molinformatics.htm,曼彻斯特大学-结构化学部 http:/spec.ch.man.ac.uk/Structural_Chemis

8、try.html,Ponder实验室WWW服务器 http:/dasher.wustl.edu/ 主要内容为计算化学与分子模型,维也纳大学-理论化学学院 http:/www.itc.univie.ac.at/,辛辛那提大学-OBR计算机辅助分子设计中心 http:/www.obr-camd.che.uc.edu,乔治亚大学-计算量子化学中心 http:/zopyros.ccqc.uga.edu/,国际晶体学联合会 http:/www.iucr.ac.uk/,剑桥晶体结构数据中心 http:/www.ccdc.cam.ac.uk,布鲁克海文蛋白质数据库 http:/www.rcsb.org/pd

9、b/ 蛋白质、DNA、RNA、病毒、碳水化合物等生物大分子的3D结构数据库,含原子坐标、一级序列与二级结构信息、晶体结构因子和2D NMR数据.,美国矿物学家晶体结构数据库http:/www.geo.arizona.edu/xtal-cgi/test,矿物结构数据库 http:/database.iem.ac.ru/mincryst/search.php3 矿物的晶体结构参数和衍射资料,可由化学式首字母、晶体结构等检索.,矿物数据库 http:/ http:/www.zeolites.ethz.ch/zeolites/FMPro?-db=Atlas_main.fp5&-lay=web%20la

10、yout&-format=DisordStructures.htm&-view,晶体学免费数据库资源 http:/www.crystalstar.org/resourcelink/Resources.htm,X射线粉晶衍射数据索引 http:/www.crystalstar.org/resourcelink/xrayindex.htm,粉末法结构测定实例库 http:/sdpd.univ-lemans.fr/iniref.html,X射线应用数据库(DABAX) http:/www.crystalstar.org/resourcelink/dabax/dabax.htm,SDBS有机化合物谱图

11、库 http:/www.aist.go.jp/RIODB/SDBS/menu-e.html,红外光谱网站 http:/ http:/,Geneva大学-电子顺磁共振网站 http:/www.unige.ch/epr,美国国家标准与技术研究院(NIST)物理实验室 http:/physics.nist.gov/cuu/Constants/index.html 物理化学参数,Cambridgesoft公司网络服务 CS Finder http:/ 化合物的分子结构、分子量、熔点、沸点、密度、溶解度等数据。,马萨诸塞大学-Auerbach组 http:/samson.chem.umass.edu/

12、计算化学与材料化学,中国材料公布板 http:/www.C,分子研究协会 http:/www.molres.org/ 主要内容为计算机辅助药物设计与毒性鉴定、计算,实验生物化学与医药学。,动态浏览网上分子结构,当一化学数据库文件中有用多媒体网际邮件扩展(MIME)协议表示的分子结构图形时,为了显示它就必须安装化学 MIME显示程序。,(1)WebLab Viewer:由MSI公司开发的3D分子模拟软件。MSI公司改名为Accelrys后,WebLab Viewer也更名为Accelrys Viewer。有普通版、Lite板和Pro版。Pro版本即为ViewerPro,功能强大,可读取Tripo

13、s、Cerius2、Catalyst、InsightII、MDL等软件的不同格式文件并进行转换,以线状图、球棍图、CPK、带状图等多种风格显示无机、有机、生物大分子及晶体结构,用鼠标进行三维操作:,(2)Rasmol:可以从 Internet上获得(ftp:/ftp. dcs. ed.ac. ukpubrasmol)。Rasmol能够处理多种格式的分子数据文件,以球状、棒状、球棒等方式显示并进行多种处理,如旋转、缩放、识别原子或基团等。,(3)Chime:下载网址为http:/ 常用的有回归分析、模式识别、人工神经网络(ANN)、支持向量机(SVM)等。,物性与各种结构参数的关系,广义上是因变

14、量与自变量的关系。若这种关系相当确定,就称为函数关系;若关系不很确定但又有某种联系,则称为统计相关,简称相关。实际上,函数与相关并没有绝对的界限。 回归分析是处理变量的相关关系的一种数理统计方法。QSAR研究常用的是多元线性回归(MLR),它用数学方法找出因变量Y与一组自变量Xi之间的线性回归方程。 MLR给出的是定量构效关系,物理意义明确。使用这种方法的前提是:各个自变量应尽可能相互独立而不相关,样本数目至少是描述符数目的3倍,最好达10倍以上。,12.2.1 多元线性回归,在化学中, MLR最成功、最广泛的应用是Hansch等人基于下列假设提出的方程: 取代基对药物分子活性lg(1/C)的

15、影响,主要与取代基疏水效应参数、电子效应参数和立体效应参数Es有关,这些效应彼此独立且可累加: C是根据ED50、LD50、I50等定义的活性指标。 有些化合物的活性与呈非线性关系:,氟哌酸是喹诺酮类抗菌药的一类,商品名为诺氟沙星,由古贺弘利用Hansch方程进行了一系列QSAR研究而设计。活性的理论计算值为6.38, 实验值为6.63。这是Hansch方法指导药物设计的成功范例。,1. 模式识别的概念 QSAR研究常用的另一大类方法是化学模式识别(CPR), 也称多元统计分析。按是否需要训练集可分为监督模式识别与无监督模式识别两大类。具体算法很多,如主成分分析(PCA)、非线性映射(NLM)、聚类分析(CA)、簇类独立软模式(SIMCA)

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号