计算机药物辅助设计cadd幻灯片9-10

上传人:F****n 文档编号:88167522 上传时间:2019-04-20 格式:PPT 页数:78 大小:17.62MB
返回 下载 相关 举报
计算机药物辅助设计cadd幻灯片9-10_第1页
第1页 / 共78页
计算机药物辅助设计cadd幻灯片9-10_第2页
第2页 / 共78页
计算机药物辅助设计cadd幻灯片9-10_第3页
第3页 / 共78页
计算机药物辅助设计cadd幻灯片9-10_第4页
第4页 / 共78页
计算机药物辅助设计cadd幻灯片9-10_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《计算机药物辅助设计cadd幻灯片9-10》由会员分享,可在线阅读,更多相关《计算机药物辅助设计cadd幻灯片9-10(78页珍藏版)》请在金锄头文库上搜索。

1、2019/4/20,药物的化学信息计算机系统,化学信息学,(Chemoinformatics,chemical informatics, Cheminformatics, chemi-informatics),利用计算机信息处理技术对化学分子结构, 性质,来源及用途等相关信息进行管理(包括储存,分析,处理,检索和传递等)的一种综合性技术和学科。 应用化学信息学可促进化学信息的获取、转化 与共享,化学信息处理,2D:,3D:,H3C,C,化学分子结构的层次 1D: CH3CHO O,H,* 一、2D和3D分子结构的计算机处理方法,(一)以一维形式表示 对2D结构进行编码储存和交换化学结构式数据

2、的命名法, SMILES( Simplified Molecular Input Line Entry System,,简化分子线性输入系统), SLN(Sybyl linear notation,Sybyl线性标记法),*,SMILES 按化合价模型,每个原子被氢原子饱和;双键用= 表示;三键用#表示;环化分子用闭合原子序号表 示;芳香环中不饱和原子用小写字母表示,甲烷,CH4,C,水 乙醇,H2O O C2H5OH CCO,氰化氢 HCN C#N,环已烷 C6H12,C1CCCCC1,吡啶,C5H5N n1ccccc1,*, 分子中分支用()表示;用 / 和 表示双键顺反异 构; 对映异构

3、:手性原子用 表示, 表示反时 针,表示顺时针,反式二溴甲烷 顺式二溴甲烷 L-丙氨酸 D-丙氨酸,Br/C=C/Br 或 BrC=CBr BrC=C/Br 或 Br/C=CBr NCH(C)C(=O)O NCH(C)C(=O)O,*, 用图表示, 用矩阵表示,C,C,C,C C,C,C,N C,H,H,C O,H,O,*(二)以二维形式表示, 用连接表表示,*,(三)以三维形式表示 1、直接坐标法 用卡迪尔坐标直接存储每个原子的三维坐 标(x, y, z),*,每个原子位置以与其他原子间的3个相对 位置关系表示距离、夹角、二面角,r1和r2为键长,为键角,为扭转角,8,7,6,5 1,4,3

4、,2,1,3,7,8,6,2 4, 5,z,r2,r1,y,1,2-二氯乙烷,*2、内坐标法,(四)分子存储格式及其相互转换 每一软件系统都有自己的分子存储格式 MDL公司的MOL格式(MACSS格式) Tripos公司的MOL2格式 剑桥晶体数据库CSD的FDAT和CIF格式 蛋白质数据库PDB的PDB格式(ENT格式),*,基本存储: 分子的元素组成、原子坐标、原子连接关系 还能存储: 分子子结构信息,能适用于生物大分子 原子电荷信息,调用时不必再计算 确定特定原子化学环境的原子类型信息,*,二、化合物数据库的生成和管理 输入 搜寻和检索 管理 输出,合成反应信息管理软件及数据库,目的:用

5、于计算机获取,管理,搜寻,检索合成反应,包括反应物,产物的结构式及其反应的有关信息,计算机辅助有机合成: 应用计算机合成反应管理软件从反应数据库中寻找和检索合成反应方法,合成反应信息管理软件及数据库,管理软件的功能: 输入: 绘制反应物和产物结构,输入其他反应信息,搜寻与检索:一般用户绘制出并指明产物或反应物结构。,ISIS (Integrated Scientific Information Management System) MDL的综合性结构和反应管理软件 由三个主要分软件组成: (1) ISIS/DRAW用于输入结构式和搜寻询问条件 (2) ISIS/BASE用于生成局部数据库及处理

6、信息 (3) ISIS/HOST主服务器应用程序,进行通讯连 接,集中数据库数据并作处理,2D结构输入: 计算机绘制化学结构式 首先输入原子和键的骨架结构,原子数、电荷会自动变 为上下标 软件的模板中收集大量分子片段 可智能分析结构式,处理结构式的编码和变换 还可有附加功能, 如自动命名、化学计 算、光谱分析等,三维结构的转化: 3D结晶结构转入3D数据库 软件将2D化学结构迅速地转为3D模型,N H,H N,CH3,O,CH3O,三.组合化学信息管理软件及数据库,意义:产生先导化合物的有效方法,库中化合物既可是分子实体,也可是虚拟化合物,库的质量指标:化学多样性,先导化合物优化,例:五肽的合

7、成,用20种天然氨基酸合成的五肽,组合起来有以下种: 二聚体 202=400 三聚体 203=8000 四聚体 204=160,000 五聚体 205=3200,000,分子相似性和多样性分析 数据库的化学多样性(chemical diversity) 数量巨大的、结构不同的贮藏和检索系统适用于 先导化合物发现 数据库的化学相似性(chemical similarity) 适用于先导化合物优化,化学多样性的定量表达 Tanimoto系数 用化学空间中电荷和电势等描述符比较不同分子的性质 TC = c /(a+b-c) a为A中基础片断的描述符的数目; b为B中基础片断的描述符的数目; c为共有

8、的基础片断的描述符的数目 相同分子TC = 1;分子没有共同描述符时TC = 0,四、化学信息学资源 FCD (Fine Chemicals Directory) MDL 维护。 收载约90 000个化合物和20 000种化合物数据,包括 化学系统名、俗称、分子式、分子量、供应商、价格、 CAS登录号、纯度等。可通过结构式或其它任何数据 检索 ACD (Available Chemicals Directory) MDL维 护。FCD数据库加上可大批量供货的化学品信息。目 前有25万个化合物 CSD(Cambridge Structure Database) 20多 万个结晶的3D结构实验数据

9、及相关数据,生物信息处理,生物信息学(bioinformatics) 基于数学、生命科学、化学和计算机科学的交叉 学科 利用计算机信息处理技术对大量生物大分子作信 息获取、加工、储存、分类、检索与统计分析,揭 示生物大分子的分子结构、功能、同源性和进化关 系 推动生命科学的发展,为创新药物的研究和开发 奠定基础,生物信息学的内容 建立可贮存和管理大量生物信息学数据集 的数据库 处理大量数据的算法和统计方法 分析和解释不同类型的生物数据,如RNA、 DNA和蛋白质序列、蛋白质结构、基因表 达以及生化途径,可视化,数据处理 结构预测(同源模建),Genomes TCGCGCGTTTCGGTGATG

10、AC GGTGAAAACCTCTGACACAT. Proteins SRVSVMTVKTSDTCSSRRRS QLVCKRMPGADKPVRARQRV. 序列分析,蛋白质作用网络,生物信息学的应用 分子动力学模拟 分子相互作用 PowerEdge 6400,(一) 单个序列分析 根据单个氨基酸的物化性质推测整个蛋白质的性质, 也可预测二级结构出现的可能性 20种氨基酸的疏水参数,*一、核酸和蛋白质的序列分析 sequence analysis,根据统计值:谷氨酸(Glu)经常出现在-螺旋中;缬氨酸(Val) 常在-折叠中发现;脯氨酸(Pro)通常不出现于-螺旋中和 -折叠中,而倾向于在回折中,

11、(数值=1代表偏好处于平均;1代表偏好大于平均;1代表偏好小于平均),*,(二) 双重序列比较序列比对sequence alignment 序列对比可以用各种矩阵表达并作相似性打分 两个残基越相似则打分值越高,*,多重序列比对可以从更多细节上揭示保守模式和结构信息 可采用多种统计算法进行多重序列比对,*(三) 多重序列比对 multiple sequence alignment,二、蛋白质三维结构预测,基因,蛋白质 一级结构,蛋白质 三维结构,决定,折叠,预测,主要方法 蛋白三维结构预测,从头预测法 ab initio,线引法 threading,同源模建法 homology modeling

12、,基于知识的预测方法,knowledge-based prediction,基于理论的预测方法,theory-based prediction,1、从头预测法(ab initio prediction) 采用理论计算(分子力学、分子动力学、量子 化学)方法,直接从分子和原子参数计算出蛋 白质分子的稳定构象, 理论上最理想的方法,但计算量极大,对于实 际分子的计算超过能力范围,2、穿针引线法,线串法,线程法,折叠识别 (threading,fold recognition) 根据已知的蛋白质三维结构来预测可能的三维 结构 基于知识的预测 可应用于进化非常疏远的结构预测 未知蛋白序列与折叠库中已知

13、结构的蛋白序列 作匹配计算,将序列吻合的三维结构模块串连 起来,得到整个蛋白三维结构,3、同源蛋白模建法 homologous model building,比较分子模拟法 comparative molecular modeling 同源模建 homology modeling 同源蛋白法 protein homology 根据已知的蛋白质三维结构来预测可能的三维 结构 基于知识的预测 同源蛋白有着相似的来源、相似的结构和生物 功能。通过比较蛋白序列的相似性,按同源蛋 白的三维结构为模板,构建未知蛋白的结构 一般要求同源性在30%以上,特别是在结合区 域同源性要好,步骤:(1)根据未知蛋白质

14、的序列,寻找同源蛋白 (2)二重或多重序列对比 (3)找出共同的二级结构区域,构建骨架 (4)对初始模型作能量优化 (5)判断结构合理性,三、代表性生物信息学数据库 (一)核酸数据库 GenBank美国国立卫生研究所NIH国家生物技术信息 中心NCBI Nucleic Acid Database(NDB) 由European Molecular Biology Laboratory( EMBL)创建,现由 英 国 剑 桥 的 欧 洲 生 物 信 息 学 研 究 所 ( European Bioinformatics Institute, EBI)维护 DNA Data Bank of Japa

15、n(DDBJ) 日本国 立遗传学研究所的日本信息生物学中心(Center for Information Biology, CIB)开发维护,三大库可交互,PDB(Protein Data Bank,at Brookhaven National,Laboratories ) 美国Research Collaboration for Structural Bioinformatics (RCSB)开发维护的多肽、酶、 病毒、碳水化合物和核酸的三维结构数据,(二)蛋白质数据库,虚拟筛选 (virtual screening) 计算机辅助筛选 (computer-aided screening) 计

16、算机筛选(screening in silico) 三维结构搜寻(three-dimensional structure searching) 虚拟: 计算机上进行 不需要化合物,只需结构 化合物数据库 实际分子的索引;虚拟分子; 类药性分子,靶点 三维结构,命中物,一、基于靶点结构的虚拟筛选对接 target-based virtual screening docking 化合物库,搜寻,VirtualScreening,对接 受体和配基之间通过能量匹配和 空间匹配而相互识别形成分子复合物,并 预测复合物结构的操作过程 数据库,分子对接的原理 分子对接是将已知三维结构数据库中的分子逐一放在靶标分子的活性位点处。通过不断优化受体化合物的位置、构象、分子内部可旋转键的二面角

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号