北京大学化学信息学课件

上传人:我*** 文档编号:140520248 上传时间:2020-07-30 格式:PPT 页数:75 大小:404.50KB
返回 下载 相关 举报
北京大学化学信息学课件_第1页
第1页 / 共75页
北京大学化学信息学课件_第2页
第2页 / 共75页
北京大学化学信息学课件_第3页
第3页 / 共75页
北京大学化学信息学课件_第4页
第4页 / 共75页
北京大学化学信息学课件_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《北京大学化学信息学课件》由会员分享,可在线阅读,更多相关《北京大学化学信息学课件(75页珍藏版)》请在金锄头文库上搜索。

1、1,课程内容安排,第十一讲:Chemoinformatics 分子结构信息的计算机存储和表达 分子二维数据库和数据库检索技术 第十二讲:Cheminformatics 分子多样性和化合物筛选 三维结构的实验数据资源 基于三维结构的计算方法 化合物组合库 高通量虚拟筛选,2,化学信息学,第十一讲 Chemoinformatics,3,内 容,相关名词辨析及化学信息学由来 分子结构信息的计算机存储和表达 分子二维数据库和数据库检索技术,4,名词解释 Computational Chemistry,计算化学: 使用数学方法计算分子性质和模拟分子行为的方法。并且包括合成设计、数据库搜索、组合库操作等

2、(Hopfinger, 1981; Ugi et al., 1990). IUPAC Computational,5,相关名词辨析,6,名词解释 Molecular Modeling,分子建模方法: 使用计算化学和图形显示技术研究分子结构和性质,从而获得在给定环境下的分子三维结构的近似表达 IUPAC Medicinal Chemistry, IUPAC Computational,7,名词解释 Chemometrics,化学统计学: 使用数理统计学的方法对化学信息(如有机,分析和药物化学)进行分析,或进行化学实验的设计和模拟 IUPAC Computational,8,名词解释 Bio-in

3、formatics,生物信息学: 使用数理统计学的方法对化学信息(如有机,分析和药物化学)进行分析,或进行化学实验的设计和模拟 IUPAC Computational,9,名词解释 Chemoinformatics,?: Chemoinformatics 是知识管理(knowledge management)的有机组成部分 Nicholas J. Hrib, Norton P. Peet Chemoinformatics: are we exploiting these new science?“ Drug Discovery Today 5 (11): 483-485, Nov. 2000,

4、10,名词解释 Cheminformatics,化学信息学: 结合化学合成、生物筛选及数据挖掘技术指导药物发现和开发, 用于合理的设计具有类药性质的化合物,构建用于虚拟高通量筛选的智能化合物库,研究以往的数据知道先导化合物的优化 Cheminformatics: Intelligent Drug Discovery May 28- 30, 2003 Philadelphia PA,11,12,Human Alcohol Dehydrogenase (Adh1A),分类: Oxidoreductase 简介: Molecule: Class I Alcohol Dehydrogenase 1,

5、Subunit; Chain: A, B; Engineered: Yes 实验方法: X-ray Diffraction,13,Human Alcohol Dehydrogenase (Adh1A),14,分子结构信息的计算机存储和表达,如何使用计算机存储化学结构? 如何处理存储的结构信息? 计算机在Chemoinfomatics中的应用?,15,分子结构信息表达的内容,原子 原子间的连接 键型 立体化学构型 电荷 同位素 3D-coordinates for atoms,16,分子结构信息表达的内容,原子 原子间的连接 键型 立体化学构型 电荷 同位素 3D-coordinates for

6、 atoms,17,分子结构信息表达的内容,原子 原子间的连接 键型(芳香环) 立体化学构型 电荷 同位素 3D-coordinates for atoms,18,分子结构信息表达的内容,原子 原子间的连接 键型(芳香环) 立体化学构型 电荷 同位素 3D-coordinates for atoms,19,分子结构信息表达的内容,原子 原子间的连接 键型(芳香环) 立体化学构型 电荷 同位素 3D-coordinates for atoms,20,21,分子结构一维表示法(Line Notation),简介: 使用字符串表示分子结构 现有的几种表示法 Wiswesser Line Notati

7、on (WLN) (Dialog) Simplified Molecular Input Line System (SMILES/SMARTS) (Daylight) Representation of Structure Diagram Arranged Linearly (ROSDAL) - (Beilstein) Sybyl Line Notation (SLN)- (Tripos),ROSDAL 1O-2=3O,2-4-5N,4-6-7=-12-7,10-13O SLN OHC(=O)CH(NH2)CH2C1=CHCH=C(OH)CH=CH1 WLN QVYZ1R DQ SMILES

8、OC(=O)C(N)CC1=CC=C(O)C=C1,22,分子结构一维表示法(Line Notation),Simplified Molecular Input Line Entry System (SMILES) 基于价键模型的标记法 Author: Dave Weininger (Daylight),23,CMethaneC1CCCCC1cyclohexane Owaterc1ccccc1benzene CCethane COmethanol OC methanol NCH(C)C(=O)O CCOethanol CC(=O)Cacetone O=C=Ocarbon dioxide,L-a

9、lanine,SMILE标记示例,24,atom : symbol 双字母原子符号: Br (Upper/lower case) 原子的预定义价键: B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1), Cl(1), Br(1), I(1) 大写的字母表示非芳香体系 示例: ClHydrochloric acid SH2S Fe+Iron(II)cation,Atoms 语法,25,Bond 语法,bond : | - | = | # | . ; single | double | triple | disconnection Ethene C=C

10、 Formaldehyde C=O Hydrogen Cyanide C#N Butadiene C=CC=C,26,分支 将支链放在括号中,SMILES: CCCC(C(=O)O)CCC,branch : ( ) | ( ) | ( ) | ( ),27,环定义 合环键用数字标出,28,非连接关系 (disconnections): 同位素表示:,SMILES: Na+.O-c1ccccc1,specified inside brackets. SMILES: 13CH4,其它定义,29,F/C=C/F,F/C=CF,双键构型的表示 / ,30,从旋光中心沿字符串顺序观察,逆时针为,顺时针为

11、,NC(C)(F)C(=O)O,手性表示 or ,31,氢原子表示,显式表示氢原子的四种情况: 带电荷的氢, 如:质子 H+ 与其它氢相连的氢, 如:氢气 HH 氢桥 同位素,如:重水, 2HO2H,32,芳香性,N1ccccc1 N1=CC=CC=C1,C1cc2cccccc2c1 C1=CC2=CC=CC=CC2=C1,33,O-n+1ccccc1 pyridine-N-oxide,OCH1CCCCCH1O cis-resorcinol,CC(C)NCC(O)COc1cccc2ccccc12 Propranolol a beta-blocker,一些例子,34,SMILES的正规化标记,c

12、1ccccc1Oc2ccccc2(N) Nc2ccccc2Oc1ccccc1 O(c1ccccc1)(c2ccccc2N),Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2,35,分子结构一维表示法(Line Notation),优点: 易于手工书写 结构紧凑 局限: 信息量小 对复杂分子的标记比较繁琐。 某些情况下,标记具有二义性。,36,分子结构一维表示法的应用,构造查询语言 子结构匹配 相似性搜索(结构指纹) 化合物组合库的压缩存储 反应数据库,37,SMILES 应用示例,ClogP 辛醇/水分配系数 实验方法 logP计

13、算 pH 7.0时的分配系数 数据库规模 = 2,000,000化合物 工作站搜索速度= 500,000/s,38,ClogP的计算使用片断加和法 (片断值校正项) 片断值基于实验值,与片断的类型有关,如:极性基团、卤素、离子、不饱和键 校正项描述不同片断间的相互作用,如:氢键等,39,40,41,分子结构信息的计算机存储和表达,分子结构二维表示法 连接表 (Connection Table) 邻接矩阵 (Adjacency Table),42,连接表 (Connection Table),简介:计算机系统中主流结构表示方法 类型 “内部” CTs (内存) 程序处理 “外部” CTs (磁盘

14、文件) 文件存储 数据交换,43,“Redundant” Connection Table,O1 2 1 C0 1 1 3 2 4 1 O0 2 2 C 1 2 1 5 1 6 1 N2 4 1 C2 4 1 7 1 C0 6 1 8 212 1 C1 7 2 9 1 C1 8 110 2 C0 9 211 113 1 C110 112 2 C111 2 7 1 O110 1,44,MDL Connection Table,数据交换的事实标准 衍生文件格式 Molfile (single molecule) SDfile (set of molecules and data) RGfile (

15、Markush structure) Rxnfile (single reaction) RDfile (set of reactions with data) 示例,benzene WLViewer 3D 0 12 12 0 0 0 0 0 0 0 0 0 1.1202 0.0003 0.0002 C 0 0 0 0 0 0 1.8030 1.1835 -0.0005 C 0 0 0 0 0 0 3.1691 1.1839 -0.0004 C 0 0 0 0 0 0 3.8522 0.0006 -0.0007 C 0 0 0 0 0 0 3.1691 -1.1823 0.0001 C 0 0

16、 0 0 0 0 1.8034 -1.1829 -0.0003 C 0 0 0 0 0 0 0.1202 0.0002 0.0011 H 0 0 0 0 0 0 1.3028 2.0494 -0.0011 H 0 0 0 0 0 0 3.6690 2.0500 -0.0001 H 0 0 0 0 0 0 4.8522 0.0005 -0.0015 H 0 0 0 0 0 0 3.6692 -2.0482 0.0010 H 0 0 0 0 0 0 1.3036 -2.0490 -0.0010 H 0 0 0 0 0 0 1 2 4 0 0 0 1 6 4 0 0 0 2 3 4 0 0 0 3 4 4 0 0 0 4 5 4 0 0 0 5 6 4 0 0 0 1 7 1 0 0 0 2 8 1 0 0 0 3 9 1 0 0 0 4 10 1 0 0 0 5 11 1 0 0 0 6 12 1 0 0 0 M END,46,其它CTs格式,Standard Molecular Dat

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号