化学结构的计算机处理_v_几类重要歧义化学结构的解决方案

上传人:kms****20 文档编号:46688300 上传时间:2018-06-27 格式:PDF 页数:7 大小:291.05KB
返回 下载 相关 举报
化学结构的计算机处理_v_几类重要歧义化学结构的解决方案_第1页
第1页 / 共7页
化学结构的计算机处理_v_几类重要歧义化学结构的解决方案_第2页
第2页 / 共7页
化学结构的计算机处理_v_几类重要歧义化学结构的解决方案_第3页
第3页 / 共7页
化学结构的计算机处理_v_几类重要歧义化学结构的解决方案_第4页
第4页 / 共7页
化学结构的计算机处理_v_几类重要歧义化学结构的解决方案_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《化学结构的计算机处理_v_几类重要歧义化学结构的解决方案》由会员分享,可在线阅读,更多相关《化学结构的计算机处理_v_几类重要歧义化学结构的解决方案(7页珍藏版)》请在金锄头文库上搜索。

1、收稿日期: 1998 - 07 - 25 ,收修改稿日期: 1999 - 02国家计委“九五”攻关(962547201)、国家自然科学基金(29573148)和中法先进研究计划(PRA M96206)资助项目 综述化学结构的计算机处理( V) 几类重要歧义化学结构的解决方案罗时玮 姚建华(中国科学院上海有机化学研究所,中国科学院计算机化学开放实验室 上海 200032)摘 要 根据歧义结构的不同特点,结合计算机结构处理的实际要求,可将歧义结构分为互变异构、环交替键化合物、带离域电荷离子、配价键化合物、金属盐、有机氮盐及类似物、多肽、碳水化合物等不同类型,分别采用转换录入、选择录入、多重录入等方

2、式解决结构歧义性问题。本文介绍实际处理中的一些基本算法,并举例说明。关键词 结构处理,歧义结构中图号 O 6 - 39COMPUTER HANDLINGOF CHEMICAL STRUCTURES ( V) Solution of Some Important Ambiguous StructuresLUO Shi2Wei Y AO Jian2Hua( Laboratory of Computer Chemistry , Shanghai Institute of Organic Chemistry ,Chinese Academy of Sciences ,Shanghai 200032)A

3、BSTRACT According to the characteristics of ambiguous structures and the practical requirements of their computerhandling , these structures could be divided into tautomers , ring compounds with alternating bonds , delocalized ionic com2pounds , coordination complexes , peptides , carbohydrates etc.

4、 The problems in computer handling of ambiguous structurescan be solved by three methods , multiple2record , selection and transformation , respectively. The basic algorithmsfor han2dling ambiguous structures were presented with illustration examples.KEYWORDS Structure handling , Ambiguous structure

5、s1 歧义结构的分类化合物种类繁多,表达形式各异,其中歧义结构的形式也是多种多样的,因而分门别类地处理可使问题易于解决。歧义结构大致可分为两类1: (1)化学结构都属于图S (A +Laa) ; (2)化学结构中有一部分不是数学意义上的图S (A +Lal)、S (A +Lp)和S (A +Lal +Lp)。对于第一类歧义结构,我们只需考虑如何使歧义结构能被计算机所识别,并表达同一化合物分子即 可。对于第二类歧义结构,则必须先将该化学结构图转换为图S (A +Laa) ,然后进行下一步处理。依此分类方式,属于第一类的化合物有互变异构体、交替键化合物、带离域电荷离子、配价键化合 物、无机化合物、

6、金属盐、有机氮盐及类似物、加成化合物、多肽、碳水化合物、共振化合物等;属于第二类的化合物有络合物、硼烷、索烷、轮轴化合物、缠结化合物等。属于第一类的化合物都是一些常见 类型,而第二类中除络合物和硼烷外,均较为罕见。2 几类重要歧义化学结构的解决方案在满足化学结构图都是数学意义上的图的基础上,歧义结构的解决方案可分为三类,即转换录入、选第16卷 第3期 1999年5月28日计算机与应用化学 Computers and Applied ChemsitryVol116 , No13 May , 1999择录入和多重录入。211 转换录入 转换(Transformation)是将代表一化合物分子的所有

7、可能结构都转换成一个统一的描述形式。在这 种转换过程中,应保留尽可能多的结构特征信息。为此,在转换过程中要对被转换的部分进行一定形式的 标记。通常不带标记的转换,因为会丢失太多的信息而不予考虑,而只考虑在采用称为规范化标记图NG(Normalized graph)的同时也录入所有其他结构式的转换。标记图NG是有限个不同结构式F1, F2,Fn的共有标志,它是对所考虑的结构式应用某种规则处理后产生的图。转换录入方式过程可分为4步: (1)对需录入的化合物歧义结构表达式进行描述; (2)产生规范化标 记图; (3)对规范化标记图进行描述; (4)对有同一规范化标记图的化合物进行关联。 在结构描述文

8、件中,一般只记录规范化标记图和无歧义的结构。每个标记图中应有指针指向放在称为 “原始结构文件”的辅助文件中相应的歧义结构。这个文件被查询时,既可通过标记图也可通过出现过的 结构进行查询。为了生成标记图,不可能只确定一个总规则,因为这涉及到许多特定的规则,例如共振异构、互变异 构等。但是,生成标记图的规则必须与描述化合物结构的规则相一致。一般NG的产生不应十分复杂,以 便简化文件的使用。因此,只有最常见的那些歧义结构是用标记图与结构文件相关联的。通常限于以下三 种:互变异构化合物、交替键化合物、金属盐类。21111 互变异构引起的结构歧义性解决方案互变异构是指同一化合物的几种不同结构之间的一种动

9、态平衡,通常涉及键的位移和一个基团(典 型的是质子氢)的位置变化。互变异构既可以出现在链状化合物中,也可以出现在环状化合物中。一般可 表示为:- X1= X2- X3Y- YX1- X2= X3-。对于这类化合物,根据它们在结构上具有的共同特征, 可用如下转换录入算法进行处理。 在包含如图1所示子结构的化合物中,若满足:(1)X1、X2、X3是C、Si、N、P、As、O、S、Se、Te、I、Br、Cl、Sb中的一个原子; (2) X1、X2、X3不全都是C原子,则X1与X2、X1与X3之间的键被 看成是离域键。离域键可标记为U ,其键值不再是1或2 ,而是选用一特定值以示区别。显然,当X2和X

10、3是同类原子时,没有必要产生规范化标记图,因为两种形式是一样的,因此它们的编码也是相同的。图2 规范化标记图NG的产生和关联Fig. 2 Generation and cohesion of normalized graphsX1X3HX2和 X1X3HX2图1 互变异构Fig. 1 Tautomeric structures具有相同标记图的互变异构体对应于动态平衡 中的不同结构,经过带有标记的转换,用标记图代表所有原歧义结构。登录时,只对标记结构进行编 码,并通过指针将标记图与原歧义性的结构联系起 来。在进行结构匹配等操作时,通过标记图来实 现,而进行结构显示时,再通过指针找到原结构。 这一

11、过程通常称为关联,如图2所示。21112 不饱和环交替键引起的结构歧义性解决方案带有不饱和环交替键的共振化合物中,电子可能是定域的也可能是离域的,用满足价键理论的结构表示法时,环上双键的位移将导致出现不同的结构式,从而造成结构表示的歧义性。通过芳香性判别,难以解决所有问题1。对这种环上单双键交替出现的化合物,可以根据具体情况将环上的键都看成是离域的,通过转换标记的方式来记录,以解决结构表示的歧义性问题。最常见的是单键与双键之间的离域,当然也有双键与三261计算机与应用化学16卷键之间离域的情况。 具体转换录入法为:闭合环上交替的不饱和键和单键都看成离域的,但三键和Z键除外2。这样产 生的离域键

12、可标记为Y,其键值也选用一特殊值以示区别。NG采用多中心化算法在计算机上自动产生。 多中心化算法只检查每个环上原子与第一层相邻原子的成键情况。对原子进行离域比对键进行离域更易于 实现自动化处理。如图3所示,由于所有CH和与带双键的氮原子所组成的环的第一层原子都有一环双键,因此是离域 的。此外,两个小五元环A中每个原子都有一个环双键,因此也是离域的。而在环B中,氮原子是饱和 的,所以处理成定域的。图3 不饱和环交替键规范化标记图的产生Fig. 3 Generation of normalized graphs of unsaturated ring system with alternating

13、 bonds同样,对于不同单双键交替方式的结构,可通过规范化标记图联系起来。21113 金属盐类结构歧义性解决方案 活泼的质子氢被金属离子取代生成的非金属原子-金属原子键,既可写成离子型又可写成共价型,例 如格氏试剂等。从价键理论的角度看,形成的是离子键还是共价键与成键原子的电负性大小有关。但一般在结构表示时,很少去仔细比较这种电负性上的差异。同时,制定一个严格的判别标准也是很困难的,因 而键的表示也不能统一,造成了结构表示上的歧义性。 此类化合物可采用如下的转换录入方法进行处理。(1)对非金属与金属原子之间的键ZM,如M的化合价大于1 ,将ZM键断开,并用ZH和M代表原来的ZM ;(2)对原

14、结构图中不相连的形式,如Z-和M+或H+的结构,用ZH和M代替; (3)若金属原子是环的一部分,则保持不变。下列原子一般被看成是非金属原子: He、Ne、Ar、Kr、Xe、Rn、F、Cl、Br、I、At、O、S、Se、Te、N、P、As、Sb、C、Si、B、H。OOOCaOO NGOOCaO图4 环上金属盐类结构Fig. 4 Structures of metal salt on rings此类情况中,值得注意的是环上的金属原子,为保留环的结构特征,在进行转换录入时,必须进 行环的识别。若金属原子是环的一部分,则该非金 属原子-金属原子键应予以保留。如在图4所示结 构中,因为O - Ca键在环

15、内,所以经转换形成规范 化标记图时,金属原子与非金属原子之间的键不断开。而在图5所示的结构中, O - Ca键是直链键, 因此,每个键都应断开并用OH和Ca代替。当检测到正离子M+时,负离子Z-应改写为ZH形式。如图6所示。 用带录入的转换标记图法可不丢失信息,但采用这个方法的条件是歧义结构必须是出现频率高且规范 化标记图可自动产生。3613期罗时玮等:化学结构的计算机处理(V)OCaOOHNGHOCa图5 链状金属盐类结构Fig. 5 Structures of metal salt on chainsCHO-OOCCH2COO-CH2COO-2H+,Na+ CHOHOOCCH2COOHCH

16、2COOHNG, Na图6 金属盐类化合物的表示形式Fig. 6 Representation of metal salt212 选择录入 所谓选择录入(Selection)是从化学家习惯使用的各种可能结构式中选取一个作为代表,登录入库。 这个被挑选出来的结构式称为标准结构图FG (Formal graph)。FG是在有限个不同结构中选择出来的最具代表性的一个,它是采用某种判别过程后所得到的图。显然,这种选择录入应满足一定的要求,或有一个 统一的格式,对不同类型的化合物,标准也是不同的。 此方法常用在如下的一些化合物中:带离域电荷的离子、配价键化合物、无机化合物、氮盐及类似 物、加成化合物及多肽等。21211 带离域电荷离子结构歧义性解决方案带离域电荷离子的化合物结构式的写法随电荷所在位置不同而有多种方式。电荷可在: (1)多个原子 上; (2)环上; (3)整个分子上离域。带离域电荷的离子化合物结构式的选择是自动进行的,其产生过程 类似于NG。FG的产生方法类似于中性共振结构标记

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号