部分持久性有机污染物生物浓缩因子的qsar研究

上传人:E**** 文档编号:118171500 上传时间:2019-12-11 格式:PDF 页数:5 大小:243.83KB
返回 下载 相关 举报
部分持久性有机污染物生物浓缩因子的qsar研究_第1页
第1页 / 共5页
部分持久性有机污染物生物浓缩因子的qsar研究_第2页
第2页 / 共5页
部分持久性有机污染物生物浓缩因子的qsar研究_第3页
第3页 / 共5页
部分持久性有机污染物生物浓缩因子的qsar研究_第4页
第4页 / 共5页
部分持久性有机污染物生物浓缩因子的qsar研究_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《部分持久性有机污染物生物浓缩因子的qsar研究》由会员分享,可在线阅读,更多相关《部分持久性有机污染物生物浓缩因子的qsar研究(5页珍藏版)》请在金锄头文库上搜索。

1、持久性有机污染物论坛2 0 0 6 暨第一届持久性有机污染物全国学术研讨会论文集 部分持久性有机污染物生物浓缩因子的Q S A R 研究 崔世海1 ,”,杨静1 ,刘树深2 ,王连生2 ( 1 南京师范大学化学与环境科学学院,南京,2 1 0 0 9 7 ;2 南京大学环境学院,南京,2 1 0 0 9 3 ; 联系人,E m a i l :c u i s h i h a i n j n u e d u c n ) 摘要:基于分子电性距离矢量描述子对2 3 6 种有机化合物的生物浓缩因子建立了Q S A R 模型, 结果表明,模型具有良好的校正能力,对外部样本# - R - , 有良好的预测能

2、力,同时从最佳子集回归所得 到的变量组合分析,影响化合物生物浓缩因子的主要子结构单元为一c H 2 、一x 、一c 术、一c 术、一0 一。 关键阀:持久性有机污染物,生物浓缩因子,Q S A R ,分子电性距离矢量 1 引言 生物富集因子( B i o c o n c e n t r a t i o nf a c t o r ,B C F ) 是指有机物在生物体的某一器官或组织内的浓度与 水体中浓度之比【l ,2 】。该参数可以表征生物体对有机化合物的富集能力,因而对有机物特别是持久 性有机污染物的归趋研究具有重要的意义,联合国环境规划署已经将生物富集性作为判断有机污染 物是否属于P O P

3、 s 的重要标准之一,鱼类由于可作为包括人类在内的诸多高等生物的食物而通常被 作为实验动物,然而水体中有机物的浓度随水解、微生物降解、挥发等过程而明显变化,这些因素 将影响有机物与生物相互之间达到平衡,因此生物浓缩有机物的过程往往非常复杂,准确测定有机 物的B C F 需要消耗大量的人力物力,应用定量结构活性相关技术建立相关模型为预测有机物的环 境行为提供了有力帮助。由于鱼类脂肪组织是有机物浓缩的主要场所,许多科研工作者基于正辛醇 水分配系数建立Q S A R 模型,这些模型对l o g K o w 6 的物质往往需要通过多个理化性质参数才能获得理想的结果,本节应用分子电性距离矢量表征 不同种

4、类有机物的生物浓缩因子,并建立了理想的Q S A R 预测模型。 2 材料与方法 2 1 活性数据 2 3 6 种有机化合物由卤代烃、芳香烃、多环芳烃、取代苯胺、酯、多氯联苯、二嗯英、农药等 组成,其中大部分化合物已经被确定为持久性有机污染物,有机化合物在鱼体内的生物富集因子数 据引自文献【8 1 。 2 2 结构活性相关分析 分子结构描述子的计算详见文献【9 】I 【1 1 】,其主要包括以下三个步骤,首先以分子中非氢原子之间 的化学键数作为两原予间的拓扑距离锄;然后将分子中非氢原子的原予固有属性腚义为: 1 = v 4 7 7 9 :2 刀夕2 万”+ 1 ) 】万 ( 1 ) 1 ,是原

5、子价电子层的电子数,n 是价电子层所属主量子数,其中占和万”是原子在不同分子环境中 构成不同共价键时的分子连接性数值,由式( 2 ) 与( 3 ) 求解。 艿= 仃一h ( 2 ) 艿”= 仃+ 万一h r 3 、 式中仃和万分别是该原子参与仃轨道和万轨道成键的电子数;h 是与该原子相连的氢原子个数。 在上述三个方程的基础上,得到非氢原子的相对电性( 垡f ) 量度见式( 4 ) 。 酽+ 羔生掣 ( 4 ) t a i t 3 9 2 持久性有机污染物论坛2 0 0 6 暨第一届持久性有机污染物全国学术研讨会论文集 最后,根据式( 5 ) 计算不同原子类型之间的分子电性距离矢量描述子,这些描

6、述子分别与不同分子 结构单元相关联一J 。 x ,= M 材= ? ! 三丢厶( 后,= 1 , 2 ,3 ,1 3 7 ,后? ,= 1 , 2 ,3 ,9 1 ) ( 5 ) l 氧dd ; 应用G Q S A R 程序计算出每种化合物的分子电性距离矢量作为自变量X ,删除统计性差的描述 子变量后,以有机化合物的生物富集因子为因变量】,构建数据集,应用最佳子集回归选择最佳变量 组合,建立相关Q S A R 模型。模型预测能力及稳健度由相关系数,、估计均方根偏差R M S E E 、L O O 交叉验证相关系数及预测均方根偏差R M S E P 评价。回归程序对剩余的4 9 个描述子进行变量

7、优化 选择。经过计算,样本之间距离最小的数值为0 0 2 5 9 化合物2 ,7 D i c h l o r o d o b e n z o P d i o x i n 与 2 , 7 - D i c h l o r o d o b e n z o - p d i o x i n ) ,说明4 9 个描述子对所有数据集中化合物的分辨率为1 0 0 。 3 结果与讨论 应用分子距离矢量进行表征2 3 6 种有机污染化合物,9 1 个描述子中有3 3 个对所有化合物均为 0 ,另外9 个变量只有1 至3 个化合物不为0 。删除此4 2 个描述子后,应用最佳子集回归程序运行结 果见表1 ,从表中数据

8、可以看出,最佳变量应该是7 个描述子X 1 5 、X 2 2 、x z s 、均,、劫6 、x 4 3 、X 钉的 组合。这7 个变量之间的自相关系数见表2 ,说明这些最佳变量之间没有明显的自相关关系。根据 分子电性距离矢量理论可知,与这7 个M E D V 描述子变量相关的分子结构基团分别为- - 一C H :、一X 、 一C 术、- - - C 术、一O - - 。 表12 3 6 种有机化合物的最佳子集回归结果 表2 最佳子集7 个变量之间的相关关系 利用最佳子集回归结果所建立的相关数学模型见式( 6 ) ,模型的L o o 预测相关系数9 2 为0 7 8 7 3 , L O O 交叉

9、验证标准误差R M S E V 为0 6 4 ,化合物生物浓缩因子实验观测值与拟合值及预测值相关性 见图1 ,初步说明所建模型具有较好的预测能力。 3 9 3 持久性有机污染物论坛2 0 0 6 暨第一届持久性有机污染物全国学术研讨会论文集 I o g B C F = ( 1 3 6 8 9 4 0 0 7 5 7 4 ) 十( 0 0 5 3 8 4 0 0 0 4 4 6 ) x l s + ( O 0 6 9 3 0 0 0 1 7 9 8 ) x 2 2 + ( O 0 8 0 17 0 0 11 4 0 ) x 2 j 一( O 0 8 1 4 9 士0 , 0 1 4 9 0 )

10、x 3 3 + ( O 0 4 9 4 5 0 0 0 5 5 6 ) x 3 6 ”7 + ( 0 2 8 1 8 1 O 0 7 0 8 7 ) x 4 3 + ( O 0 6 5 1 5 O 0 1 7 6 8 ) x g t n :2 3 6 m = 7 ,r 2 = O 8 0 8 0 ,= 0 8 9 9 1 ,R M S E E = 0 6 0 ,p1 1 5 6 6 0 ( M o d e l i n g ) q 2 = 0 7 8 7 3 ,q = 0 8 8 7 3 ,R M S E V = 0 6 4 ( P r e d i c t i o n ) 为了进一步说明所建立模

11、型的预测能力,将2 3 6 种化合物的生物富集因子的对数值按大小顺序 排列,均匀提取3 6 种化合物构建检验集,其余2 0 0 种化合物组成训练集,应用模型方程( 6 ) 所使用 的七个描述子对训练集建立相关模型,结果见式( 7 ) 。 1 0 9 B C F = ( 1 3 4 1 4 4 0 0 7 11 9 ) 十( 0 0 5 4 1 9 0 0 0 4 2 6 ) x l s + ( 0 , 0 7 7 0 6 0 0 1 6 9 8 ) x 2 2 + ( O 0 7 8 8 5 0 0 1 0 6 1 ) ) c 剪一( 0 0 8 2 8 5 O 0 1 3 8 6 。,+ (

12、 O 0 4 9 9 6 0 0 0 5 3 6 。6 ( 7 ) + ( 0 2 8 6 6 0 0 0 6 5 4 6 ) x 4 3 + ( 0 0 7 0 1 3 0 0 1 7 0 3 ) x 盯 咒= 2 0 0 ,m = 7 ,= 0 8 0 8 3 ,= 0 8 9 9 1 ,R M S E E = 0 6 0 ,F = 1 1 5 6 6 0 ( M o d e l i n g ) n = 3 6 ,m = 7 ,R 2 尸= 0 7 7 1 2 ,R e = 0 8 7 8 2 ,R M S E P = 0 6 5 ( P r e d i c t i o n ) 0246

13、O b s e r v e d l o g B C FO b s e r v e d I o g B C F 图12 3 6 种化合物生物浓缩因子实验观测值与拟合、预测值相关图 O b s e r v e d I o g B C F v a l u e 图2 检验集中化合物生物浓缩因子实验值与预测值相关图 结果表明,L N O 交互检验相关系数r 2 0 8 0 8 3 ,预测相关系数以为0 7 7 1 2 ,与模型( 7 ) 对比 可以发现,两者统计量没有明显的差别。为了便于与文献比较,现将2 3 6 种化合物按顺序抽取1 1 8 种化合物作为检验集( 5 0 ) ,其余1 1 8 种化合物

14、形成训练集,以检验模型的预测能力与稳健度。同 样采用勋白X 2 2 , X 2 5 ,, 勋3 ,勋6 ,x 缅X 9 1 变量的组合,所建立模型见式( 8 ) 。 3 9 4 函Uo一寸30号翌【d !IU瓤。一趸喜s 簧嘎Bm强01它暑号譬鼬 持久性有机污染物论坛2 0 0 6 暨第一届持久性有机污染物全国学术研讨会论文集 I o g B C F = ( 1 2 1 5 2 6 0 1 0 9 3 4 ) + ( O 0 5 6 7 9 0 0 0 6 2 7 ) x l s + ( 0 0 9 6 0 4 0 0 2 5 3 7 ) x 2 2 + ( O 0 8 4 6 7 0 0 1

15、5 5 4 ) X 2 s 一( O 0 9 5 51 0 0 2 3 3 8 ) x 3 3 + ( O 0 5 0 9 5 0 0 0 7 6 3 ) x j 6 Io ) + ( 0 2 7 8 4 7 0 1 7 1 7 1 ) x 私+ ( O 0 6 8 2 3 0 0 2 4 9 3 ) x 9 J ,l = 1 1 8 ,m = 7 ,= 0 7 9 6 1 ,= 0 8 9 2 1 ,R M S E E = 0 6 2 ,F = 6 1 2 8 3 ( M o d e l i n g ) n 2 = 0 7 9 5 9 ,R P = 0 8 9 2 1 ,R M S E P

16、= 0 6 2 ( P r e d i c t i o n ) 从模型方程( 8 ) 的统计量观察,与前两个模型相比同样没有明显的差别,L N O ( 5 0 ) 预测相关系 数为0 7 9 5 9 ,均方根预测偏差为O 6 2 ,非交叉验证相关系数为0 7 9 6 1 ,均方根偏差为0 6 2 ,说明应 用分子电性距离矢量描述子建立的预测模型是稳健的。 目前已有文献所报道的基于不同描述子对2 0 0 多种化合物的生物浓缩因子所建立的模型结果 列于表3 。模型1 【1 2 J 基于化合物的正辛醇,水分配系数建立的模型没有明确的预测意义,只能说明化 合物的生物浓缩因子与K o 矿有较密切的相关关系,模型3 【8 】应用分子连接性指数建立了1 3 个变量的 模型( 5 个分子

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号