机器学习方法用于二氢叶酸还原酶抑制剂的活性预测

上传人:w****i 文档编号:115984352 上传时间:2019-11-15 格式:PDF 页数:58 大小:1.46MB
返回 下载 相关 举报
机器学习方法用于二氢叶酸还原酶抑制剂的活性预测_第1页
第1页 / 共58页
机器学习方法用于二氢叶酸还原酶抑制剂的活性预测_第2页
第2页 / 共58页
机器学习方法用于二氢叶酸还原酶抑制剂的活性预测_第3页
第3页 / 共58页
机器学习方法用于二氢叶酸还原酶抑制剂的活性预测_第4页
第4页 / 共58页
机器学习方法用于二氢叶酸还原酶抑制剂的活性预测_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《机器学习方法用于二氢叶酸还原酶抑制剂的活性预测》由会员分享,可在线阅读,更多相关《机器学习方法用于二氢叶酸还原酶抑制剂的活性预测(58页珍藏版)》请在金锄头文库上搜索。

1、Y 1 2 l2 2 0 9 陟7 lI | 大嚣 陟J l 犬罄 硕士学位论文 题 目扭墨堂翌立法题王三氢吐酸还厘酶控剑型的适性亟型 完成日期呈Q Q ! 生互旦 培养单位四刖太堂焦堂堂院 指导教师奎淫苤副麴援 专 研究方向生塑篮皇堂 授予学位日期2 Q Q 2 笙旦目 四川大学硕士学位论文 声明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的 研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含 其他人已经发表或撰写过的研究成果,也不包含为获得I 卫1 ) 1 1 大学或其他教育机 构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡 献均

2、已在论文中作了明确的说明并表示谢意。 本学位论文成果是本人在四川大学读书期间在导师指导下取得的,论文成 果归四川大学所有,特此声明。 煨荔彳尹 学 生:诱唬橱 四川大学硕士学位论文 机器学习方法用于二氢叶酸还原酶抑制剂 的活性预测 化学生物学专业 研究生陈晓梅指导教师李泽荣副教授 本论文研究了机器学习方法在化合物的药物活性上,进行分类预测的应用。 全文包括两个章节,第一章,叙述了支持向量学习机分类方法以及其它几种机 器学习方法,用于分类建模的理论基础;第二章,主要是对方法的实际应用型 研究,即机器学习分类方法在二氢叶酸还原酶抑制剂药物的活性分类预测中的 运用。 在第一章中,首先对计算机辅助药物

3、分子设计的发展背景及研究概况进行 了介绍,并详细阐述了支持向量学习机、人工神经网络,调节性逻辑回归,和 K - 最临近等机器学习方法的理论基础;对在建模初期,分子几何结构的优化及 相关软件进行了说明;概述了用来描述分子物理及化学性质的描述符的定义、 名称以及分类;对用于训练集设计的R a n d o mS e l e c t i o n 算法、K o h o n e n s e l f - o r g a n i s i n gm a p s 算法和K e n n a r d S t o n e 算法,以及用于变量筛选的 M e t r o p o l i sM o n t eC a r l

4、o 模拟退火方法和遗传算法进行了阐述;最后就模型好 坏的评价标准进行了说明。 第二章主要是用机器学习方法对二氢叶酸还原酶抑制剂,进行了药物活性 的分类预测。首先对已知活性的7 6 1 个二氢叶酸还原酶抑制剂分子结构进行几 何构型优化,在此结构基础上,计算了4 6 3 个组成描述符和拓扑描述符,以此 来表征化合物分子的物理及化学特征。在训练集设计时,使用了K e n n a r d S t o n e 方法和R a n d o m 方法,对其基础上建立模型的分类结果进行了比较,说明 K e n n a r d - S t o n e 方法更适宜于构建模型。因此,在比较建模的机器学习方法时, 1

5、粤型查堂婴主兰垡笙奎 就只使用了K e n n a r d S t o n e 方法进行训练集的设计,构造好训练集以及测试集 用于建模,并使用预测正确率来评估模型的预测能力。对于支持向量学习机、 人工神经网络,调节性逻辑回归,和K 最临近等机器学习方法所建模型的预测 结果进行对比,评定支持向量学习机建立的模型最优,有较好的预测结果,其 总体预测正确率为8 9 0 1 。在此基础上,经过标准化和进行M e t r o p o l i sM o n t e C a r l o 模拟退火算法的变量筛选,对描述符进一步处理,最终筛选出1 5 8 个对 预测结果影响较大的描述符。最终建立的模型的预测结果

6、进一步得到改善,其 总体预测正确率提高到了9 1 6 2 。说明了通过合适的训练集设计及变量选择, 支持向量学习机方法可很好地用于二氢叶酸还原酶抑制剂的活性分类预测。 在二氢叶酸还原酶抑制剂的活性分类预测上,有较好结果的支持向量学习 机方法,可通过训练集的设计和变量选择来改善模型。通过使用K e n n a r d - S t o n e 方法进行训练集的设计以及M e t r o p o l i sM o n t eC a r l o 模拟退火方法进行变量筛 选,可以有效的减少噪音变量,简化模型,使得模型得到优化,预测结果得到 较为明显的提高。 关键词:支持向量学习机机器学习方法分子描述符变

7、量筛选训练集设 计二氢叶酸还原酶抑制剂 2 四J I X 学硕士学位论文 P r e d i c t i o no f D i h y d r o f o l a t eR e d u c t a s e I n h i b i t o r s A c t i v i t yu s i n gM a c h i n eL e a r n i n gM e t h o d s M a j o r C h e m i c a lB i o l o g y S t u d e n t :X i a o - M e iC h e n S u p e r v i s o r :A s s o c i a

8、 t eP r o f e s s o rZ e - R o n gL i I l lt h i sd i s s e r t a t i o n , m a c h i n e - l e a r n i n gm e t h o d sw e r ee m p l o y e dt om o d e lt h e d i s c r i m i n a t i o nb e t w e e nt h ea c t i v i t ya n di n a c t i v i t yf o rc h e m i c a lc o m p o u n d s T h e d i s s e r

9、t a t i o nc o n s i s t so ft w op a r t s T h ef i r s ts e c t i o nd e s c r i b e dt h ef u n d a m e n t a lo f m a c h i n el e a r n i n gm e t h o d s T h es e c o n ds e c t i o nw a st h ep r e d i c t i o no ft h eb i o a c t i v i t y o fd i h y d r o f o l a t er e d u c t a s e ( D H

10、F R ) i n h i b i t o r sb ym a c h i n el e a r n i n gm e t h o d s I nt h ef i r s tc h a p t e r , a ni n t r o d u c t i o nt oC o m p u t e r - A i d e dD r a g D e s i g nw a sg i v e n T h e o r i e so fs e v e r a lm a c h i n el e a r n i n gm e t h o d s ,i n c l u d i n gS u p p o r tV e

11、 c t o rM a c h i n e ( S V M ) ,A r t i f i c a lN e u r a lN e t w o r k ( A N N ) ,L o g i s t i cR e g r e s s i o n a n dK - N e a r e s t N e i g h b o rc l a s s i f i c a t i o n ( K - N N ) w e r ed e s c r i b e d T h ed e s c r i p t o r se n c o d i n gs t r u c t u r a l a n dp h y s i

12、c o c h e m i c a lp r o p e r t i e so fm o l e c u l e sw e r ed e f m e da n dl i s t e d T h ep r i n c i p l e o fm e t h o d su s e df o rd e s i g n i n gt h e 仃a l m n gs e t ,i n c l u d i n gR a n d o ms e l e c t i o n , K o h o n e l ls e l f - o r g a n i s i n gm a p sa n dK e n n a r

13、d - S t o n em e t h o d ,a n ds e v e r a lm e t h o d s u s e di nt h ep r o c e s so ff e a t u r es e l e c t i o n s u c ha sM e t r o p o l i sM o n t eC a r l oa l g o r i t h m a n dg e n e t i ca l g o r i t h m ,w e r en a r r a t e d F i n a l l y , t h es t a n d a r dt oe s t i m a t em

14、 o d e l sw a s g i v e n I nt h es e c o n dc r a t e r , M a c h i n el e a r n i n gm e t h o d s ,i n c h i d i n gS V M ,A N N ,L R a n dK - N N ,w e r eu s e dt od e v e l o pt h ec l a s s i f i c a t i o nm o d e l s At o t a lo f 4 6 3d e s c r i p t o r s 3 四川大学硕士学位论文 w e r ec a l c u l a

15、t e dt oc h a r a c t e r i z et h es t r u c t u r a la n dp h y s i c o c h e m i c a lp r o p e r t i e sf o r e a c ho ft h e7 6 1D H F Ri n h i b i t o r s C o m p a r i n gt h er e s u l t so fd i f f e r e n tt r a i n i n gs e t m e t h o d s ,i n c l u d i n gR a n d o m s e l e c t i o nm

16、e t h o da n dK e n n a r d S t o n em e t h o d ,w ef o u n d t h a tK e n n a r d - S t o n em e t h o dw a sb e t t e rt h a nR a n d o ms e l e c t i o nm e t h o d M e t r o p o l i s M o n t eC a r l os i m u l a t e dm e t h o dW a sU S e df o rf e a t u r es e l e c t i o n I tW a ss h o w nt h a t S V Mm e t h o do u t p e r f o r m so t h e rm a c h i n el e a r n i n gm e t h o d su s e di nt h i ss t u d ya n d t h ef i n a lS V Mm o d e la f t e rf e

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号