基于遗传算法的数据挖掘及其在生物信息学中的应用

上传人:豆浆 文档编号:39969608 上传时间:2018-05-21 格式:PDF 页数:56 大小:2.24MB
返回 下载 相关 举报
基于遗传算法的数据挖掘及其在生物信息学中的应用_第1页
第1页 / 共56页
基于遗传算法的数据挖掘及其在生物信息学中的应用_第2页
第2页 / 共56页
基于遗传算法的数据挖掘及其在生物信息学中的应用_第3页
第3页 / 共56页
基于遗传算法的数据挖掘及其在生物信息学中的应用_第4页
第4页 / 共56页
基于遗传算法的数据挖掘及其在生物信息学中的应用_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《基于遗传算法的数据挖掘及其在生物信息学中的应用》由会员分享,可在线阅读,更多相关《基于遗传算法的数据挖掘及其在生物信息学中的应用(56页珍藏版)》请在金锄头文库上搜索。

1、基于遗传算法的数据挖掘及其在生物信息学中的应用摘要本文的研究对象是基于遗传算法的数据挖掘方法及其这些方法在生物信息学中的应用 本文的研究分为相互关联的四个部分: 先,讨论用数据仓库,联机分析技术提高原有生物信息的数据呈现质量批文针对目 前广泛采用的B M B L 核酸序列数据库,提出了有针对性的联机分析处理( O L A P ) 实现方案r 该方案给出了从原始文件格式的数据到关系数据库再到O L A P 多维数据集的一系列数据转存实现方法该方案可以有效的解决原始数据文件分析速度隧,分析能力差的弱点一第二,利用遗传算法改进传统的数据挖掘方法在这方面,本文提出了基于遗传算法的K 均值聚类分析方法,

2、并把该方法与传统的K 均值聚类和基于单纯遗传算法的聚类方法做了 比较。f 仿真实验表明,该方法获得的结果全面优于其他两种方法该方法的缺点是,相对于K 均值聚类,聚类速度要慢一些、)第三,将改进的数据挖掘方法应用在生物信息学中本文针对氨基酸序列的聚类问题,提出了基于遗传算法的解决方案( 该方案把遗传算法,K 中心方法,动态规划算法和生物学研究中的一些新理论有机的融合在了一起。通过实验,我们认为,该方案具有很强的适用性和很好的聚类效果,是数据挖掘方法在生物信息学研究中一次有益的探索文第四,对生物信息学中已有数据挖掘算法做进一步的优化本章针对蛋白质的空间结构预测问题,在前人工作的基础上提出了基于并行

3、遗传算法的解决方案,该方案省略了原算法 每步遗传操作中的模拟退火过程,而用并行化的程序来弥补这种省略带来的解质量的下降实验表明,新方法有很快的运行速度和较好的解质量该方案也表明了将程序并行化的思想 引入到生物信息学研究中的曲要性遗,关键字:生物信息学,数据挖掘遗传算法。核酸数据库。蛋白质数据库。 联机分析处理聚类分析! 氨基酸序列聚荚蛋白质空间结构预测并行遗传算法。A b s t r a c tG e n e t i cA l g o r i t h mB a s e dD a t aM i n i n gf o rB i o i n f o r m a t i c sA b s t r a

4、c tT m sp a p e ri sb a s e do no u rr e s e a r c hp r o j e c ti nt h ea p p l i c a t i o no fd a t ad i s c o v e r ya n da n a l y s i st e c h n i q u e sf o rb i o i n f o r m a t i c sT h i sr e s e a r c hh a si n c l u d e dt h ef o l l o w i n gf o u rr e l a t e dp a r t s :F i r s t ,i

5、m p r o v i n gd a t ap r e s e n t a t i o nq u a l i t yb a s e do nd a t am i n i n gm e t h o dC h a p t e r4M e t h o do fO o l i n e A n a l y t i c a l P r o c e s s i n 9 0 1 1 N u d e o t i d e S e q u e n c e s D a t a b a s e g i v e sad e t a i l e d d i s c u s s i o n0 1 “ 1t h i sp a

6、r tT h i sc h a p t e rp r o p o s e dan e wm e t h o do f O n l i n eA n a l y t i c a lP r o c e s s i n go nE M B LN u c l e o t i d eS e q u e n c e sD a t a b a s eT h i ss c h e m ei su s e dt oa u t o m a t i c a l l yr e s t o r ef l a tf i l ed a t ai n t or e l a t i o n a ld a t a b a s e

7、 ,w h i c hi nt u r ni sc o n v e r t e di n t oO L A P Sd a t am a r t sT h ed a t am a r t sg r e a d yi m p r o v e dt h eq u a l i t ya n ds p e e do fa n a l y s i sW eb e l i e v et h a tt h i sm e t h o di sap o w e r f u la n df l e x i b l et o o la n dc a nb es e e na ss u c c e s s f u la

8、 p p l i c a t i o n o f d a t a m i n i n g i n m o l e c u l e b i o l o g yS e c o n d ,i m p r o v i n gt h et r a d i t i o n a ld a t am i n i n ga l g o r i t h u r s C h a p t e r5K - M e a n sC l u s t e t i l z gB a s e d0 1 1G e n e t 出A l g o r i t h mp r e s e n t ss u c ha ni m p r o v

9、 e m e n t W ec o m p a r e d0 1 2 f fm e t h o dw i t ht h et r a m o n a lK - M e a n sm e t h o da n dt h ed u s t e n n gm e t h o db a s e do ns i m p l eg e n e t i ca t g o d t h mT h ec o m p a r i s o nh a sp r o v e nt h a tO L l rm e t h o da c h i e v e sab e t t e rr e s u l tt h a nt h

10、 eo t h e rt w oT h ed r a w b a c ko ft h i sm e t h o di sac o m p a r a b l yl o w e rs p e e d 抽c l u s t e r i n gT h i r d ,a p p l i c a d o no f h e u r i s t i cd a t am i n i n ga p p r o a c h e sf o rb i o i n f u r m a t i c sC h a p t e r6C l u s t e r i n go f A n f f a o A c i d S e

11、q u e n c e s B a s e d o n G e n e t i c A l g o d t l u d e s c r i b e sO U t h e u r i s t i ca p p r o a c h t o t h ec l u s t e r i n go f a m i n oa c i ds e q u e n c e su s i n gG e n e t i cA l g o r i t h mT h em e t h o de v o l v e sap o p u l a t i o no fm e d o i d si naq u a s i - e

12、 v o l u t i o n a r ym a n n e r ,a n dg r a d u a l l yi m p r o v e st h ef i t n e s so ft h ep o p u l a t i o nb ym e a s u r i n gt h ef i m e s st h r o u g haf u n c t i o nf o re v a l u a t i n gd u s t e t i n gq u a l i t y T h i sm e t h o dc o m b i n e sG e n e t i cA l g o r i t h m

13、 ,K - M e d o i d sm e t h o d ,D y n a m i cP r o g r a m m i n ga n do t h e rn e wt h e o r i e shB i o l o g yE x p e r i m e n t sh a v ep r o v e nt h a t0 1 1 rm e t h o dh a sb e R e rp e r f o r m a n c et h a nK - M e d o i d sd u s t e r i n gm e t h o di nr e t u r n i n g1 n o r es a t

14、i s f y i n gr e s u l t F o u r t h ,i m p r o v i n gt h ee :i s t i n gd a t am i n i n ga l g o r i t t m a si nb i o i n f o t m a t i e sC h a p t e r7P r o t e i nC o n f o r m a t i o nP r e d i c t i o nB a s e do nP a r a l l e lG e n e t i cA l g o r i t h mi l l u s t r a t e sO U ts o l

15、 u t i o no nt h et o p i cF o rt h ep r e d i c t i o no fp r o t e i ns t m c t u r e w ep r o p o s e dt h es o l u t i o nb a s e do np a r a l l e lg e n e t i ca l g o r i t h mT h i ss o l u t i o nh a sm o d i f i e dt h ee x i s t i n ga l g o r i t h mb yo 【I l i t d f I gt h ep r o c e s

16、so fs i m u l a t e da n n e a l i n g ,w h i l ec o m p e n s a t i n gt h i sm o d i f i c a t i o nb yp a r a l l dp r o g r a m m i n gt om a i n t a i nt h er e s u l t sq u a l i t yE x p e r i m e n t sh a v ed e m o n s t r a t e dt h a tt h en e ws o l u t i o nh a sh i g h e rp r o c e s s i n gs p e e da n ds a l T t er e s u l t sq u a l i t y T h i ss o l u t i o na l s ou n d e r l i n e st h en e c e s s i t yo fi n t r o d u c i n gt h ei d e ao fp a

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号