基于代谢路径的生物网络比对算法

上传人:E**** 文档编号:118002938 上传时间:2019-12-11 格式:PDF 页数:54 大小:1.90MB
返回 下载 相关 举报
基于代谢路径的生物网络比对算法_第1页
第1页 / 共54页
基于代谢路径的生物网络比对算法_第2页
第2页 / 共54页
基于代谢路径的生物网络比对算法_第3页
第3页 / 共54页
基于代谢路径的生物网络比对算法_第4页
第4页 / 共54页
基于代谢路径的生物网络比对算法_第5页
第5页 / 共54页
点击查看更多>>
资源描述

《基于代谢路径的生物网络比对算法》由会员分享,可在线阅读,更多相关《基于代谢路径的生物网络比对算法(54页珍藏版)》请在金锄头文库上搜索。

1、创新性声明 本人声明所呈交的论文是我个人在导师指导下进行的研究工作及取得的研究 成果。尽我所知,除了文中特别加以标注和致谢中所罗列的内容以外,论文中不 包含其他人已经发表或撰写过的研究成果;也不包含为获得西安电子科技大学或 其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做 的任何贡献均已在论文中做了明确的说明并表示了谢意。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:气纵昝殇 日期 撕口7 歹,广 关于论文使用授权的说明 本人完全了解西安电子科技大学有关保留和使用学位论文的规定,即:研究 生在校攻读学位期间论文工作的知识产权单位属西安电子科技大学。本

2、人保证毕 业离校后,发表论文或使用论文工作成果时署名单位仍然为西安电子科技大学。 学校有权保留送交论文的复印件,允许查阅和借阅论文;学校可以公布论文的全 部或部分内容,可以允许采用影印、缩印或其它复制手段保存论文。( 保密的论文 在解密后遵守此规定) 本学位论文属于保密在年解密后适用本授权书。 o、门 本人签名:库嫦 日期 沙吖7 ;,舻 翩摊。殇纵醐研多、7 。 t 1 1 1 11 1I lll llL1 1 1 1 1IllI 18 6 5 4 4 1 捅要 在对生物网络数据的分析中,一个很重要的工作就是进行同源搜索。同源搜 索是通过网络图的比对来实现的,近年来随着网络比对技术在生物研究

3、领域中所 占的地位逐渐加重,比对算法也得到了深入而广泛的研究,也因此出现了许多有 效的生物网络比对算法。 本文首先对已有的生物网络比对方法做了详细的介绍,并分析得出这些算法都 是通过对图的拓扑逻辑结构做出某种限制来提出的,因而这些算法的应用性自然 也受到了限制。在此基础上,本文提出一种新的算法。该算法首先将代谢网络抽 象成有向图并以路径为基本单位建立了比对的模型。之后通过将酶的E Cn u m b e r 进行简单的分类,并利用酶之间的相似度值计算方法设定了比对的得分机制。 本文用K E G G 代谢路径网络的数据进行了大量的仿真实验,实验结果表明该 算法对图的拓扑逻辑结构没有做出任何的限制,

4、在拥有了更为广泛的应用空间之 外,同时也保证了一定的运行效率。 关键词:生物网络比对同源 A b s t r a c t A ni m p o r t a n tt o o l f o ra n a l y z i n gb i o l o g i c a ln e t w o r k si st h ea b i l i t yt op e r f o r m h o m o l o g ys e a r c h e s ,w h i c hi sc o m p l e t e dt h r o u g ht h ea l i g n m e n to fn e t w o r k s I

5、nr e c e n t y e a r s ,n e t w o r kc o m p a r i s o nt e c h n i q u e sp r o m i s et ot a k ea ni n c r e a s i n gr o l ei nt h ef i e l do f b i o l o g i c a lr e s e a r c h ,t h i sp r o b l e mh a sb e e nw i d e l ya n dd e e p l ys t u d i e da n dm a n ye f f i c i e n t a l g o r i t

6、h m sa t ea v a i l a b l e I nt h i sp a p e r , w ef w s t l yi n t r o d u c e ds o m ee f f i c i e n ta l g o r i t h m s ,a n da n a l y z e dt h a ta l l t h i sa l g o r i t h m sp r o p o s e dt os o l v et h i sp r o b l e mb yr e s t r i c t i n gt h et o p o l o g yo ft h eg r a p h s T

7、h i sr e s t r i c t i o n ,h o w e v e r , s e v e r e l yl i m i t st h ea p p l i c a b i l i t yo ft h e i ra l g o r i t h m B a s e do n t h ea n a l y s i so ft h ee x i s t i n ga l g o r i t h m ,w ep r e s e n tan e wa l g o r i t h m W ef i r s t l ya b s t r a c t t h em e t a b o l i cp

8、 a t h w a y sa st h eg r a p ha n dw em o d e l e dt h ea l i g n m e n tb a s e do np a t h w a y T h e nw em a k eas c o r i n gm e c h a n i s mb yc l a s s i f y i n gt h ee n z y m e su s i n gt h e i rE C n u m b e r s W ed oe x p e r i m e n t su s i n gm e t a b o l i cp a t h w a y sf r o

9、mt h eK E G Gd a t a b a s e T h e s i m u l a t i o nr e s u l t ss h o wt h a to u ra l g o r i t h mh a saw i d e rr a n g eo fa p p l i c a b i l i t yt h a nt h e r e s t r i c t e da p p r o a c h S o ,o u ra l g o r i t h mi se f f e c t i v ea n da p p l i c a b l e K e y w o r d s :B i o l

10、o g i c a ln e t w o r kA l i g n m e n tH o m o l o g y 第一章绪论 第二章生物网络及相关问题 第三章基于代谢网络的比对算法 第四章实验结果与分析 4 1 2P A T H W A Y 等相关信息介绍3 2 4 2 实验结论以及相关讨论3 2 第五章总结与展望 致谢 参考文献 研究成果 3 7 3 9 4 1 4 5 第一章绪论 第一章绪论 传统的生物学是一门实验科学,生物学研究依赖于对实验数据的处理和分析。 生物学同时也是- i J 发现科学,通过实验发现新的现象、新的规律,经过分析、 归纳和总结,提炼出新的生物学知识。随着生物科学和技

11、术的不断发展,生物数 据的积累速度将不断加快。因此,也就对生物数据的科学分析方法和使用分析工 具提出了更新、更高的要求。 1 1 生物信息学背景 2 0 世纪是科学技术迅速发展的世纪,物理和化学的发展使我们可以清楚地认 识物质的组成,从分子、原子、电子等各层次上深入地了解微观世界。生命科学 在2 0 世纪同样也得到了发展,生理学、细胞生物学、分子生物学等学科的发展使 我们在器官、组织、细胞及大生物分子等各个层次认识了生命的物质基础。目前, 我们对生命的奥秘还不甚了解,对生命信息的组织、传递和表达还知之甚少。既 然这牵涉到信息的组织、传递和表达,我们就可以用信息学的方法和技术来尝试 认识和分析生

12、命信息,生物信息学就是这样- N 学科。 人类为了更深入地了解和认识自身,制定了宏伟的人类基因组计划。人类基 因组计划顺利实施,产生了大量的生物分子数据。据权威机构统计,目前生物分 子数据量每1 5 个月翻一番【。这些生物分子数据具有丰富的内涵,其背后隐藏着 人类目前尚不知道的生物学知识。充分利用这些数据,通过数据分析、处理揭示 这些数据的内涵,从而得到对人类有用的信息,是生物学家、数学家和计算机科 学家所面临的一个严峻的挑战。生物信息学就是为迎接这种挑战而发展起来的一 门新型学科,它是由生物学、应用数学和计算机科学相互交叉所形成的学科,是 当今生命科学和自然科学的重大前沿领域之一,也是2 1

13、 世纪自然科学的核心领域 之一。 生物信息学( b i o i n f o r m a t i c s ) 这个名词有许多不同的定义。从字面上来看,生物 信息学是将信息科学和技术应用于生物学。生物信息学广义的概念是指应用信息 科学的方法和技术,研究生物体系和生物过程中信息的存储、信息的内涵和信息 的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种 生物信息,或者也可以说成是生命科学中的信息科学。在生物学、医学的研究和 应用中,利用生物分子数据及其分析结果,可以大大提高研究和开发的科学性及 效率,如根据基因功能分析结果来检测与疾病有关的基因等。一般提到的“生物信 2 基于代谢

14、路径的生物网络比对算法 息学”就是指这个狭义的概念,更准确地说,应该是分子生物信息学( m o l e c u l a r b i o i n f o r m a t i c s ) 。 生物信息学以计算机、网络为工具,采用数学和信息科学的理论、方法和技 术去研究生物大分子,其研究重点主要落实在核酸和蛋白质两个方面,包括它们 的序列、结构和功能,生物信息学以基因组D N A 序列信息分析作为出发点,破译 遗传语言,认识遗传信息的组织规律,辨别隐藏在D N A 序列中的基因,掌握基因 调控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系进 行药物分子设计。与生物信息学相关的概念还

15、有计算分子生物学( c o m p u t a t i o n a l m o l e c u l a rb i o l o g y ) ,计算分子生物学主要研究分析方法,开发分析工具,促进生物 分子数据的分析。与生物信息学相关的另一个名词是生物计算( b i o c o m p u t i n g ) ,生 物计算特指用计算机技术分析和处理生物分子数据。 生物信息学的产生一方面是由于生物科学和技术的发展,另一方面是由于人 类基因组计划的实施。其实,早在2 0 世纪5 0 年代生物信息学就已经形成萌芽, 2 0 世纪7 0 年代已经产生生物信息学的基本思想,但是生物信息学的真正发展则是 在2

16、0 世纪9 0 年代,在人类基因组计划的催动下,生物信息学才得以迅猛发展。 人类基因组计划产生的生物分子数据是生物信息学的源泉,而人类基因组计划所 需要解决的问题是生物信息学发展的动力。 1 2 研究的目的及意义 揭示生物分子数据的内涵是生物信息学的长远目标。生物分子数据具有深刻的 内涵,数据之间存在着复杂的联系,这些数据中蕴含着丰富的生物学知识和生物 学规律。生物信息学的发展将揭示生物分子信息的本质,使人类彻底了解、掌握 遗传信息的编码、传递及表达,从而加快人类了解自身的进程。 目前生物信息学的主要任务是研究生物分子数据的获取、存储和查询,发展数 据分析方法。主要包括3 个方面。 第一是收集和管理生物分子数据,使得生物学研究人员能够方便地使用这些数 据,并为信息分析和数据挖掘打下基础。生物分子数据来自于生物学实验,应用 信息学技术收集和管理这些数据,将各种数据以一定的表示形式存放在计算机中, 建立数据库系统,并提供

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号