基于microarray时序表达数据识别周期表达基因

上传人:E**** 文档编号:115173548 上传时间:2019-11-12 格式:PDF 页数:57 大小:2.26MB
返回 下载 相关 举报
基于microarray时序表达数据识别周期表达基因_第1页
第1页 / 共57页
基于microarray时序表达数据识别周期表达基因_第2页
第2页 / 共57页
基于microarray时序表达数据识别周期表达基因_第3页
第3页 / 共57页
基于microarray时序表达数据识别周期表达基因_第4页
第4页 / 共57页
基于microarray时序表达数据识别周期表达基因_第5页
第5页 / 共57页
点击查看更多>>
资源描述

《基于microarray时序表达数据识别周期表达基因》由会员分享,可在线阅读,更多相关《基于microarray时序表达数据识别周期表达基因(57页珍藏版)》请在金锄头文库上搜索。

1、华中科技大学 硕士学位论文 基于Microarray时序表达数据识别周期表达基因 姓名:周到 申请学位级别:硕士 专业:生物信息技术 指导教师:周艳红 20070208 I 摘摘 要要 Microarray 技术常用于研究基因处在某个阶段或状态下的转录水平。将 Microarray 技术用于细胞周期的时序表达, 可以高通量地检测细胞周期过程中基因的 表达水平,得到反映全局变化的时序表达数据。由于某些基因在细胞周期过程中的 表达呈现出周期性,而这些周期表达基因在细胞周期过程中扮演了重要的角色,因 此,如何从时序表达数据中识别周期表达基因是当前研究的热点。 现有周期表达基因识别方法太过依赖于数学模

2、型,对周期表达基因的表达特性 分析认识不够,导致计算过程复杂,识别结果却不甚理想。为了解决这个问题,本 文先从周期表达基因的时序表达数据总结出周期表达基因的周期特性和峰值特性, 由此提出了一种将 Microarray 时序表达数据划分为若干个基因表达周期,并对周期 内的峰值特点进行评估以识别周期表达基因的方法。该方法能够快速简便地从时序 表达数据中识别周期表达基因。 选取了三组广泛使用的时序表达数据和两组可靠的周期表达基因集合对本文方 法和其他三种周期表达基因识别方法进行了对比测试。结果表明,本文提出的方法 能够有效地从各种 Microarray 时序表达数据中识别周期表达基因。 最后,对本文

3、方法识别出来的周期表达基因做了进一步的功能分析,功能分析 的结果表明,基因的表达模式与该基因作用的细胞周期阶段存在较为密切的关系; 还从一个新的角度考察了周期表达基因的功能编目富集水平,这些结果均有利于深 入理解细胞周期过程的分子机制。 关键词关键词:时序表达;周期表达基因;表达周期;峰值特性;功能水平 II Abstract Microarray experiments are widely used for gene profiling in different cell lines, various tissues, and conditions. High throughput mic

4、roarray technologies have made it possible to study the regulation of genes in cell cycle. As the genes which are significantly periordically expressed during the cell cycle play some very important roles in the cell cycle regulation, a new challenge to statisticians for analyzing the microarray exp

5、eriments is to identify which are statistically significantly periodically expressed genes. Most of the existing methods of periodical gene identification base on complicated mathematical models but ignore the underlying features in periodically expressed genes. Different from the complicated models

6、, a novel but effective method which bases on the periodic peak trait of periodically expressed gens is suggested in this article. The novel method can deal with the disturbance in microarray series data and obtain more accurate identification of periodically expressed genes. A comparison between ou

7、r novel method and other three models is made by applying these methods to three different time-course expression data, and the efficacy of different methods is checked by using two benchmark data sets. The results demonstrate that our method outperform other methods in the analysis of expression da

8、ta with disturbances. Finally, the cluster and functional analysis is applied to identifying periodically expressed genes. The results of cluster analysis suggest that the pattern of gene expression closely correlate with the cell stage in which the gene works. And the functional analysis reflects t

9、he functional abundance of the periodically expressed gene expression. The result of functional analysis is propitious to deeply understand the molecular mechanism of the cell cycle. Keywords: periodically expressed genes; cell cycle; gene expression data; peak trait 独创性声明独创性声明 本人声明所呈交的学位论文是我个人在导师指导

10、下进行的研究工作及取得 的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他 个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集 体,均已在文中以明确方式标明。本人完全意识到,本声明的法律结果由本人承 担。 学位论文作者签名: 日期: 年 月 日 学位论文版权使用授权书学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有 权保留并向国家有关部门或机构送交论文的复印件和电子版, 允许论文被查阅和 借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据 库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇

11、编本学位论文。 保密,在_年解密后适用本授权书。 不保密。 (请在以上方框内打“” ) 学位论文作者签名: 指导教师签名: 日期: 年 月 日 日期: 年 月 日 本论文属于 1 1 绪论绪论 1.1 课题来源课题来源 本论文在以下项目的资助下完成: (1)国家自然科学基金项目:大规模基因表达数据的多信息融合分析与知识发现 (30370354) ; (2)国家自然科学基金重大研究计划项目:基于知识挖掘与多级优化的基因辨识方 法研究(90203011) ; (3)高等学校博士学科点专项科研基金项目:基于知识发现与多信息融合的疾病基 因预测(20050487037) ; (4)教育部科技基础资源数

12、据平台项目:人类遗传基因信息数据整合及共享信息平 台(505010) ; (5)国家大平台项目:生物信息学网络计算应用系统。 1.2 研究背景、目的、意义研究背景、目的、意义 传统的生物信号检测方法大多只能用于单个细胞甚至单个分子, 这些实验方法速 度缓慢,且不能反映全局的生物信号。为了能够快速、高通量地检测生物信号,人 们提出了生物芯片(Microarray)的概念。生物芯片将生物分子(DNA、RNA,蛋白 质,组织等)固定在片基上,形成生物分子点阵,依赖生物分子之间的特定反应来 进行信号检测。根据固定物的不同,生物芯片又分为 DNA 芯片(DNA Microarray) 、 蛋白质芯片(P

13、rotein Microarray)等。自 20 世纪 90 年代中期生物芯片概念提出后, 生物芯片技术一直在飞速发展, 但目前而言, 技术最为成熟、 使用最为广泛的是 DNA 芯片。 DNA 芯片将一段代表基因的脱氧核糖核酸序列 (由寡聚核苷酸或 cDNA 构成) 固定在片基上,然后提取待测样本中的 RNA 进行反转录并染色后与固定在片基上的 序列杂交。杂交时,根据 DNA 分子的杂交特性,待测样本中的 cDNA(由 RNA 转录 成)会和片基上固定的互补 DNA 特异地结合。将杂交后的芯片洗脱去除未杂交的 2 cDNA,并用荧光检测,便可得到通过荧光强度反映的待测样本中各 RNA 的表达水

14、 平。整个 DNA 芯片检测过程如图 1.1 所示1。目前,DNA 芯片已被广泛应用于疾病 机理分析、疾病早期检测等方面2-4,能全面有效地反映出待测生物样本或生命过程 的基因表达情况。 Purify mRNA LabelLabel mRNA Purify cDNAcDNA Mix Hybridize and wash Scan and superimpose Repressed geneActivated gene Composite image 图 1.1 DNA 芯片检测过程示意图 1 本文讨论的重点是用 DNA 芯片检测细胞周期的表达情况所获得的 Microarray 时 序表达数据,

15、这些数据从全局的角度反映了细胞周期过程中的基因表达水平(覆盖 整个酵母基因组和细胞周期过程的多个时间点) ,可用于对细胞周期过程的研究。 细胞周期过程中发生着大量重要的分子活动,如 DNA 复制、染色体分离等,这 些分子活动都按照严格的时序进行,是生物体正常发育和繁殖的基础。研究表明, 细胞周期一旦紊乱,将有可能引起癌症等恶性疾病 5-7。早在 19 世纪 50 年代,人们 就开始用酵母作为模式生物进行对真核生物细胞周期相关的探索,目前已经在分子 水平对细胞周期过程有一定的了解,并发现不少与细胞周期密切相关的基因。但是 仅依靠这些基因并不能全面、整体地反应出细胞周期过程。由于传统实验技术手段

16、只能探测局部信号,因此难以在现有基础上作更进一步的探索和发现;而 Microarray 3 时序表达数据反映了细胞周期过程中所有基因的活动情况,可以借此来研究细胞周 期过程中整体的基因活动情况,进而探讨整个细胞周期过程的分子机理。 1.3 国内外研究现状国内外研究现状 1.3.1 时序表达数据时序表达数据 尽管目前已经有不少研究将 DNA 芯片用于检测人类细胞的时序表达情况8-10, 但与细胞周期相关的研究更多集中在酵母这种模式生物上。原因在于酵母是最简单 的真核生物,易于培养,全基因组基因数目规模小,当前已经积累了大量的酵母细 胞实验数据。更重要的是,细胞周期过程作为生物体中一种非常重要的功能过程, 在生物进化上有很高的保守性,因此,酵母细胞周期的研究结果对更高等的生物具 有非常大的参考价值,是对高等真核生物的细胞周期进行深入研究的基础。 在利用 DNA 芯片对酵母细胞进行细胞周期的研究前,必须要先对酵母细胞进行 同步,因为普通情况下酵母细胞的生长状态并不

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号