贝叶斯统计思想的基因表达数据分析

上传人:w****i 文档编号:104509049 上传时间:2019-10-09 格式:PDF 页数:63 大小:1.93MB
返回 下载 相关 举报
贝叶斯统计思想的基因表达数据分析_第1页
第1页 / 共63页
贝叶斯统计思想的基因表达数据分析_第2页
第2页 / 共63页
贝叶斯统计思想的基因表达数据分析_第3页
第3页 / 共63页
贝叶斯统计思想的基因表达数据分析_第4页
第4页 / 共63页
贝叶斯统计思想的基因表达数据分析_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《贝叶斯统计思想的基因表达数据分析》由会员分享,可在线阅读,更多相关《贝叶斯统计思想的基因表达数据分析(63页珍藏版)》请在金锄头文库上搜索。

1、上海大学 硕士学位论文 基于贝叶斯统计思想的基因表达数据分析 姓名:孟宪花 申请学位级别:硕士 专业:系统分析与集成 指导教师:王翼飞 20050501 2 0 0 4 年上海大学硕士学位论文 摘要 生命体是个开放的复杂巨系统,基因组计划产出的生物学及其衍生的海量数 据为使用从定性到定量的综合集成法研究各种生命现象,揭示生命系统的运行机 制和内在规律创造了条件。 人类基因组草图基本绘就之后,基因组学研究的重心逐渐转向了基因功能的 研究,也就是进入了“后基因组学时代”。基因芯片技术的高通量特点使人们得 以研究大量基因同时表达的情况,无疑为基因功能研究提供了一种强有力的工 具。基因芯片正在基因表达

2、分析、疾病诊断和治疗、新药发现等众多领域得到广 泛的应用。但是基因芯片的应用过程产生了大量的关系复杂的数据,如何处理和 分析这些数据并从中挖掘出有意义的生物信息已成为当前生命科学,特别是生物 信息学的一个重要的研究课题。 贝叶斯统计是在与频率派经典统计的不断争论中逐渐完善起来的,是基于贝 叶斯定理而发展起来用于系统地阐述和解决统计问题的方法。贝叶斯统计推断理 论几乎可以作为每一个学科的研究工具之一;而且由于贝叶斯计算的快速发展, 它在实践中获得了广泛的应用。现在,贝叶斯统计分析也正在被积极地引入到生 物信息学的研究中去。 本文首先对基因芯片的产生和它在后基因组学研究中的重要地位做了简单 介绍,

3、阐述了基因芯片数据分析对生物学功能研究的意义。其次,我们系统地阐 述了贝叶斯统计分析方法的思想、先验分布的选取、后验推断以及贝叶斯计算; 并且简单介绍了在不同生物学复杂层次上,常用的基因芯片数据分析方法。最后, 将贝叶斯分析思想应用到基因芯片数据分析中,建立了基因芯片数据的特征基因 筛选模型和贝叶斯两总体分类模型。一方面我们将建立的贝叶斯两总体模型应用 于乳腺癌基因芯片数据,对携带B R C A l 和B R C A 2 突变的患者进行两类别分类; 另一方面,分别采用O V A 和A P 方法将多总体的乳腺癌基因芯片数据分类问题 转化为两总体分类,利用以上建立的贝叶斯分类模型建立多个两总体分类

4、器,并 采用一定的方法将各个分类器的分类结果进行综合,从而得到多分类问题的分类 结果;不仅如此,由于基因芯片数据的“小样本,多变量”特点,应用交叉证实 方法对建立的贝叶斯分类模型的分类效果和模型稳定性进行了评估,而且与 S V M 方法的分类结果进行了比较。 关键 司:后基因组学;基因芯片;贝叶斯分析;类别分类 2 0 0 4 年上海大学硕士学位论文 A b s t r a c t L i f ei sa no p e na n dc o m p l i c a t e ds y s t e m T h ed e r i v e db i o l o g yf r o mG e n o m e

5、 p r o j e c ta n dc o r r e s p o n d i n gg r e a ta m o u n to fd a t ap r o v i d et h eo p p o r t u n i t yt or e s e a r c ho n av a r i e t yo fl i f ep h e n o m e n o na n dd i s c l o s et h eo p e r a t i n gm e c h a n i c sa n di n s i d el a wo f l i f es y s t e m A f t e rt h ea c h

6、 i e v e m e n to fh u m a ng e n o m eg r a p h ,t h ee m p h a s i so fb i o l o g i c a l r e s e a r c hi sc h a n g i n gf r o mt h es t u d yo fs e q u e n c e st og e n ef u n c t i o n T h i sa l s oi n d i c a t e s t h ec o m i n go fp o s t - g e n o m i c se r a T h ed e v e l o p m e n

7、to fg e n ec h i pt e c h n i q u ea n di t s o u t s t a n d i n gh i g h - t h r o u g h p u tc h a r a c t e r i s t i c sm a k ep e o p l ea b l et os t u d ya m o u n t so f s i m u l t a n e o u s l ye x p r e s s e dg e n e s T h e r e f o r e ,t h i st e c h n i q u ei su n d o u b t e d l y

8、b e c o m i n g o n eo ft h ep o w e r f u lt o o l so nt h eg e n ef u n c t i o nr e s e a r c ha n di sc o m p r e h e n s i v e l y a p p l i e di nt h ea n a l y s i so fg e n ee x p r e s s i o np r o f i l e ,d i s e a s e sd i a g n o s i sa n dt h e r a p y , d i s c o v e r yo fn e wm e d

9、i c i n ea n ds oo n H o w e v e r , t h eg e n ec h i pp r o d u c e si n t r i c a t e l y c o - r e l a t e dd a t a S oh o wt od e a lw i t ha n da n a l y s i st h e s ed a t aa n dt r yt oa c h i e v e m e a n i n g f u lb i o l o g i c a li n f o r m a t i o na r es i g n i f i c a n ts u b j

10、 e c to fb i o i n f o r m a t i c s B a y e s i a ns t a t i s t i c s ,w h i c hi sg r a d u a l l yd e v e l o p e dd u r i n gt h ec o u r s eo fd i s p u t i n g w i t ht h et r a d i t i o n a lf r e q u e n c ys t a t i s t i c s ,i sam e t h o dt os t a t ea n ds o l v es t a t i s t i c a l

11、 p r o b l e m sb a s e do nt h eB a y e s i a nt h e o r e m A c c o r d i n gt ot h er e f e r e n c e sf r o mh o m ea n d a b r o a d ,t h et h e o r yo fB a y e s i a ns t a t i s t i c st h a ti sb e c o m i n go n eo ft h er e s e a r c ht o o l si n n e a r l ye v e r yd i s c i p l i n ei s

12、c o m p r e h e n s i v e l ya p p l i e do na l lw a l k so fl i f e I na d d i t i o n , r e c e n t l yB a y e s i a ns t a t i s t i c si sb e i n gu s e di nt h eb i o i n f o r m a t i c s F i r s t l y , w eb r i e f l yi n t r o d u c et h ea d v e n to fg e n ec h i pa n di t si m p o r t a

13、 n ts t a t u si n t h es t u d yo fp o s t g e n o m i c s ,a l s os t a t et h a tt h ea n a l y s i so fm i c r o a r r a yd a t ac o n t r i b u t e s al o tt ot h ef u n c t i o n a l 咖d yo fo r g a n i s m S e c o n d l y , t h eB a y e s i a ns t a t i s t i c si s s y s t e m a t i c a l l y

14、e x p a t i a t e do nt h es e l e c t i o no f p r i o rd i s t r i b u t i o no f p a r a m e t e r s ,p o s t e r i o r i n f e r e n c e s ,a n dB a y e s i a nc o m p u t a t i o n M o r e o v e r , t h ef r e q u e n t l yu s e dm e t h o d st o a n a l y z em i c r o a r r a yd a t aa r ei n

15、t r o d u c e do nt h ed i f f e r e n tb i o l o g i c a l l yc o m p l i c a t e d l e v e l s ,T h i r d l y ,t h ei d e o l o g yo fB a y e s i a ns t a t i s t i c s i sa p p l i e do nt h ed a t aa n a l y s i so f g e n ec h i p ,w h i c hl e a d st ot h ec o n s t r u c t i o no fc h a r a c

16、 t e r i z e dg e n e ss e l e c t i o nm o d e la n d I l 2 0 0 4 年卜海大学硕士学位论文 B a y e s i a nc l a s s i f i c a t i o nm o d e l O nt h eo n eh a n d ,w ea p p l i e dt h eg e n es e l e c t i o nm o d e l a n dc l a s s i f i c a t i o nm o d e lo nt h eb r e a s tc a n c e rm i c r o a r r a yd a t at oc l a s s i f yt h ep a t i e n t s w i t ht h em u t a t i o nB R C A la n dB R C A 2 O nt h eo t h e rh a n d ,O V Aa n dA Pm e t h o d sa r e a d o p t e dr e s p e c t

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号