生物信息学方法和生物基因芯片进行癌症诊断方面的研究

上传人:xzh****18 文档编号:45895113 上传时间:2018-06-20 格式:PDF 页数:71 大小:2.01MB
返回 下载 相关 举报
生物信息学方法和生物基因芯片进行癌症诊断方面的研究_第1页
第1页 / 共71页
生物信息学方法和生物基因芯片进行癌症诊断方面的研究_第2页
第2页 / 共71页
生物信息学方法和生物基因芯片进行癌症诊断方面的研究_第3页
第3页 / 共71页
生物信息学方法和生物基因芯片进行癌症诊断方面的研究_第4页
第4页 / 共71页
生物信息学方法和生物基因芯片进行癌症诊断方面的研究_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《生物信息学方法和生物基因芯片进行癌症诊断方面的研究》由会员分享,可在线阅读,更多相关《生物信息学方法和生物基因芯片进行癌症诊断方面的研究(71页珍藏版)》请在金锄头文库上搜索。

1、申请同济大学理学硕士学位论文y9 3 7 4 5 6生物信息学方法和生物基因芯片进行癌症诊断方面的研究( 国家自然科学基金项目编号:2 0 2 7 5 0 2 6 )培养单位:化学系一级学科:化学二级学科:分析化学研究生:姚微佳指导教师:李通化教授二o o 六年三月塑矍一自从2 0 魁纪9 0 年代以柬,荚圉率先启动盼人类基因组计划( H u m a n G e n o m eP r o j e c t ,简称H G P ) 带采了前所来宵的数据爆簿,然丽数掇并不释于锩息和知议,仅愚绩崽秘知谖酾滚泉,对科学家雨畜,最关键韵问题在于如何飙数据巾找到揭示生命奥秘的钥匙。如此伟大的动力就诞生了一门新

2、兴的交叉科学,这就是生秘信息学。通过对生物学实验数据驹获敬、秀H 互、存储、检索与分析,生耱信惑学或为解开生物数据掰蕊含艴生物学懑义静强大l 二其。鞠辩,睫着久类基因组计划进一步的快速发殿,生物信息学在人类疾痫与功能熬因的发现与说剐、蒸因与蛋自旗的表达与功穗研究方掰都发挥着荚键的作用。尤葜在疾瘸诊断领域,整穆信息学方法跨合粥年代串籁发瓣起来酾一矮蔫洽生秘技术生物基因芯片,通过对垒基因表达躅谱进行数搬挖掘,成功地将临庶袭征不明缄容易谈诊静恶往葺申瘸准确、快速堍区分开,甄丽为戆癜的翠期诊断与及时治疗擞密了羹婪静菱献。本课题的踅点就是利用基因芯片数据产生的基因袭达图谱和生物倍息学中的模式谈潮方法,对

3、不弼静类豹癞癌样本蕊戳分类。针对蕊于芯片数据韵复杂瞧秘各静分癸方法静耱点。文尊l 毽翅7 两静不同熬模鼗识澍钵系,箕蕊本思想均为先降维辩分类最后预报。第一种是分别使用t 检验、方麓分析进行变量选择线使用援蕊数迸 亍数爨鬟组完成障舔,再每A Z 神经瓣络簿法是缀袈殴瓣站台完艘分类预摄;第二秘是竣映瓣( K e r n e lT r i c k ) 方法舄偏最小二藏联用糯成的非线性偏最小二莱作为分类器。通过对急性白血瘸、肺癌、前列腺癌以投扩敬丈转帮耱辩墨瘗等疆套基鞠芯片数据静实验,涯蟋了本文提蹬豹分类方法爨有镘蠢鳃正确率鞠较好的稳定性。此井,诺助L e a v e O n e O u t ( L

4、O O ) 秘5 - f o l d交叉验i 正以及方差分析簿统计学分析方法,对不同降缜方拣的降维效聚以及数攥囊特点避莲子了讨谂。本文最大剑耨之她为培核映射# l 入降续操馋中,使通常处理多样本少变墩的核函数巧妙地应用于少样本多变擞的问题中。由于榉零集难度大,一般避杼基因芯片襄验的群本个数在2 0 0 娃蠹,大多1 0 0 左右,磷基因个数均在5 0 0 0以上。这种变量数远大予样本数固体系,对降壤有非常离的要求以及敏感褴。传统基因选择方法,即通过计算不同规则下的蘑要性大小指标值,继而排序,最后确定重要基困的方法,往往其骞比较丈蚋“主双性”;共且不围方法产生的重要基困也不尽相同,往往蹙非常不同

5、。麟姥,在线性分类器之霞,利用梭函数将高维的复杂体系映射至特征空间,後新叠三成的数据斑阵的维数等同于琢数据的撑本缨数,秃形中实现了降绻,并大大掇裹了分类的正确烛网时降低了诗算复杂度。为了使特链映射满足不同数据集的要求,文巾采用了多项式核函数、A N O V A 核涵数、= 级多项式核函数,多项式一A N O V A 桉函数等闼种不同形式的核函数,并借助比对臻数( A I i g n m e n tI n d e x ,A I ) 积特镬向量聚类指数( C l u s t I n d e 墨C I ) ,针对不l 谫数据确定不间曲核黼数,以达到最好的分类教撤。论文最后,激预报正确辜为标准,给出了

6、所有释维方法对与每襄芯片数据处瑾结粜豹综合评价。基因蕊片数据,在癌症诊断领域的成鲻得到越米越多的关液,嚣种化学、物理、生物、数学、统计等学科都灵活蛾斑掰于基因芯片数据挖搦躺研究中。但万自钥匙是不存在的,没有一种方法可以对所有的芯片和所有的燎瘫都褥到准确的分辨结果。因此,本文的数据处理方法也不是对艨有的实验数据其备箍好的分类效果,稳筵在越来越多酌生物信惠学研究者静不懈努力下,生物技术结合数据分析方法会成为癌症诊断的突破口,为无数癜癌患者带来褶青。蓑键谪;生物基因芯片,核映射,降维,S O M ,t - 检骏,方差分析,托对系数,待征麓鬣躐离聚娄指数,K P L S ,L O O ,5 - f o

7、 l d 交叉狳谨I I二些壁璺塑A B S T R A C TW i t ht h ea d v e n to fH u m a nG e n o m eP r o j e c tl a u n c h e db yt h eU n i t e dS t a t e si nt I l e1 9 9 0 s ,d a t ae x p l o s i o nt h a th a sn e v e re m e r g e db e f o r eb e c a m et h er e s e a r c hf o c u so ft h o u s a n d so fs c i e n t

8、 i s t s A sf a ra sag r e a tn u m b e ro fm a t e r i a l sp r o d u c e db yt h eb i o l o g i c a le x p e r i m e n t sa r ec o n c e m e d ,o r i g i n a ld a t ai st h eS o H r c eo fi n f o r m a t i o na n db e g i n n i n go fk n o w l e d g e M o r ei m p o r t a n t l yk e yf o rl i f ea

9、 n dn a t u r eC a nb ep r o b a b l yr e a c h e di nt h ee x p l o r a t i o no fi n f o r m a t i o na n dk n o w l e d g e T h e r e f o r eB i o i n f o r m a t i c sc o m e si n t ob e i n g ,w h i c hh a sb e e ns i g n i f i c a n t l ym o t i v a t e db yt h i sg r e a ti n c e n t i v e B

10、i o i n f o r m a t i c sh a sb e c o m e8p o w e r f u lt o o lt or e v e a lt h eb i o l o g i c a lm e a n i n gb yas e r i e so fd a t a - o r i e n t e dw o r k ,i n c l u d i n gd a t aa c q u i r e m e n t ,d a t am o d i f i c a t i o n ,d a t as t o r a g ea n dd a t aa n a l y s i s M e a

11、n w h i l eB i o i n f o r m a f i c sh a sp l a y e da ni m p o r t a n tr o l ei nt h es t u d yo ff u n c t i o n a lg e n ei d e n t i f i c a t i o n ,i l l n e s sd i a g n o s i s ,g e n ee x p r e s s i o np r o f i l i n ga n dp r o t e i nf u n c t i o n E s p e c i a l l yi nv i r t u eo

12、f m i c r o a r r a yt e c h n o l o g ya n dd a t am i n i n gw o r kd i f f e r e n tm a l i g nt u n l o r sw i t hs i m i l a rc l i n i c a lr e s p o n s e sa n dh i s t o p a t h o l o g i e a la p p e a r a n c eC a nb ep r e c i s e l ya n dp r o m p t l yc l a s s i f i e d I ti sw e l lk

13、n o w nt h a tc a n c e rt r e a t m e n ti sl a r g e l yi n f l u e n c e db yt h et u m o rd e v e l o p m e n tp h a s e I na n o t h e rw o r d ,t h ee a r l i e rt h ec a n c e ri sd i a g n o s e d ,t h eb e R e rt h e r a p ye f f e c tC a nb eg a i n e df o rt h ep a t i e n t s T ot h eg r

14、 e a te x t e n ti n t e g r a t i o no fm i c r o a r r a yt e c h n o l o g ya n dB i o i n f o r m a t i c sm e t h o d sd e v o t e sm u c ht ot h ee a r l yd i a g n o s i sa n dt i m e l yt r e a t m e n to f e a n c e r I nt h i sp a p e r , p a t t e r nr e c o g n i t i o nm e t h o d sa r

15、em a i nr e s e a r c hw o r k ,w h i c hp r i m a r i l ya r eu s e df o rd i s c r i m i n a t i n gt h ed i f f e r e n tk i n d so fc a n c e rb yg e n ee x p r e s s i o np r o f i l i n gp r o d u c e db ym i c r o a r r a yt e c h n o l o g y C o n s i d e r i n gt h a tc o m p l e x i t yo f

16、a r r a yd a t aa n da d v a n t a g eo fd i i r e r e n tc l a s s i f i e r s ,t w oc l a s s i f i c a t i o ns y s t e m sa r ee m p l o y e d H o w e v e rb o t ho ft h e mf o l l o wt h es a l n ef u n d a m e n t a lp r o c e s s :f i r s td i m e n s i o n a l i t yr e d u c t i o n ,t h e nm o d e l i n ga n df i n a l l yp r e d i c t i o n F o rt h ef i r s tw a yg e n es e l e c t i o na n dd a t ar e c o n s t r u c t i o nb a s e do nk e

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号