《基于爬山算法的基因芯片图像网格定位毕业设计》由会员分享,可在线阅读,更多相关《基于爬山算法的基因芯片图像网格定位毕业设计(31页珍藏版)》请在金锄头文库上搜索。
1、I基于爬山算法的基因芯片图像网格定位摘要 划格是准确定位基因芯片图像中杂交荧光样点并提取样点杂交强度信息必不可少的步骤,本文实现了一种基于爬山法的基因芯片图像自动划格算法。爬山算法是一种局部择优的方法,采用启发式方法,是对深度优先搜索的一种改进,它利用反馈信息帮助生成解的决策,属于人工智能算法的一种。文中介绍了基因芯片图像预处理和爬山算法的相关知识,并介绍了运用爬山算法对基因芯片图像进行网格定位的方法,最后在MATLAB软件上编程实现,完成了对基因芯片的网格定位。运用该种方法对多幅基因芯片图像进行实验,都取得了不错的网格定位效果。实验表明,该算法能有效地对基因芯片点阵图像进行划格。关键词:爬山
2、算法 基因芯片图像 网格定位Gene Chip Image Grid Localization Based on Genetic AlgorithmAbstract Gridding is the essential step of accurate positioning fluorescent hybridization samples and extracted the information of hybridization intensity samples from microarray image. This paper proposed a aotomatic gridding
3、 and spot quantification technique based on hill-climbing approach,which tackes a microarray image as input. Hill-climbing apprach is a method select the best from part, using heuristic methods, is a improvement the depth-first search, and it uses feedback information to help calculate the solution,
4、which is belong to artificial intelligence algorithm. This paper introduces the gene chip image preprocessing algorithms and the knowledge of hill-climbing apprach,and alse introduces how to use the climbing apprach to grid and quantify the spot of the gene chip image, at the final, programming and
5、complete gridding spot quantification of gene chips in MATLAB. Several gene chip images experiments using this apprach result good. Experiments show that this algorithm can effectively grid the microarray image.Key words:hill-climbing approach Gene chip image Grid Location目 录摘要IIAbstract .III目 录IV第一
6、章 引言- 1 -1.1选题背景- 1 -1.2网格定位的主要方法- 1 -1.3 本论文的主要工作- 2 -第二章 基因芯片图像预处理- 3 -2.1 基因芯片图像的去噪处理- 3 -2.2 中值滤波- 3 -2.2.1 中值滤波原理- 3 -2.2.2 中值滤波的主要特征- 4 -2.3 自适应中值滤波- 5 -2.3.1 自适应中值滤波原理- 6 -2.3.2 自适应中值滤波在基因芯片图像中的应用- 6 -第三章 爬山法- 8 -3.1 爬山算法简介- 8 -3.2 爬山算法的一般描述- 8 -3.3 爬山算法的优缺点- 9 -第四章 基因芯片图像网格定位的实现- 10 -4.1基因芯片
7、网格定位的一般原理- 10 -4.2 基于爬山算法的划格原理- 12 -4.2.1目标加权函数- 12 -4.2.2 爬山算法搜索样本点- 13 -4.2.3 划网格- 15 -4.3 基因芯片网格定位结果- 15 -4.4实验中的不足之处- 26 -结论- 27 -致谢语- 28 -参考文献- 29 - 6 -第一章 引言1.1选题背景随着人类基因组计划的不断推进, 对基因有效快速的检测变得越来越重要。基因芯片技术以其可同时、快速、准确地分析大量基因组信息的特点而具有重大实用价值1。芯片技术可以广泛应用在疾病诊断、药物筛选及基因测序等生命科学领域。因此,以基因芯片为代表的生物芯片技术的深入研
8、究和广泛应用,将对21世纪人类生活和健康产生极其深远的影响。在基因芯片技术中,芯片分析是至关重要的一个环节,分析的可靠性、准确性直接影响芯片的推广应用。基因芯片与经过荧光标记的样品杂交后, 产生荧光图像。基因芯片探测到的信息就包含在每一个探针的荧光强度中。要进行芯片分析,首要任务就是进行网格定位, 也就是将基因芯片的探针与基因芯片的荧光图像的各区域建立对应关系。可以说,网格定位是进行后续芯片分析的前提。基因芯片应用的整个过程如下图1.1所示,与图像处理相关的工作处于整个过程的末端,属于数据分析2。分析基因芯片图像,即荧光图像处理的目的是为了获取每个靶位点的探针强度或比率,然后联系所打印的克隆靶
9、基因的信息,就可以容易地解释结果,并进一步进行高层次的分析3。芯片设计芯片制备杂交试验数据分析图1.1 基因芯片应用过程1.2网格定位的主要方法目前,用于基因芯片图像网格定位的方法主要有半自动网格定位、基于爬山算法的网格定位算法、基于数学形态的网格定位方法、基于图像投影的网格定位方法和基于遗传算法的自动网格定位等几种。(1) 基于投影的网格定位方法。该方法将分析目标锁定于基因芯片图像的投影信号上,从而将二维图像处理问题转化为一维数字信号处理问题,大大减少了算法的复杂度4。(2) 半自动网格定位。该方法在芯片点阵数不多的情况下具有直观与快速的特点, 但是随着芯片点阵数的增加, 该方法不仅费时而且
10、精确度下降, 因而不适应大规模、高密度基因芯片图像的分析。(3) 基于遗传算法的网格定位方法5。该方法利用遗传算法的优点进行图像的网格定位,具有很大程度上的自动性, 主要的不足在于计算量较大,比较耗时。(4) 基于数学形态的网格定位方法。该方法的基本思想是利用一个称作结构元素的“探针”手机信号的信息,探针在信号中不断移动即可考察信号各个部分之间的相互关系,并提取有用信息分析与描述信号特征。(5) 基于爬山算法的网格定位方法。利用局部搜索求解最优解,找出所有斑点的中心进行网格定位,能精确找出所有斑点的中心。1.3 本论文的主要工作本文使用基于爬山算法的基因芯片图像自动划格,并在MATLAB工具上
11、实现,其过程如图1.2所示。基因芯片图像预处理爬山算法搜索画线,完成定位图像去噪局部最优点样本点尺寸所有样本点图1.2 基于爬山算法的网格定位过程本论文具体工作如下:第一章为绪论部分。第二章论述图像预处理的相关理论知识。采用中值滤波的方法对基因芯片图像进行去噪。第三章论述爬山算法的相关理论知识。主要阐述了爬山算法中的一些概念,以及爬山算法的基本流程。第四章为程序实现部分。运用爬山算法在MATLAB软件上编程实现对基因芯片图像的网格定位。第二章 基因芯片图像预处理2.1 基因芯片图像的去噪处理基因芯片在制作过程中,受到多方面因素的干扰,图像会被一些可见或不可见的噪声“污染”,这些噪声将对自动网格
12、定位造成负面影响。在网格定位之前先对图像进行去噪处理是非常有必要的,也是基因芯片应用过程中的一个很重要的步骤。图像去噪的方法有很多,目前常用的有均值滤波、中值滤波、维纳滤波、图像小波域滤波6、形态学滤波7和低通滤波等。每一种方法都有其各自的适用性特点。中值滤波作为当前应用最广的滤波方法之一,能够克服线性滤波器所带来的图像细节模糊,并且对滤除脉冲干扰及图像扫描噪声有很好的效果。此外,在实际运算过程中并不需要图像的统计特征,这也带来了不少方便8。本节将介绍中值滤波,并在中值滤波的基础上进行改进,用自适应中值滤波算法对图像进行去噪处理。2.2 中值滤波中值滤波是一种非线性滤波,对随机输入信号的严格数
13、学分析比较复杂,它首先是被应用于一维信号处理技术中,后来被二维图像信号处理技术所引用。在应用上,中值滤波有很多的优点。但是对一些细节多,特别是点、线、尖顶细节多的图像不宜采用中值滤波的方法。下面我们对中值滤波的原理进行介绍。2.2.1 中值滤波原理所谓“中值”就是指将一个数据序列中的数据按照从大到小(或者相反)的顺序排列,如果这个序列的长度为奇数,则排在中间的那个数就是此序列的中值;如果数据序列的长度是偶数,可以定义处于中间两个数的平均数为中值。因此,中值滤波最简单的办法就是用一个含有奇数点的条形或方形滑动窗口在被处理的图像上逐点滑动,将窗口正中那个点的值用窗口内各点灰度的中指代替9。假设窗口
14、内有五点,其值分别为70,90,180,120,130。那么此窗口内中值即为120。一般地,设有一个一维序列,取窗口长度为 (为奇数),对此一维序列进行中值滤波,就是从输入序列中相继抽出个数;其中为窗口的中心点值, 。再将这个点值按其数值大小排序,取其序号为正中间那个数作为滤波输出。用数学公式表示为: (2-1)式中 ,。采用条形窗口的方法是一维中值滤波,将这种方法推广到二维,采用方形窗口,就形成二维中值滤波。二维中值滤波可由式(2-2)表示 (2-2)式中 滤波器窗口; 二维数据序列。窗口的尺寸。二维中值滤波的窗口形状和尺寸设计对滤波效果影响较大。不同的图像内容和不同的应用要求,往往采用不同
15、的窗口形状和尺寸。常用的二维中值滤波窗口形状有线状、方形、圆形、十字形以及圆环形等。窗口尺寸一般先用3,再取5,逐点增大,直到其滤波效果满意为止。一般来说,对于有缓变的较长轮廓物体的图像,采用方形或圆形窗口为宜;对于包含有尖顶角物体的图像,适宜采用十字形窗口。滤波窗口大小的选择,一般以不超过图像中最小有效物体的尺寸为宜。使用二维中值滤波需注意的是要保持图像中有效的细线物体。 (a)3 3窗口 (b)55窗口 (c)“圆”形窗口 (d)“十”字形窗口图2.1 二维中值滤波器的不同窗口选择2.2.2 中值滤波的主要特征(1)对某些输入信号中值滤波的不变性对某些特定的输入信号,如在窗口内单调增加或单调减少的序列,中值滤波输出信号仍保持输入信号不变,即 (2-3)或 (2-4)