数学建模 乳腺癌问题模型

上传人:kms****20 文档编号:37218557 上传时间:2018-04-09 格式:DOC 页数:7 大小:301.50KB
返回 下载 相关 举报
数学建模 乳腺癌问题模型_第1页
第1页 / 共7页
数学建模 乳腺癌问题模型_第2页
第2页 / 共7页
数学建模 乳腺癌问题模型_第3页
第3页 / 共7页
数学建模 乳腺癌问题模型_第4页
第4页 / 共7页
数学建模 乳腺癌问题模型_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《数学建模 乳腺癌问题模型》由会员分享,可在线阅读,更多相关《数学建模 乳腺癌问题模型(7页珍藏版)》请在金锄头文库上搜索。

1、乳房癌的诊断模型马 壮 于翠影 张宏硕指导教师:王镁(内蒙古大学,呼和浩特 010021)摘要 本文对乳房癌的诊断问题,应用神经网络与模糊数学的理论,给出了几种 乳房癌的量化诊断方案 首先,建立了 LVQ 神经网络模型,使用 500 组数据的前 400 组作为训练样本, 用后 100 组数据对网络性能进行检测,诊断正确率达 98% 然后对这 500 个特征向量进行了回归分析,从 30 个特征中筛选出了 6 个特征, 它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、 周长的均值并将以上 6 个特征用于 LVQ 网络,诊断正确率达 95% 进一步考虑到神经网络与模糊数学各自

2、的特点,将二者有机结合构造了神经 模糊系统,并用以上的 6 个特征对系统进行训练,诊断正确率达 96% 本文构造的模型具有良好的稳定性,对于模式识别问题具有很强的实用价值, 最后本文提出了神经网络和模糊数学深层次结合的方向一一. .问题的重述问题的重述乳房癌通过穿刺采样进行分析可以确定其为良性或恶性医学研究发现乳房肿瘤病灶 组织的细胞显微图像的 10 个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密 度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的性质有密切关系现有 500 个已确诊 病例,每个病例的一组数据包括采样组织中各细胞核的这十个特征量的平均值,标准差和 “最坏值” (各特征的 3

3、 个最大特征的平均值)共 30 个数据根据这 500 组数据建立诊断 模型,并将其用于另外 69 名已做穿刺采样的患者为节省费用发展一种只用此 30 个特征 数据中的部分特征来区分乳房肿瘤是良性还是恶性的方法 二二. .问题的假设问题的假设1所给的 500 组病例具有广泛的代表性2500 组病例所反映的良性与恶性的概率分布符合病例的自然分布三三. .问题的分析问题的分析本问题是一个典型的模式识别问题,要求根据它的特征量来进行分类对于模式识别问题,现今有两类解决办法一类是传统的线性模型另一类是近年 来发展起来的非线性模型本题是一个典型的非线性问题,用传统的线性模型解决有一定 的困难,而且识别率不

4、高所以非线性模型是解决此类问题的首选现今常用的非线性模 型有神经网络模型和模糊系统模型 神经网络由许多并行运算的简单单元组成,单个神经元的结构及其简单,但大量神经 元相互连接组成人工神经元网络显示出人脑的某些特征: 1)分布存储和容错性; 2)大规模并行处理; 3)自学习、自组织和自适应性;24)它并不是各单元行为的简单相加,而表现出一般复杂非线性动态系统的特 性神经元可以处理一些环境信息十分复杂、知识背景不清楚和推理规则不明确的问题,如 乳房癌诊断问题模糊集打破了传统的分明集只有 0 和 1 的界限,任意元素可同时部分地属于多个模 糊子集,隶属关系用隶属的程度来表示这更接近人的表述方式模糊规

5、则是定义在模糊 集上规则,常采用“If-then” (若则)的形式,可用来表示专家的经验、知识等由 一组模糊规则构成的模糊系统可代表一个输入、输出的映射关系从理论上说,模糊系统 可以近似任意的连续函数模糊系统除了模糊规则外,还包括模糊逻辑推理和去模糊化的 部分由于模糊集能处理非定量的信息,因此在模式识别(尤其是具有模糊特点的识别问 题)中模糊系统具有很大的优势,本题肿瘤的良性、恶性正是模糊概念,所以用模糊系统 进行模式识别会得到很好的效果 为了避免量纲的影响,在应用数据之前对数据经行了标准化标准化方法:用每个数 据与整体均值的差除以整体标准差四四. .模型的建立与求解模型的建立与求解(一)神经

6、网络模型(一)神经网络模型 学习向量量化(LVQ)是在监督状态下对竞争层进行训练的一种学习算法LVQ 网络由 一个竞争层和一个线性层组成竞争层的神经元将输入向量分成组,由现行层组合到期望 的类中在任何给定的时刻,线性层的输出神经元只有一个非零输出 1,该神经元就是竞争中得胜者假定获胜的元为,它之所以获胜的原因是它受到了最大的输入刺激,那jN么, 的总加权输入为jNiNiijjxS 1其中,表示的状态,表示第个元到第 个元的权值,表示第 个输入分量其jSjNijjiixi矩阵形式为jSjWxv若元 获胜,就意味着jNkmkjWxWxvvL, 2, 1max 若连接到每个输出层神经元的权向量 都是

7、规范化的,上式等),(21mkkkT kWWWWL价于T kmkT jWxWx vvL, 2, 1min网络输入模式为时,具有权向量与最近的元将获得竞争的胜利若元竞kxvT jWkxv jN争获胜,将权值作如下调整(1) T jkT jWxWv3使获胜者的权向量向输入向量移近一小段距离,这使网络在遇到或与接近的模kxvkxv式时,元可以有更大的获胜可能性若在竞争中失败,将权值作如下调整jNjN(2)T jkT jWxWv使权向离开样品的方向移动,这样就减小了错误分类的机会在(1) 、 (2)式中, 表示学习率在本模型中取为 0.01,取隐竞争层的神经元数为 60,取输出层神经元数为 2,并规

8、定输出(0,1)为良性,输出(1,0)为恶性用前 400 组数据作训练样本,经过 15000 次迭代,两类样本的聚类情况如下图:用后 100 组数据对训练进行检测,诊断正确率达 98%对 69 组待定病例的诊断 结果如下表: 病例号类 别病例号类别 病例号类别 病例号类别914862 B917062 B9197970 1B924632 B91504 M917080 B919812 B924934 B 91505 B917092 B921092 B924964 B 915143 M9176270 2M921362 B925236 B915186 B91789 B921385 B925277 B

9、9151276 B917896 B921386 B925291 B 9154400 1B917897 B921644 B925292 B9154400 2B91805 B922296 B925311 B915452 B9181370 1B922297 B925622 M915460 M9181370 2B922576 B926125 M91550 B918192 B922577 B926424 M 915664 B918465 B922840 B926682 M 915691 M91858 B923169 B926954 M 915940 B9190390 1B923465 B927241 M

10、49159460 2B9190390 2B923748 B92751 B916221 B9193040 2M923780 B916799 M919537 B924084 B 916838 M919555 M924342 B为了节省费用,增加网络训练速度,考虑将所给的数据降维,用多元回归分析的逐步 回归法对数据进行了回归分析,把 30 个特征做为自变量,因变量采用良性病例取值为 0,恶性病例取值为 1逐步回归法避免了只将变量剔除就不再选入的缺点,它可以将变 量反复选入、剔除,最终可得到一组最优权值,结果如下图所示: 从 30 个特征中筛选出了 6 个特征,它们分别是:细胞核直径均值、标准差和最坏

11、值、 紧密度的均值、面积的最坏值、周长的均值只用以上 6 个特征对网络进行训练,仍使用 前 400 组数据作为训练,用后 100 组数据检验,诊断正确率达 95%对 69 组待定病例的 诊断结果如下表:病例号类 别病例号类别病例号类别病例号类别914862B917062B9197970 1B924632B91504B917080B919812B924934B 91505B917092B921092B924964B 915143M9176270 2M921362B925236B915186B91789B921385B925277B 9151276B917896B921386B925291B 91

12、54400 1B917897B921644B925292B9154400 2B91805B922296B925311B915452B9181370 1B922297B925622M915460M9181370 2B922576B926125M91550B918192B922577B926424M 915664B918465B922840B926682M5915691B91858B923169B926954M 915940B9190390 1B923465B927241M9159460 2B9190390 2B923748B92751B916221B9193040 2M923780B916799

13、M919537B924084B 916838M919555M924342B五五. .神经模糊系统模型神经模糊系统模型 从映射角度看,模糊系统和神经网络都具有(非线性)函数近似的能力它们有着以 下的共同之处: (1)它们均可以从给定的系统输入/输出信号(数据)中,建立系统的(非线性)输 入/输出关系(2) 从数据处理的形式上看,它们均采用并行处理的结构但是,模糊系统和神经网络有着明显的不同之处神经网络虽然对环境的变化具有 较强的自适应学习能力,但是从系统建模的角度而言,它采用的是典型的黑箱型的学习模 式因此当学习完成后,神经网络所获得的输入/输出关系无法用容易被人接受的方式表 示出来相反,模糊系

14、统是建立在被人容易接受的“如果-则”表达方法之上,但如何自 动生成和调整隶属度函数和模糊规则,则是一个很棘手的问题因此,将模糊理论和神经 网络有机结合起来,取长补短,提高整个系统的学习能力和表达能力,是目前这一领域最 受人注目的课题之一神经网络和模糊系统的等价性:神经网络和模糊系统的等价性:Kolmogorov 定理 给定任意连续函数,这里是单位闭区yxfRUfmn)(,:U间0,1,可以精确地用一 3 层前向网络实现,此网络的中间层(隐层)有 2n+1 个处f理单元BP 定理 给定任意和任意函数,存在一 3 层 BP 网络,它02LmnRf 1 , 0 :可在任意平方误差精度内逼近.f模糊系

15、统的存在定理 给定任意连续函数和任意,存在由(1)RUfn:0式定义的使 )(xg神经网络和模糊系统各自本身就是一个非线性的输入/输出映射,因此模糊系统可以用一 等家的神经网络来表示,同样,神经网络也可以用一等价的模糊系统来表示基于神经网络的模糊系统:基于神经网络的模糊系统:模糊系统采用高木-管野(Takagi-Sugeno Model)(简称 TS 模型):如果为,和为,和为,则1xjA12xL,2jAnxj nA)(xfyj输入变量的联合隶属函数和结论部的函数 fj(x)都用神经网络来求得模糊规则的个 数由减法聚类方法得到,聚类参数如下:6Range of influence: 0.3Sq

16、uash factor: 1.1Accept factor: 0.6Reject ratio: 0.15神经网络采用前向的 BP 网络,神经元的传递函数为 Sigmoid 函数,输出层采用线性 函数网络结构如下图所示:由于系统的结构比较复杂,用 30 维的数据进行训练十分缓慢,只用了前面已提取出 的 6 个特征对系统进行了训练,得到了神经模糊系统用后 100 组数据进行检验,诊断正 确率达 96%病例号类 别病例号类别病例号类别病例号类别914862B917062B9197970 1M924632B91504B917080B919812B924934B 91505B917092B921092B924964B 915143M9176270

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号