数学建模乳腺癌问题模型

上传人:枫** 文档编号:496012942 上传时间:2023-01-24 格式:DOC 页数:7 大小:280.50KB
返回 下载 相关 举报
数学建模乳腺癌问题模型_第1页
第1页 / 共7页
数学建模乳腺癌问题模型_第2页
第2页 / 共7页
数学建模乳腺癌问题模型_第3页
第3页 / 共7页
数学建模乳腺癌问题模型_第4页
第4页 / 共7页
数学建模乳腺癌问题模型_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《数学建模乳腺癌问题模型》由会员分享,可在线阅读,更多相关《数学建模乳腺癌问题模型(7页珍藏版)》请在金锄头文库上搜索。

1、文档供参考,可复制、编制,期待您的好评与关注! 乳房癌的诊断模型马 壮 于翠影 张宏硕指导教师:王镁(内蒙古大学,呼和浩特010021)摘要 本文对乳房癌的诊断问题,应用神经网络与模糊数学的理论,给出了几种乳房癌的量化诊断方案首先,建立了LVQ神经网络模型,使用500组数据的前400组作为训练样本,用后100组数据对网络性能进行检测,诊断正确率达98%然后对这500个特征向量进行了回归分析,从30个特征中筛选出了6个特征,它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、周长的均值并将以上6个特征用于LVQ网络,诊断正确率达95%进一步考虑到神经网络与模糊数学各自的特点,

2、将二者有机结合构造了神经模糊系统,并用以上的6个特征对系统进行训练,诊断正确率达96%本文构造的模型具有良好的稳定性,对于模式识别问题具有很强的实用价值,最后本文提出了神经网络和模糊数学深层次结合的方向一. 问题的重述乳房癌通过穿刺采样进行分析可以确定其为良性或恶性医学研究发现乳房肿瘤病灶组织的细胞显微图像的10个量化特征:细胞核直径,质地,周长,面积,光滑度,紧密度,凹陷度,凹陷点数,对称度,断裂度与该肿瘤的性质有密切关系现有500个已确诊病例,每个病例的一组数据包括采样组织中各细胞核的这十个特征量的平均值,标准差和“最坏值”(各特征的3个最大特征的平均值)共30个数据根据这500组数据建立

3、诊断模型,并将其用于另外69名已做穿刺采样的患者为节省费用发展一种只用此30个特征数据中的部分特征来区分乳房肿瘤是良性还是恶性的方法 二. 问题的假设1所给的500组病例具有广泛的代表性 2500组病例所反映的良性与恶性的概率分布符合病例的自然分布三. 问题的分析 本问题是一个典型的模式识别问题,要求根据它的特征量来进行分类 对于模式识别问题,现今有两类解决办法一类是传统的线性模型另一类是近年来发展起来的非线性模型本题是一个典型的非线性问题,用传统的线性模型解决有一定的困难,而且识别率不高所以非线性模型是解决此类问题的首选现今常用的非线性模型有神经网络模型和模糊系统模型神经网络由许多并行运算的

4、简单单元组成,单个神经元的结构及其简单,但大量神经元相互连接组成人工神经元网络显示出人脑的某些特征:1) 分布存储和容错性;2) 大规模并行处理;3) 自学习、自组织和自适应性;4) 它并不是各单元行为的简单相加,而表现出一般复杂非线性动态系统的特性 神经元可以处理一些环境信息十分复杂、知识背景不清楚和推理规则不明确的问题,如乳房癌诊断问题 模糊集打破了传统的分明集只有0和1的界限,任意元素可同时部分地属于多个模糊子集,隶属关系用隶属的程度来表示这更接近人的表述方式模糊规则是定义在模糊集上规则,常采用“If-then”(若则)的形式,可用来表示专家的经验、知识等由一组模糊规则构成的模糊系统可代

5、表一个输入、输出的映射关系从理论上说,模糊系统可以近似任意的连续函数模糊系统除了模糊规则外,还包括模糊逻辑推理和去模糊化的部分由于模糊集能处理非定量的信息,因此在模式识别(尤其是具有模糊特点的识别问题)中模糊系统具有很大的优势,本题肿瘤的良性、恶性正是模糊概念,所以用模糊系统进行模式识别会得到很好的效果为了避免量纲的影响,在应用数据之前对数据经行了标准化标准化方法:用每个数据与整体均值的差除以整体标准差四. 模型的建立与求解(一)神经网络模型学习向量量化(LVQ)是在监督状态下对竞争层进行训练的一种学习算法LVQ网络由一个竞争层和一个线性层组成竞争层的神经元将输入向量分成组,由现行层组合到期望

6、的类中在任何给定的时刻,线性层的输出神经元只有一个非零输出1,该神经元就是竞争中得胜者假定获胜的元为,它之所以获胜的原因是它受到了最大的输入刺激,那么, 的总加权输入为 其中,表示的状态,表示第个元到第个元的权值,表示第个输入分量其矩阵形式为 若元 获胜,就意味着 若连接到每个输出层神经元的权向量 都是规范化的,上式等价于 网络输入模式为时,具有权向量与最近的元将获得竞争的胜利若元竞争获胜,将权值作如下调整 (1) 使获胜者的权向量向输入向量移近一小段距离,这使网络在遇到或与接近的模式时,元可以有更大的获胜可能性若在竞争中失败,将权值作如下调整 (2) 使权向离开样品的方向移动,这样就减小了错

7、误分类的机会在(1)、(2)式中,表示学习率 在本模型中取为0.01,取隐竞争层的神经元数为60,取输出层神经元数为2,并规定输出(0,1)为良性,输出(1,0)为恶性用前400组数据作训练样本,经过15000次迭代,两类样本的聚类情况如下图:用后100组数据对训练进行检测,诊断正确率达98%对69组待定病例的诊断结果如下表: 病例号类别 病例号类别 病例号类别 病例号类别914862 B917062 B91979701 B924632 B91504 M917080 B919812 B924934 B91505 B917092 B921092 B924964 B915143 M91762702

8、 M921362 B925236 B915186 B91789 B921385 B925277 B9151276 B917896 B921386 B925291 B91544001 B917897 B921644 B925292 B91544002 B91805 B922296 B925311 B915452 B91813701 B922297 B925622 M915460 M91813702 B922576 B926125 M91550 B918192 B922577 B926424 M915664 B918465 B922840 B926682 M915691 M91858 B92316

9、9 B926954 M915940 B91903901 B923465 B927241 M91594602 B91903902 B923748 B92751 B916221 B91930402 M923780 B916799 M919537 B924084 B916838 M919555 M924342 B为了节省费用,增加网络训练速度,考虑将所给的数据降维,用多元回归分析的逐步回归法对数据进行了回归分析,把30个特征做为自变量,因变量采用良性病例取值为0,恶性病例取值为1逐步回归法避免了只将变量剔除就不再选入的缺点,它可以将变量反复选入、剔除,最终可得到一组最优权值,结果如下图所示: 从30

10、个特征中筛选出了6个特征,它们分别是:细胞核直径均值、标准差和最坏值、紧密度的均值、面积的最坏值、周长的均值只用以上6个特征对网络进行训练,仍使用前400组数据作为训练,用后100组数据检验,诊断正确率达95%对69组待定病例的诊断结果如下表:病例号类别 病例号类别 病例号类别 病例号类别914862B917062B91979701B924632B91504B917080B919812B924934B91505B917092B921092B924964B915143M91762702M921362B925236B915186B91789B921385B925277B9151276B917896

11、B921386B925291B91544001B917897B921644B925292B91544002B91805B922296B925311B915452B91813701B922297B925622M915460M91813702B922576B926125M91550B918192B922577B926424M915664B918465B922840B926682M915691B91858B923169B926954M915940B91903901B923465B927241M91594602B91903902B923748B92751B916221B91930402M923780B

12、916799M919537B924084B916838M919555M924342B五. 神经模糊系统模型 从映射角度看,模糊系统和神经网络都具有(非线性)函数近似的能力它们有着以下的共同之处:(1)它们均可以从给定的系统输入/输出信号(数据)中,建立系统的(非线性)输入/输出关系 (2) 从数据处理的形式上看,它们均采用并行处理的结构 但是,模糊系统和神经网络有着明显的不同之处神经网络虽然对环境的变化具有较强的自适应学习能力,但是从系统建模的角度而言,它采用的是典型的黑箱型的学习模式因此当学习完成后,神经网络所获得的输入/输出关系无法用容易被人接受的方式表示出来相反,模糊系统是建立在被人容易接受的“如果-则”表达方法之上,但如何自动生成和调整隶属度函数和模糊规则,则是一个很棘手的问题因此,将模糊理论和神经网络有机结合起来,取长补短,提高整个系统的学习能力和表达能力,是目前这一领域最受人注目的课题之一 神经网络和模糊系统的等价性: Kolmogorov定理 给定任意连续函数,这里是单位闭区间0,1,可以精确地用一3层前向网络实现,此网络的中间层(隐层)有2n+1个处理单元 BP定理 给定任意和任意函数,存在一3层BP网络,它可在任意平方误差精度内逼近. 模糊系统的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号