全国大学生数学建模比赛题葡萄酒的评论答案数学实验计算机科学与技术成员:xxx学号:xxxxxxxxxx葡萄酒的评论纲要本文主要研究的是怎样对葡萄酒进行评论的问题 经过对评酒员的评分与酿酒葡萄的理化指标和葡萄酒的理化指标等原始数据进行统计、 剖析和办理,我们得出了一个较为合理地评论葡萄酒质量好坏的模型在问题一中,我们采纳 T查验法,第一进行正态散布拟合查验,判断出它们听从正态散布 之后,我们经过T查验法判断出了两组评酒员的评论结果拥有显着性差别 而对于怎样判断哪一组评酒员的评论结果更可信,因为评酒员评分的客观性,我们经过计算评酒员评分均值的置信区间, 利用置信区间的长短来判断评分的可信程度置信区间越窄,说明其越可信利用 Matlab软件求出了第二组评酒员的评分均值的置信区间更窄,所以第二组评酒员的评论结果更可信在问题二中,我们采纳主成分剖析法,把给定的一组有关变量经过线性变换转成另一组不有关的变量,这些新的变量再依照方差挨次递减的次序摆列 在数学变换中保持变量的总方差不变, 使第一变量拥有最大的方差第二变量的方差次大,并且和第一变量不有关因为变量许多,固然每个变量都供给了必定的信息,但其重要性有所不一样。
挨次类推,最后我们将酿酒葡萄分为了四个等级:优良、次优、中等、低等在问题三中,我们经过多项式曲线拟合的方法,结构一个以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量的函数,并利用Matlab软件进行曲线拟合,最后得出酿酒葡萄与葡萄酒的理化指标之间的关系为呈线性正有关在问题四中,我们用无交互作用的双要素试验的方差剖析方法,经过对观察、比较、剖析实验数据的结果,鉴识出了两个要素在水平发生变化时对实验结果产生显着性影响的大小程度最后,我们以为能用酿酒葡萄和葡萄酒的理化指标来评论葡萄酒的质量, 且酿酒葡萄的理化指标对葡萄酒质量影响相对葡萄酒的理化指标更显着 重点词:T查验法,Matlab,正态散布,主成分剖析法,多项式曲线拟合,方差剖析一. 问题的重述/的质量附件1给出了某一年份一些葡萄酒的评论结果, 附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据请试试成立数学模型议论以下问题:1. 剖析附件1中两组评酒员的评论结果有无显着性差别,哪一组结果更可信?2. 依据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级3. 剖析酿酒葡萄与葡萄酒的理化指标之间的联系4.剖析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响, 并论证可否用葡萄和葡萄酒的理化指标来评论葡萄酒的质量?附件1:葡萄酒品味评分表(含 4个表格)附件2:葡萄和葡萄酒的理化指标(含 2个表格)附件3:葡萄和葡萄酒的芬芳物质(含 4个表格)二基本假定与符号说明2.1基本假定(1)评酒员的评分是客观公正的,不受任何外界要素影响。
2)用来查验的葡萄都是刚采摘的新鲜葡萄,葡萄酒也没有遭到任何污染3)在检测酿酒葡萄和葡萄酒的理化指标的过程中,忽视因为人为操作不妥带来的偏差4)因为不是每组数据都对葡萄酒的质量产生很大影响,所以在办理数据过程中,忽视那些影响不是很明显的理化指标2.2符号说明i(i1,2)第i组评酒员对各品种红葡萄酒的评分均值的希望i2(i1,2)第i组评酒员对各品种红葡萄酒的评分均值的方差H 问题一的假定Zi第i个主成分rij第i个评酒员对第 j种酒的评分三. 问题的剖析针对问题一,怎样判断两组评酒员的评论结果有无显着性差别,我们采纳 T查验法进行判断但采纳T查验法的前提是其一定听从正态散布, 方差未知且相等所以我们先对那些数据进行正态散布查验,判断其能否听从正态散布 考证听从正态散布后,我们利用T查验法判断两组评酒员评价结果的显着性差别对于怎样判断哪一组评酒员的评论结果更可信,因为评酒员评分的客观性,我们经过计算评酒员评分均值的置信区间, 利用置信区间的长短来判断评分的可信程度 置信区间越窄,说明其越可信针对问题二中怎样依据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,我们采纳主成分剖析法。
因为在实质问题的研究中,常常会波及众多有关的变量可是,变量太多不只会增添计算的复杂性,并且也会给合理地剖析问题和解说问题带来困难一般说来,固然每个变量都供给了必定的信息,但其重要性有所不一样,而在好多状况下,变量间有必定的有关性,进而使得这些变量所供给的信息在必定程度上有所重叠因此人们希望对这些变量加以“改造”,用为数很少的互补有关的新变量来反应原变量所供给的绝大多数信息,经过对新变量的剖析达到解决问题的目的解决这个问题的过程中,我们用Matlab软件实现主成分剖析,我们对那些理化指标进行从头整理,求出各个理化指标的之间的有关系数、特点值及特点向量和贡献率等针对问题三中怎样剖析酿酒葡萄与葡萄酒的理化指标之间的联系,我们想到了用多项式曲线拟合的方法,依据二者理化指标实测样本,用统计剖析的方法,找出一种适合的函数关系进而达到办理酿酒葡萄与葡萄酒之间有关关系的目的实质的操作过程中,我们第一结构一个对于酿酒葡萄与葡萄酒的理化指标的函数,以葡萄酒的理化指标为自变量,酿酒葡萄的理化指标为因变量,利用Matlab软件进行曲线拟合,得出酿酒葡萄与葡萄酒的理化指标之间的关系针对问题四中怎样剖析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响, 以及可否用酿酒葡萄和葡萄酒的理化指标来评论葡萄酒的质量,我们采纳无交互作用的双要素试验的方差剖析方法。
用方差剖析,能够将影响葡萄酒的主要要素和次要要素划分开来, 还能够分别算出酿酒葡萄的理化指标和葡萄酒的理化指标与葡萄酒质量之间的偏差, 假如偏差在可接受范围以内,即说明能够用酿酒葡萄和葡萄酒的理化指标来评论葡萄酒质量四. 模型的成立与求解4.1问题一的模型成立与求解4.1.1T查验法的模型成立与求解T查验是用T散布理论来推论差别发生的概率,进而比较两个均值的差别能否显着因为查验红葡萄酒与白葡萄酒的方法和模型同样,这里我们只给出查验红葡萄酒的模型1. 正态散布的查验因为使用T查验法的前提是两个整体散布都听从正态散布,我们先利用计算出:第一组评酒员对各品种红葡萄酒的评分均值为:Excel软件62.7,80.3,80.4,68.6,73.3,73.2,71.5,72.3,81.5,74.2,70.1,53.9,74.6,73,58.7,74.9,79.3,59.9,78.6,78.6,77.1,77.2,85.6,78,69.2,73.8,73第二组评酒员对各品种红葡萄酒的评分均值为:68.1,74,74.6,71.2,72.1,66.3,65.3,66,78.2,68.8,61.6,68.3,68.8,72.6,65.7,69.9,74.5,65.4,72.6,75.8,72.2,71.6,77.1,71.5,68.2,72,71.5而后我们利用Matlab软件里的正态散布拟合函数进行曲线拟合,得出其正态散布的拟合曲线图为图一:图一、正态散布拟合曲线图从图中我们知道其曲线近似为一条直线,所以我们以为评酒员对红葡萄酒以及白葡萄酒的评分均值都听从正态散布。
2. T查验法模型的成立与求解设,分别为第一组、第二组评酒员对各品种红葡萄酒的评分均值,且~N(1,12),~N(2,22),此中1,2,12,22均未知1)作出统计假定H0:12H1:122)选用统计量(3)对于给定的显着性水平0.05,我们利用Matlab软件进行计算求解结果以下表所示:葡萄酒的品种H值P值差别显着程度第一组红葡萄酒00.9396差别不显着第二组红葡萄酒第一组白葡萄酒11.4077e-006差别特别显着第二组 白葡萄酒H=0,表示接受原假定;H=1,表示接受背择假定由上表可知:红葡萄酒之间不存在显着性差别,白葡萄酒之间存在显着性差别4.1.2 可信度的判断因为样本的置信区间与其可信度是呈负有关的,即置信区间越小,其可信度越大我们利用Matlab软件求解得出第一组、第二组红葡萄酒和白葡萄酒的置信区间,见下表:葡萄酒的置信区间红葡萄酒的置信区间白葡萄酒的置信区间第一组[70.3377,75.7734][72.3342,76.1872]第二组[69.6890,71.9607][75.3788,77.6855]明显第二组的置信区间长度小于第一组,所以第二组评酒员的评论结果可信度更高。
4.2 问题二的模型成立与求解主成分剖析法是一种数学变换的方法,它把给定的一组有关变量经过线性变换转成另一组不有关的变量,这些新的变量依照方差挨次递减的次序摆列在数学变换中保持变量的总方差不变,使第一变量拥有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不有关,称为第二主成分挨次类推,I个变量就有I个主成分1. 计算有关系数矩阵r11r12r1pr21r22r2p(1)Rrp1rp2rpp在(1)式中,rij(i,j1,2,,p)为原变量的xi与xj之间的有关系数,其计算公式为n(xkixi)(xkjxj)rijk1(2)nnxi)2xj)2(xki(xkjk1k1因为R是实对称矩阵(即rijrji),所以只要计算上三角元素或下三角元素即可2.计算特点值与特点向量第一解特点方程IR0,往常用雅可比法求出特点值i(i1,2,,p),并使其按大小次序摆列,即12p0而后分别求出对应于特点值i的特点向量ei(i1,2,,p)这里要p求ei=1,即eij21,此中eij表示向量ei的第j个重量j 13. 计算主成分贡献率及累计贡献率贡献率:第i个主成分方差。