2012数学建模A题论文-葡萄酒评价.doc

上传人:re****.1 文档编号:562746812 上传时间:2023-01-06 格式:DOC 页数:34 大小:2.57MB
返回 下载 相关 举报
2012数学建模A题论文-葡萄酒评价.doc_第1页
第1页 / 共34页
2012数学建模A题论文-葡萄酒评价.doc_第2页
第2页 / 共34页
2012数学建模A题论文-葡萄酒评价.doc_第3页
第3页 / 共34页
2012数学建模A题论文-葡萄酒评价.doc_第4页
第4页 / 共34页
2012数学建模A题论文-葡萄酒评价.doc_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《2012数学建模A题论文-葡萄酒评价.doc》由会员分享,可在线阅读,更多相关《2012数学建模A题论文-葡萄酒评价.doc(34页珍藏版)》请在金锄头文库上搜索。

1、葡萄酒的评价摘要本文主要运用统计分析方法,解决与所酿葡萄酒有关的问题。对于问题一,,分别对白酒和红酒的两组数据进行差异性检验。构建一个能反应葡萄酒本身质量的量,对两组数据分别进行相关性分析,得到第二组评酒员的结果更可信。对于问题二,先做聚类分析,再做线性回归分析,得到白、红葡萄分为4级和3级。对于问题三,利用问题二中聚类得到的7个主成分,把每种葡萄酒的理化指标与酿酒葡萄之间的7个主成分进行相关性分析,得到7个回归方程,即为酿酒葡萄与葡萄酒的理化指标之间的联系。对于问题四,首先建立模型:。其中a,b分别为酿酒葡萄和葡萄酒对葡萄酒质量的贡献率,分别为两种因素的贡献值。然后,通过确定芳香物质是否对葡

2、萄酒的评分有影响来论证能否用葡萄和葡萄酒的理化指标评价葡萄酒的质量。问题一中,本文运用excel做两组数据的显著性差异检验,得到两组评酒员在评论白酒和红酒都存在显著性差异,且通过了F检验。接着本文通过确定各指标的权重,构建一个能反应各葡萄酒实际平分的量,把两组数据与之做相关性分析,发现第二组与之相关性更大,故第二组评酒员的结果更可信。问题二中,本文通过SPSS做理化指标的聚类分析,得到7个主成分;再做指标与评分的线性回归分析,得到白葡萄的分级结果为4级:一级:白酿酒葡萄14,22;二级:白酿酒葡萄4,5,9,19,23,25,26,28;三级:白酿酒葡萄24,27;四级:白酿酒葡萄1,2,3,

3、6,7,8,10,11,12,13,15,16,17,18,20。红葡萄酒为3级:一级:红酿酒葡萄2,9;二级:红酿酒葡萄3,4,10,22,24;三级:红酿酒葡萄1,5,6,7,8,11,12,13,14,15,16,17,18,19,20,21,23,25,26,27。问题三中,本文运用excel将葡萄酒的一级指标分别与7个主成分进行相关性分析然后对每种主要成分利用SPSS进行线性回归分析得到以下7个回归方程: 即为每种酿酒葡萄与葡萄酒理化指标之间的联系。问题四中,建立模型:。对模型运用线性回归的方法,得到红色葡萄酒中红色酿酒葡萄和葡萄酒对葡萄酒质量的影响方程为:。白色葡萄酒中酿酒白葡萄对

4、葡萄酒质量的影响力为:;白葡萄酒的理化指标对葡萄酒的质量无影响。考虑到葡萄酒的评分与芳香物质有关,于是通过单独确定芳香物质是否对葡萄酒的评分有影响来论证能否用葡萄喝葡萄酒的理化指标评价葡萄酒的质量。最终得到能用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:聚类分析 主成分分析 多元线性回归 spss excel一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件中给出

5、了某一年份一些葡萄酒的评价结果以及该年份这些葡萄酒的和酿酒葡萄的成分数据。建立数学模型讨论下列问题:1.(1)分析附件1中两组评酒员的评价结果有无显著性差异;(2)两组评酒员哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型假设1.假设所给附件中,数据均准确可靠。三、符号说明:四组数据的偏度值。:四组数据的峰度值。,则假设两组品酒员的两组评价结果无显著差异。 ,不相等,则假设两组品酒员的两组评价结果有

6、显著差异。: 相关系数。:回归方程。四、问题分析4.1 第一问需要根据附件1中给出的两组评酒员的评价结果数据,判断两组评价结果有无显著性差异,在判断哪一组结果更可信。本文用Excel对两组评价结果进行方差分析,直接比较输出结果即可得出有无显著性差异的结论。但是能够进行方差分析的先决条件是数据满足正态分布,所以实现要验证四组将进行方差分析的四组数据是否满足正态分布。对于可信度的判断,本文将从选取葡萄酒样品的一级指标进行权重分析,将权重与一级指标进一步计算得到新的权值,再将这组权值与两组评酒员的评价结果的平均值进行相关分析,对得到的相关系数作比较即可判断可信度的高低。为了更全面的考虑其可信度,本文

7、也会对其标准差进行对比,双重验证其可信度。4.2用相关分析法和主成分分析法将用于计算的酿酒葡萄理化指标进行了筛选,最终确定的7个主成分所包含的成分指标基本可以代表所有测定的成分指标。用SPSS求出红酿酒葡萄和白酿酒葡萄的多元线性回归方程,用聚类分析法绘制树状聚类图,再利用回归方程,对酿酒葡萄进行分级。4.3要分析酿酒葡萄与葡萄酒的理化指标之间的联系,用SPSS将葡萄酒的一级指标分别与酿酒葡萄的7个主成分进行相关性分析,建立回归方程,既能说明酿酒葡萄与葡萄酒的理化指标之间的联系。五、模型的建立与求解5.1对第一问求解5.1.1(1)分析判断附件一中两组评酒员的评价结果有无显著性差异,利用双因素方

8、差分析,以红酒为例,将问题转述为:分析第一组和第二组评酒员对27种红酒样品的评价结果有无显著差异性。要利用双因素方差分析,首先数据要满足正态分布。判断数据是否满足正态分布可以根据其偏度和峰度来衡量。偏度: 峰度:偏度反应分布的对称性。称为右偏态,此时数据位于均值右边的比位于左边的多;称为左偏态,情况相反;而接近于则可认为分布是对称的。峰度是分布形状的另一种度量。正态分布的峰度为,若比大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一。用Matlab计算出四组数据的偏度与峰度: 对于红葡萄酒,第一组评酒员的评价结果 ,; 第二组评酒员的评价结

9、果 ,; 对于白葡萄酒,第一组评酒员的评价结果 ,; 第二组评酒员的评价结果 ,。为四组数据的偏度值,为四组数据的峰度值。四组偏度值均趋近于,四组峰度值均趋近于3,所以可以认为方差分析要使用到得四组数据均服从正态分布。、5.1.1(2)现在可以进行差异性的分析。 先准备表格(见表1)。表1 红葡萄酒品尝评分表红葡萄酒样品123424252627第一组62.780.380.468.67869.273.873第二组68.17474.671.271.568.27271.5白葡萄酒样品123425262728第一组8274.278.379.477.181.364.881.3第二组77.975.875.

10、676.979.574.37779.6然后提出假设 (两组品酒员的两组评价结果无显著差异) ,不相等(两组品酒员的两组评价结果有显著差异)最后在Excel内进行计算,输出结果见表2。表2 红葡萄酒样品评价结果的方差分析的Excel输出结果差异源SSdfMSFP-valueF crit行88.67852188.678526.1406570.0200274.225201列1444.7292655.566513.8477740.0005071.929213误差375.47152614.44121总计1908.87953可得出结论:,拒绝原假设,说明对于红葡萄酒, 两组评酒员的评价结果有显著性差异。同

11、理对两组评酒员对28种白酒样品的评价结果的差异性进行分析。进行方差分析的Excel输出结果见表3。表3 白葡萄酒样品评价结果的方差分析的Excel输出结果差异源SSdfMSFP-valueF crit行89.00643189.006436.8903550.0140934.210008列545.83432720.216081.565010.125441.904823误差348.77362712.91754总计983.614355可得出结论:,拒绝原假设,说明对于白葡萄酒,两组评酒员的评价结果有显著性差异。现综合对两组评酒员对葡萄酒的评价结果的差异性进行分析,其方差分析的输出结果见表4。表4 两种

12、葡萄酒评价结果综合方差分析的输出结果差异源SSdfMSFP-valueF crit行0.01781810.0178180.0010670.9740644.019541列2322.5595443.010352.575150.0003391.570884误差901.91225416.70208总计3224.489109可得出结论:,接受原假设,说明两组评酒员虽然对于红葡萄酒和白葡萄酒的品评上虽存在显著差异,但综合来看两组评酒员的综合评价结果并无显著性差异。5.1.2判断结果的可信度先对红葡萄酒的评价结果的可信度进行分析。在葡萄酒的理化指标中,选取一级指标进行权重分析,其中多次测量的数据取其平均值。

13、通过简单计算可以得到各一级指标的所占权重如表5。表5 红葡萄酒理化指标中各一级指标权重表花色苷单宁总酚酒总黄酮白藜DPPH色泽平均值263.8990 7.2660 6.2650 4.8970 3.6300 0.2230 41.0870 50.3730 22.0810 标准差230.0348 2.9044 2.5254 2.9850 2.8941 0.1275 21.3687 13.2688 7.5975 变异系数0.8717 0.3997 0.4031 0.6095 0.7972 0.5706 0.5201 0.2634 0.3441 权重0.1824 0.0836 0.0843 0.1275

14、 0.1668 0.1194 0.1088 0.0551 0.0720 将每种葡萄酒样品一级理化指标的数值分别与其一级指标所占权重相乘再相加,得到一组由27个数值新构成的权值。再将这组权值与两组评酒员的评价结果的平均值进行相关分析,数据表见附录一。运用Excel数据分析,得到结果为,对于红葡萄酒,第一组的评分结果与评分权值的相关系数为,第二组的评分结果与评分权值的相关系数为,可见第二组评分结果与评分权值的相关性强于第一组,可以认为第二组对红葡萄酒的评分结果更可信。对于白葡萄酒,第一组的评分结果与评分权值的相关系数为,第二组的评分结果与评分权值的相关系数为,可以看出,第一组的评分结果与评分权值相关性比第二组的强,但由于是负相关,相关性越弱越好,所以可以认为,第二组对白葡萄酒的评分结果更可信。为更

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 经济/贸易/财会 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号