数学建模论文-关于葡萄酒评价的研究

上传人:QQ15****706 文档编号:52453829 上传时间:2018-08-21 格式:DOC 页数:35 大小:2.04MB
返回 下载 相关 举报
数学建模论文-关于葡萄酒评价的研究_第1页
第1页 / 共35页
数学建模论文-关于葡萄酒评价的研究_第2页
第2页 / 共35页
数学建模论文-关于葡萄酒评价的研究_第3页
第3页 / 共35页
数学建模论文-关于葡萄酒评价的研究_第4页
第4页 / 共35页
数学建模论文-关于葡萄酒评价的研究_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《数学建模论文-关于葡萄酒评价的研究》由会员分享,可在线阅读,更多相关《数学建模论文-关于葡萄酒评价的研究(35页珍藏版)》请在金锄头文库上搜索。

1、0全国大学生数学建模论文1摘要葡萄酒是由新鲜葡萄或葡萄汁经过酒精发酵而得到的,葡萄酒质量是其外观、 香气、口味等的综合表现,葡萄酒的质量是通过评酒员的品评得到的。 针对问题一,为判断两组评酒员的评价结果有无显著性差异,首先用 Matlab 对各组各酒样的总分做正态性检验,再用 SPSS 做配对样品 t 检验,得 到两组评酒员的评价结果有显著性差异;其次,用 Matlab 中的 Std(x)函数求得 第二组的标准差较小,即第二组结果更可信。 针对问题二,某些理化指标对酿酒葡萄的影响不大,故本文采用主成分分 析法对其作降维处理,得到各酿酒葡萄的主要理化指标。再用快速聚类分析对 主要理化指标分类,最

2、后结合葡萄酒的质量对酿酒葡萄的等级加以评定。 针对问题三,在问题二的基础上,用主成分分析法分析葡萄酒的理化指标, 得到各葡萄酒的主要理化指标。再用相关分析法对酿酒葡萄和酒样的主要理化 指标分析,得到两者间某些指标存在正、负相关关系,说明酿酒葡萄在较大程 度上影响了葡萄酒的理化指标,此为模型一。再用多元线性逐步回归分析,得 到两者的方程模型,此为模型二。 针对问题四,分析影响时用 SPSS 对酿酒葡萄的理化指标与葡萄酒质量, 葡萄酒的理化指标与葡萄酒的质量进行相关性分析。对论证部分,以葡萄酒质 量作为因变量,酿酒葡萄和葡萄酒的主要理化指标作为自变量,利用 SPSS 19.0 进行多元线性逐步回归

3、分析后,得到方程模型,可通过四个方程模型用酿酒葡 萄和葡萄酒的理化指标对葡萄酒的质量予以评价,即得到结论可以用葡萄和葡 萄酒的理化指标来评价葡萄酒的质量。关键词关键词:Matlab SPSS 配对样品 t 检验 主成分分析法 聚类分析 双变量相关分析 多元线性逐步回归分析关于葡萄酒评价的研究2二、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评 酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确 定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒 和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。 附件 1 给出了某一年份

4、一些葡萄酒的评价结果,附件 2 和附件 3 分别给出 了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列 问题: 1. 分析附件 1 中两组评酒员的评价结果有无显著性差异,哪一组结果更可 信? 2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。 3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系。 4分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用 葡萄和葡萄酒的理化指标来评价葡萄酒的质量?三、问题分析葡萄酒质量的评定过程是每个评酒员对葡萄酒进行品尝后对其分类指标进 行打分,通过求和得到其总分,这个总分反映了葡萄酒质量的好坏。另外,酿 酒葡萄的质量是

5、影响葡萄酒质量的直接因素,利用附件提供的数据,分析二者 理化指标之间的联系。 1)对问题一,为判断两组评酒员的评价结果有无显著性差异,首先,在 excel 表格中分别求得第一组、第二组评酒员对每一种酒样品所评总分的平均值,然 后用 Matlab 对所得平均值做正态性检验,判断该两组数据是否符合正态分布, 若符合,再利用 spss 对所得的两组数据做配对样品 t 检验;其次,在 excel 中 分别求得第一组、第二组十位评酒员对每种酒样品评分的标准差,所得标准差 较小的一组即为评分结果更可信的一组。 2)对问题二,要对酿酒葡萄进行分级,先找出酿酒葡萄性质的主要理化指标 进行降维处理,故本文采用主

6、成分分析法。再用聚类分析进行分类,而酿酒葡 萄的好坏又与所酿葡萄酒的质量有直接的关系,所以对酿酒葡萄的分级可以结 合葡萄酒的质量加以分析。 3)对问题三,首先对葡萄酒做主成分分析,结合第二问中酿酒葡萄的主要 理化指标,利用 SPSS 19.0 对酿酒葡萄和葡萄酒的理化指标做相关性分析,此 为模型一。其次,用多元线性逐步回归分析方法分析,建立线性回归方程模型, 此为模型二。 4)对问题四,第一问用 SPSS 19.0 分别做酿酒葡萄的理化指标与葡萄酒质 量,葡萄酒的理化指标与葡萄酒质量的相关性分析,根据输出数据分析酿酒葡 萄和葡萄酒的理化指标对葡萄酒质量的影响。问题四的第二问,是研究多个理 化指

7、标与葡萄酒质量是否存在相互依存关系,因此可用多元线性逐步回归分析 的方法,以葡萄酒质量作为因变量,以第二问中挑选出的特征向量较大的酿酒 葡萄和葡萄酒的理化指标作为自变量,利用 SPSS 19.0 进行多元线性逐步回归 分析。四、模型假设31)附件中的数据真实可靠; 2) 假设第 i 号酿酒葡萄的好坏与第 i 号葡萄酒的优劣水平一致; 3)假设二级指标对酿酒葡萄和葡萄酒质量的影响不大,可以忽略; 4)假设在一定时间内葡萄酒的理化指标含量保持不变。五、符号说明与定义符号符号解释iF表示第 i 主成分;ijx表示第 i 种葡萄样品的第 j 种指标的平均值;i表示第 i 主成分的特征值;iA表示第 i

8、 主成分的系数;ib表示指标变量的值;iX表示某种酿酒葡萄和葡萄酒的第 i 个指标;iX表示葡萄样品标准化后的值六、模型的建立与求解6.1 问题一的分析 6.1.1 两组评价结果的显著性差异分析 对同一葡萄酒两组评酒员进行品评,得到成对出现的两组评价结果,即配 对样本。故分析两组评价结果的显著性,本文采用配对样品 t 检验分析法。进 行配对 t 检验的样本必须服从正态分布,首先,对配对样本进行正态分布检验, 根据附件一,分别求出第一、第二组各十名评酒员对红、白葡萄酒评分的总和, 再求其平均值如下表所示: 表一 红、白葡萄酒的总分平均值组别 红酒样品第一组第二组组别 白酒样品第一组第二组162.

9、768.118277.9 280.374265.175.8 380.474.6378.375.6 468.671.2479.476.9 573.372.157181.5 672.266.3668.475.5 771.565.3777.574.2 872.366871.472.3 981.578.2972.980.441074.268.81074.379.8 1170.161.61172.371.4 1253.968.31263.372.4 1374.668.81365.973.9 147372.6147277.1 1558.765.71572.478.4 1674.969.9167467.3

10、1779.374.51778.880.3 1859.965.41873.176.7 1978.672.61972.276.4 2079.875.82077.876.6 2177.172.22176.479.2 2277.271.6227179.4 2385.677.12375.977.4 247871.52473.376.1 2569.268.22577.179.5 2673.8722681.374.3 277371.52764.877 2881.379.6 选平均值为评价结果,用 Matlab 的 normplot 命令,判定上述四组数据均 趋于正态分布,结果如下图所示:(程序见附录程序一至

11、程序四)图一 第一组 红葡萄酒 图二 第二组 红葡萄酒5图三 第一组 白葡萄酒 图四 第二组 白葡萄酒 上图表明,此四组数据均服从正态分布,对红葡萄酒而言,要分析两组评酒员 对其评分结果是否有显著性差异,可利用 SPSS 19.0 对这两组数据做配对样本 t 检验,所得结果为:t=2.497,sig=0.019,置信区间为0.4573 4.7130。可 见,sig0.05,置信区间包括 t=2.497,得出两组评酒员对红葡萄酒的评价结果 具有显著性差异。 对于白葡萄酒而言,方法同上,所得结果为:t=2.838,sig=0.009,置信区 间为0.7883 4.9045,包含 t=2.838。由

12、于 sig 的值远小于 0.05,得出两组 评酒员对白葡萄酒的评价结果也具有显著性差异。 6.1.2 两组评价结果中较可信结果的选择 假设每种葡萄酒的评价标准是一定的,标准差的大小能够反映不同评酒员 对每种酒评分的离散程度,该值越小,改组评分越稳定,所得评价结果就越可 信。因此,本文采用分别计算第一组、第二组各十名评酒员对 27 种红葡萄酒样 品和 28 种白葡萄酒样品评分的标准差的方法,通过比较标准差的大小选择可信 结果。 用 Matlab 编程作上述计算(见附录程序五) ,所得结果如下表: 表二 红、白葡萄酒评分的标准差组别 红酒样品第一组第二组组别 白酒样品第一组第二组19.63859.

13、048619.06325.0870 26.30784.0277214.17987.0048 36.76925.541838.152011.9369 410.39446.425646.68666.4885 57.87473.6953511.24885.1262 67.72874.5959612.75584.7668 710.17907.916976.25836.4944 86.63418.0691813.54995.5787 95.73975.072899.631510.3086 105.51366.01481014.58358.3905 118.41236.16801113.30879.371

14、4 128.92505.01221210.760511.8340 136.70323.91011313.06786.8386 146.00004.81201410.68753.9847 159.25026.43001511.47177.3515 164.25444.48331613.34179.0683 179.38143.02771712.00746.2013 186.87107.08991812.51185.4985 196.88327.4267196.81185.1034 203.70066.2503208.02507.0742 2110.77505.95912113.14208.025

15、0 227.11494.92612211.77577.3212 235.69994.9766236.60723.4059 247.05533.27452410.54156.20846258.03886.6131255.820510.3199 265.59366.4464268.538110.1440 277.05534.52772712.01675.9628 288.96975.0376 由上表可知,第一组评酒员对红、白葡萄酒评分的标准差分别有 74%、79% 大于第二组评酒员对相应项的评分,且第一组评酒员虽然在某些酒样品的评分 中标准差小于第二组,但此时两组评酒员评分的标准差相差不大,故综上

16、可知, 第二组的评分结果更为可信。 6.2 问题二的求解与分析 6.2.1 酿酒红葡萄的理化指标的主成分分析 根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,由于有些 理化指标对酿酒葡萄的影响不大,故本文采用这成分分析法进行降维处理,再 运用聚类分析进行分类。假设中假设酿酒葡萄的质量和葡萄酒的质量相对应, 结合葡萄酒的质量再分等级。 主成分分析法的原理阐述1:主成分分析是利用降维的思想,将多个变量 转化为少数几个综合变量(即主成分) ,其中每个主成分都是原始变量的线性组 合,各个主成分之间互不相关,从而这些主成分能够反映原始变量的绝大部分 信息,且所含的信息互不重叠。假设用 p 个变量来描述研究对象,分别用来表示,这 P 个变1,2,PX XXL量构成的 P 维随机向量为。对 X 进行线性变化,考虑原始12(,)tpXXXXL变量的线性组合:11112121212122221122pppppmmpmpFa Xa Xa XFa Xa XaXFa XaXaX KKK K K主成

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 论文指导/设计

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号