2012年全国数学建模竞赛a题 优秀论文

上传人:mg****85 文档编号:34729418 上传时间:2018-02-28 格式:DOC 页数:24 大小:1.06MB
返回 下载 相关 举报
2012年全国数学建模竞赛a题 优秀论文_第1页
第1页 / 共24页
2012年全国数学建模竞赛a题 优秀论文_第2页
第2页 / 共24页
2012年全国数学建模竞赛a题 优秀论文_第3页
第3页 / 共24页
2012年全国数学建模竞赛a题 优秀论文_第4页
第4页 / 共24页
2012年全国数学建模竞赛a题 优秀论文_第5页
第5页 / 共24页
点击查看更多>>
资源描述

《2012年全国数学建模竞赛a题 优秀论文》由会员分享,可在线阅读,更多相关《2012年全国数学建模竞赛a题 优秀论文(24页珍藏版)》请在金锄头文库上搜索。

1、葡萄酒质量的综合评价分析模型 中国海洋大学 罗聃 徐兴成 谭萍 指导教师 高翔 专家点评: 本文问题一方法合理,结论正确。问题二对葡萄理化指标进行聚类,然后根据葡 萄酒质量进行分级,思路简明正确。问题三进行多元线性回归,尚可,但如果能进行 相关性分析会更好。问题四用逐步回归的方法,适当,加入芳香类物质,使结论更加 合理。如果问题二和问题三也能将附件三考虑入内会使结论更加有力。 点评人:济南大学数学科学学院许振宇副教授 【摘要】 近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增,特别是随着食品 科学技术的发展,人们不再满足传统感官评价葡萄酒的水平,如何运用数据资料定量 研究葡萄酒的品质,加

2、快建立葡萄酒市场指标规则成为人们关注的焦点。本文主要研 究了葡萄酒的品质与葡萄酒自身以及酿酒葡萄的理化指标的关系,给出了基于葡萄酒 自身的理化指标以及酿酒葡萄的理化指标与芳香物质的定量综合评价模型。 首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的 t 检验法 建立评估两组数据差异的模型,得到了两组评酒员的评分存在显著差异的结论,并通 过对两组数据进行方差分析,以判别结果具有的稳定性作为标准,得到第二组比较可 靠。 接下来我们结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质 量对酿酒葡萄进行分级,用聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了 5类, 然后对分好的

3、葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。 更进一步,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分 析的方法,从酿酒葡萄的 30个指标中提取出了 12个主要成分,进而通过逐步回归的 方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。 最后我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归 的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒 质量影响比重得到芳香物质对葡萄酒的质量有 30%以上的影响比重(白葡萄的芳香物 质对白葡萄酒的质量影响相对更大) ,故而不能完全用酿酒葡萄和葡萄酒的理化指标评 价葡萄酒的质量。 关键词: 假

4、设检验 聚类分析 主成分分析 逐步回归1 一、问题重述 1.1问题背景 葡萄酒是由新鲜葡萄或葡萄汁经过酒精发酵而得到的一种含酒精饮料。葡萄酒质 量是其外观、香气、口感、整体的综合表现。一方面,酒中的糖、酸、矿物质和酚类 化合物,都具有各自独特的风味,它们组成了葡萄酒的酒体;另一方面,酒中大量的 挥发性物质,包括醇、脂、醛、碳氢化合物等,都具有不同浓度、不同愉悦程度的香 气,葡萄酒最终的质量则是葡萄酒中各种成分协调平衡的结果。 1.2问题提出 随着葡萄酒产业逐渐升温,为了获得质量更好的葡萄酒,对酿酒葡萄及葡萄酒的 研究也越加深入。现在流行的做法是通过聘请一批有资质的评酒员进行品评,但是这 种感官

5、评价的主观性总是带给我们模糊的印象。正如我们所知的,酿酒葡萄的好坏与 所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上 反映葡萄酒和葡萄的质量。如何充分利用这些理化指标定量研究葡萄酒的质量成了炙 手可热的研究问题。 二、问题分析 题目为我们提供了感官评价指标,葡萄和葡萄酒的各种理化指标和芳香物质的信 息。本文的关键就是通过分析处理已给的数据,建立数学模型来研究葡萄酒质量的确 立。为此,我们要依次达到题目给出的以下几个目标: 2.1 两组评价结果差异性和可信性研究 问题一给出了两组评酒员对同一批葡萄酒的评价分数,本文采用假设检验中的 t 检 验法建立评估两组数据差异的模

6、型,研究两组评价员的评价结果是否存在差异,判断 是否能接受它们有显著性差异的假设。若判断的结果是这两组数据存在差异,我们就 进入第二步,可靠性研究。我们分别对两组数据求方差,方差小的那组说明波动比较 小,评酒员的评定比较稳定,数据比较可靠。 2.2酿酒葡萄的分级 首先,我们我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理, 降低评酒员之间的差异,提高酒样品之间的差异 【1】 ;利用处理后的数据(总分)对葡 萄酒进行分级; 然后,用初步处理后的酿酒葡萄的理化指标对葡萄进行聚类分析,将葡萄分成了 若干类;分析每类葡萄对应的葡萄酒大都属于哪一级别,从而得出葡萄的级别; 最后,分析每一级葡

7、萄理化指标的特点,建立起葡萄指标识别葡萄级别的模型帮 助果农更好地利用好葡萄酿好酒。2 2.3酿酒葡萄与葡萄酒理化指标的联系 问题三要求研究葡萄与葡萄酒理化指标之间的联系,我们先对于葡萄的 30个理化 指标进行主成分分析法,得到葡萄一些具有代表性的理化指标。然后我们建立葡萄的 理化指标与葡萄酒的 7个理化指标之间的多元线性回归方程,得到了酿酒葡萄与葡萄 酒理化指标之间的定量联系。 2.4 理化指标对葡萄酒质量的影响及论证 问题四要求研究酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以及是否能 完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。我们将提取葡萄及葡萄酒的 理化指标与芳香物质中的主成

8、分,利用逐步回归的方法考察理化指标与芳香物质对葡 萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒 的质量有 30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大) , 故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。 三、问题假设 1、同种葡萄酒在一组评酒员下的得分成正态分布。 2、一种葡萄对应酿制一种葡萄酒。 3、葡萄的成分充分转换成葡萄酒里的成分,不存在意外的浪费和挥发。 4、假设葡萄和葡萄酒芳香物质中没有检测到的成分不存在于该样本中,数据处理前将 其置为零。 四、符号说明 这里只列出主要模型的全局参数,其他局部参数见文中。 (1) i

9、J 第i个红葡萄酒样品 (2) i J 第i个白葡萄酒样品 1 T 第一组评酒员全体 2 T 第一组评酒员全体 (1) i A 酿酒红葡萄样本 (2) i A 酿酒白葡萄样本 五、建模的建立与求解 5.1模型一:基于t检验建立差异评估模型 我们采用假设性检验验证是否能接受两组评酒员评价结果无差异的假设。然后用 方差分析两组评酒员组内数据的波动,认为较平稳的一组数据比较可靠。3 5.1.1数据预处理 我们在整理数据的时候发现几个比较显著的异常数据: 1)第一组红酒数据样品 20色调品酒员 4号 数据缺失; 2)第一组白酒数据样品 3持久性品酒员 7号 数据明显有问题,怀疑是多 敲了一个 7; 3

10、)第一组白酒数据样品 8口感分析浓度品酒员 2号 数据明显异常。 因为随机样本在均值附近振荡,所以我们选用均值来代替异常数据以求误差最小。 5.1.2基于成对数据的t检验 【2】 1)模型的建立: 将两组评酒员分别看作两个整体 、 ,对每个红葡萄酒样品 1 T 2 T (白葡萄酒样品 )进行感官评价, 对每个红葡萄 (1) i J ( 1,2, , 27) i L (2) i J ( 1, 2, ,28) i L 1 T 酒样品 的评价结果通过组内每一位品酒员的评分 的均值 (1) i J (1) ij x ( 1, 2, ,10) j L 来刻画,同样 对每个红葡萄酒样品 的评价结果用均值

11、10 (1) (1) 1 1 10 i ij j x x 2 T (1) i J 来刻画,从而得到两组评酒员对每种样品酒的评价结果,建立两组评酒 10 (1) 1 1 10 i ij j y y 员对红葡萄酒的评价结果见表 1。 红葡萄酒样品 1 2 3 4 5 6 7 8 9 10 11 12 13 14 第一组评分 62.7 80.3 80.4 68.6 73.3 72.2 71.5 72.3 81.5 74.2 70.1 53.9 74.6 73 第二组评分 68.1 74 74.6 71.2 72.1 66.3 65.3 66 78.2 68.8 61.6 68.3 68.8 72.6

12、 D -5.4 6.3 5.8 -2.6 1.2 5.9 6.2 6.3 3.3 5.4 8.5 -14.4 5.8 0.4 红葡萄酒样品 15 16 17 18 19 20 21 22 23 24 25 26 27 第一组评分 58.7 74.9 79.3 59.9 78.6 78.6 77.1 77.2 85.6 78 69.2 73.8 73 第二组评分 65.7 69.9 74.5 65.4 72.6 75.8 72.2 71.6 77.1 71.5 68.2 72 71.5 D -7 5 4.8 -5.5 6 2.8 4.9 5.6 8.5 6.5 1 1.8 1.5 表 1 红葡萄

13、酒的评价结果 表中的数据是成对的,即对同一酒样品 得到一对数据。可知一对与另一对数据 (1) i J 之间差异是由各种因素,如葡萄酒的外观、香气、口感、材料成分等因素引起的。由 于各酒样品 的特性有广泛的差异,就不能将第一组评酒员 对 种 (1) i J ( 1,2, ,27) i L 1 T 27 红葡萄酒的评价结果看成是同分布随机变量的观测值。因而表中第一行不能看成是一 个样本的样本值,同样第二组的数据也不能看成是同一个样本的样本值,而同一对中 两个数据是同分布随机变量的观测值,他们的差异是由于两组品酒员的水平引起的。 为鉴定他们的评价结果有无显著性差异,可使用基于成对数据的逐对比较法。

14、以红葡萄样品为例,有 27 对相互独立的评价结果: , 1 1 2 2 27 27 ( , ),( , ), ,( , ) X Y X Y X Y L 令 ,则 相互独立。由于 1 1 1 2 2 2 27 27 27 , , , D X Y D X Y D X Y L 1 2 27 , , , D D D L4 是由同一因素所引起的,可认为它们服从同一分布。现假设 1 2 27 , , , D D D L , 。就是说 构成正态总体 的一个样 2 ( , ) i D D D N : 1, 2, ,27 i L 1 2 27 , , , D D D L 2 ( , ) D D N 本,其中 未

15、知。基于这一样本检验假设: 2 , D D (1) 0 1 : 0, : 0 D D H H 分别记 的样本均值和样本方差的观测值为 , 。对 进行单 1 2 27 , , , D D D L d 2 D s 1 2 27 , , , D D D L 个均值的 t 检验,检验问题的拒绝域为(显著水平为 ): . (2) 2 ( 1) D d t t n s n 当 的值不落在拒绝域内,接受 ,认为两组品酒员的评价结果没有显著差异, t 0 H 否则两组品酒员的评价结果有显著性差异。 对白葡萄酒的处理同红葡萄。 2)模型的求解:现以红葡萄酒为例求解,首先,作出同一酒样品 分别由两组品酒 (1)

16、i J ( 1, 2, , 27) i L 员 、 得到的评价结果之差,列于表 1 的第三行。根据建立的模型需检验假设 1 T 2 T . 0 1 : 0, : 0 D D H H 我们取 =0.02,则 ,通过查表即知拒绝域为 2 0.01 (26) (26) 2.4786 t t 2.4786 D d t s n 由观测值得 , , .现 的值落 2.5407 d 2 27.7883 D s 2.5407 2.5044 2.4786 5.2714 27 t t 在拒绝域内,故接受 ;同样对白葡萄酒进行成对数据的 t 检验,得白葡萄酒观测值 1 H 之差的均值 , , ,故认为两 2.5214 d 2 24.9124 D s 2.5214

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号