葡萄酒的质量分析摘要据考古学家考证,人类在10000年前的新石器时代就开始了采集野生葡萄果实及进行天然的葡萄酒酿造而中国古代即有各种野生葡萄,古人称葡萄为蒲桃,为皇家果园的珍奇果品周朝已有蒲桃的记载葡萄酒历史悠久,在今天也越来越受广大人民的喜爱,我们将在本文中对葡萄酒的评价及葡萄酒与酿酒葡萄之间的联系建立模型针对问题1:我们要分析两组评酒员的评价结果有无明显差异我们先求出它们的方差进行对比,在评价酒的质量的好坏时,要考虑外观、香气、口感和平衡(整体),将它们综合起来才是评价葡萄酒的综合标准我们求出每一个小组对某一种酒的评价的平均值及方差,用Matlab程序作出对应的方差波动图通过两组数据和图的对比,可看出第一小组的变化波动比第二组的变化波动大因此,我们认为第二组的评价结果更可信针对问题2:在附录二中葡萄酒的理化指标只取一级指标,剔除二级指标对多次测试的项目取平均值,精简得到酿酒葡萄的理化指标分析表,共27个指标为了把指标复杂的关系进行简化,对理化指标用spss做主成分分析并求解第i样红葡萄综合指数ZiZi=+b1 i=1,2,3…..27 , n=1,2…7同理可求白葡萄的综合指数,然后根据所求解得到的数据Zi进行分段划分,进而划分酿酒葡萄的级别:红葡萄酒为:第一类:得分大于2, 9、23。
第二类:得分2~1,3、17、2、20第三类:得分1~0,14、5、19第四类:得分小于-2, 10、25、15、18、7、11白葡萄酒为:第一类,得分大于2: 17、22第二类,得分2~0: 5、9、28、10、21、27、1第三类,得分0~-2,26、2、18、13、14、7第四类,得分小于-2: 12、8、11、16针对问题3:所用的方法和问题2相同,我们仍用主成分分析法来建立模型首先分析酿酒葡萄与葡萄酒理化指标间的联系,葡萄酒中的花色苷、单宁、总酚、酒总黄酮、白黎芦醇、DPPH半抑制体积、色泽等影响着葡萄酒的质量我们从问题2中找出影响葡萄酒较大的酿酒葡萄的理化指标,将葡萄酒的理化指标和这些数据拟合中一起,再用SPSS程序计算出结果,就可以直接得到他们之间的相关矩阵针对问题四:在评价葡萄酒的质量时,我们要考虑外观,香气,口感和平衡/评价将问题2和问题3中求出的相互影响的主要数据综合中一起,建立相应的模型:再用SPSS程序计算出最后的结果为:=89.308-0.002x1+1.727x2-1.615x3+……+0.0.148x17(红葡萄酒)=69.105-0.595x1-0.789x2-0.256x3+……+0.085x16(白葡萄酒)关键词:线性回归 Matlab SPSS 主成分分析法 一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。
每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据请尝试建立数学模型讨论下列问题:1. 分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2. 根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级3. 分析酿酒葡萄与葡萄酒的理化指标之间的联系4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量? 附件1:葡萄酒品尝评分表(含4个表格)附件2:葡萄和葡萄酒的理化指标(含2个表格)附件3:葡萄和葡萄酒的芳香物质(含4个表格)二、符号说明 酿酒葡萄的不同的理化指标 各葡萄样本与主成分的关系矩阵 酿酒葡萄理化指标提取的主成分对应理化指标中的贡献率 各葡萄酒评分量纲化处理后的数值 主成分与其贡献率的乘积加上葡萄酒评分数值构成线性组合 为y的估计值或预测值 A 为截距(常数项) Bi 为偏回归系数三、问题分析问题1要建立一个模型判断两组评酒员评价酒的价值时有无显著性差异,我们在解题的过程中,首先对附录一中的数据进行处理,每一个评酒员对每一种酒的评价都不相同。
我们在数据处理时,先求出它们对某一种酒的评价的分数,再求出这一小组对这种酒的评价均值及评价的无偏方差建立表格,将这些评价的分数综合在一起,这样有利于我们对比第一、二组对不同酒的评价就红葡萄酒和白葡萄酒之间不同的评价及评价的方差,我们可以用Matlab程序分别作出第一、二组的方差对比图和t,F的检验,根据第一、二组的评价的方差的波动大小,我们就可以清晰地看出他们之间的变化差异问题2题目中要求我们要建立一个模型根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级题目对葡萄酒样品给出了葡萄酒品尝评分表、理化指标分析表和芳香物质分析表由于酿酒葡萄酒理化指标分析表和芳香物质分析表无法直接对葡萄酒的质量进行判断因此,把酿酒葡萄的理化指标作为对葡萄酒质量的评定在处理数据时,由于数据太多,我们将酿酒葡萄的理化指标综合,用主成分分析法处理酿酒葡萄的理化指标,将所有指标用spss缩减为几个主成分,根据附录二给出的数据,用主成分分析法建立相应的数学模型,对葡萄进行分级问题3在这个问题中需要我们建立模型分析酿酒葡萄与葡萄酒的理化指标自己的关系在葡萄酒的理化指标中,花色苷、单宁、总酚、酒总黄酮、白黎芦醇、DPPH半抑制体积、色泽等都是影响葡萄酒质量的因素。
而我们根据问题二的结果从酿酒葡萄的理化指标中选出几个主要成分做一个文件,根据相应的数据,将酿酒葡萄与影响葡萄酒的主要因素用SPSS软件计算出他们之间的相关矩阵,我们可以认为相关矩阵中显示出的数据就是酿酒葡萄与葡萄酒的理化指标之间的联系问题4 在这个问题中,我们需要同时考虑酿酒葡萄和葡萄酒的理化指标,再分析它们对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量在解决问题的过程中,我们可以根据问题2和问题3得出的结论选出影响的主要因素结合附录一葡萄酒的质量的平均值,建立多元线性回归模型,用SPPS软件计算出结果四、模型假设1、在建立模型的过程中,只针对给出的这几种酒,不考虑其他酒的影响;2、葡萄酒的质量不考虑芳香物质的影响只考虑理化指标的影响;3、葡萄酒的二级理化指标的信息全部反应在相对应得一级理化指标中五、模型的建立和求解问题1:我们先找出每组中每一个评酒员对于某一种酒的评价总分,再求出这一组对这种酒的评价均值,以及他们的无偏方差,他们的计算方式如下:评价均值=1/10*(评酒员1的评价+评酒员2的评价+···+评酒员10的评价)无偏方差=1/9*[(评酒员1的评价-评价均值)^2+……+(评酒员10的评价-评价均值)^2]根据他们的计算结果,我们得出下表数据:酒样号第一组对红葡萄酒的评价第一组对白葡萄酒的评价第二组对红葡萄酒的评价第二组对白葡萄酒的评价评价均值无偏方差评价均值无偏方差评价均值无偏方差评价均值无偏方差162.792.98292.2222268.181.8777877.925.87778280.339.7888974.2201.06677416.2222275.849.06667380.445.8222285.3365.122274.630.7111175.6142.4889468.6108.044479.444.7111171.241.2888976.942.1573.362.0111171126.444472.113.6555681.526.27778672.259.7333368.4162.711166.321.1222275.522.72222771.5103.611177.539.1666765.362.6777874.242.17778872.344.0111171.4183.66665.1111172.331.12222981.532.9444472.992.7666778.225.7333380.4106.26671074.230.474.3212.677868.836.1777879.870.41170.170.7666772.3177.122261.638.0444471.487.822221253.979.6555663.3115.788968.325.1222272.4140.04441374.644.9333365.9170.766768.815.2888973.946.7666714733672114.222272.623.1555677.115.877781558.785.5666772.4131.665.741.3444478.454.044441674.918.17417869.920.167.382.233331779.388.0111178.8144.177874.59.16666780.338.455561860.142.7666773.1156.544465.450.2666776.730.233331978.647.3777872.246.472.655.1555676.426.044442078.626.0444477.864.475.839.0666776.650.044442177.1116.176.4172.711172.235.5111179.264.42277.250.6222271138.666771.624.2666779.453.62385.632.4888975.943.6555677.124.7666777.411.6247874.8888973.3111.122271.510.7222276.138.544442569.264.6222277.133.8777868.243.7333379.5106.52673.831.2888981.372.97241.5555674.3102.9277349.7777864.8144.471.520.57735.5。