洗衣粉效能最优模型 - 副本.docx

上传人:m**** 文档编号:546399793 上传时间:2023-01-17 格式:DOCX 页数:16 大小:233.90KB
返回 下载 相关 举报
洗衣粉效能最优模型 - 副本.docx_第1页
第1页 / 共16页
洗衣粉效能最优模型 - 副本.docx_第2页
第2页 / 共16页
洗衣粉效能最优模型 - 副本.docx_第3页
第3页 / 共16页
洗衣粉效能最优模型 - 副本.docx_第4页
第4页 / 共16页
洗衣粉效能最优模型 - 副本.docx_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《洗衣粉效能最优模型 - 副本.docx》由会员分享,可在线阅读,更多相关《洗衣粉效能最优模型 - 副本.docx(16页珍藏版)》请在金锄头文库上搜索。

1、洗衣粉效能预测最优模型摘 要本文建立了基于洗衣粉属性来判定其去污效能的两种预测模型,一是主成分降维统计预测模型,二是灰色多变量预测模型。针对问题一,由于所缺失的值均是洗衣粉的属性值,缺失值都集中在PP2、PP3、PP4、PP5这几种属性中,即有缺失值的洗衣粉品种的属性数据缺失率为9.52%或19.04%,且其中PP2、PP3的缺失值占该两种属性数据总量的5.75%,PP4、PP5的缺失值占该两种属性数据总量的33.72%。经上述分析,本文选择用均值替代缺失值。针对问题二,本文基于主成分降维的思想,用SPSS统计软件,将从洗衣粉21种属性中提取出5个主成分,再将每个主成分所对应的方差贡献率作为权

2、重,计算出属性主成分综合模型。同理,从洗衣粉去除18种污渍的效能中提取4个主成分,最终计算出效能主成分综合模型。将上述两个模型求解得的86种洗衣粉的属性综合值及效能综合值进行相关性检验,得出找出其Pearson相关系数为0.36,该相关系数的显著性值为0.04,小于0.1,即属性综合属性X和综合效能Y之间的线性关系显著。由此本文对其进行线性拟合所得的模型如下:上述模型拟合的相对平均误差为1.03。针对问题三,本文采取以相对误差为评判标准来评判所建立的多个预测模型。关键词: 主成分分析 灰色多变量预测模型 1 问题的重述一、背景知识洗衣粉是通过其中的化学成分溶于水后改变水溶液的物理化学性质来实现

3、去污的作用的,因此通过测量洗衣产品溶于水后的溶液的一些属性就可以了解产品去污的功效。如果能建立溶液属性和产品功效之间的模型,就可以找出能够最大化产品功效的溶液的属性,根据这些属性和化工技术知识我们就可以找出最优的配方。二、已有的数据:1. 现有86个产品的物理属性及功效数据,从中随机选取了10个产品作为验证模型预测精度的数据,请用剩下的76组数据来建立模型2. 每一个产品的21个属性作为输入变量 (PP1PP21)3. 产品在18种污渍上的功效作为输出变量 (O1O18)三、要解决的问题1. 对此数据用多种不同的方法进行分析,考虑所有输入变量的线性项,根据模型的需要选择它们的平方项及交互作用项

4、;2. 根据现有数据拟合出一个统计模型,使得模型能够基于产品的属性数据对产品的功效做出比较可靠的预测,并提供数据说明拟合出的模型的预测能力。3. 选择合适的能够反映模型预测能力的评价准则(可以根据需要提出新的准则),并根据准则选出最优的建模方法和最优模型;注意:某些产品的某些属性有缺失数据,但用来验证模型的10组数据里没有缺失值。2 问题的分析洗衣粉的效能确定问题是一类大样本多数据的计分析与预测类问题。对本问题的处理要分三个步骤进行:第一,对所给数据进行分析及恰当的处理;第二,在经处理后的数据的基础上,建立拟合出几个统计模型,使得模型能够基于产品的属性数据对产品的功效做出比较可靠的预测,并提供

5、数据说明拟合出的模型的预测能力;第三,选择合适的能够反映模型预测能力的评价准则(可以根据需要提出新的准则),并根据准则选出最优的建模方法和最优模型。要合理准确处理好本问题,关键必须弄清问题的相关知识并对问题作出深入的分析。一、对问题的具体分析1、对问题一的分析:问题要求对此数据用多种不同的方法进行分析,考虑所有输入变量的线性项,根据模型的需要选择它们的平方项及交互作用项。数据是86种洗衣粉的21个物理属性及在18污渍上的功效。以下是处理数据的原则。(1)补充缺少属性的数据由于所缺失的值均是洗衣粉的属性值,缺失值都集中在PP2、PP3、PP4、PP5这几种属性中,即有缺失值的洗衣粉品种的属性数据

6、缺失率为9.52%或19.04%,且其中PP2、PP3的缺失值占该两种属性数据总量的5.75%,PP4、PP5的缺失值占该两种属性数据总量的33.72%。基于上述分析,本文认为有两种数据处理方法。法一,忽略缺失值所带来的效应,直接进行统计分析;法二,由于PP2、PP3的缺失值仅占该两种属性数据总量的5.75%,故可将PP2、PP3的缺失值用均值来替代;而PP4、PP5的缺失值占该两种属性数据总量的33.72%,其比重较大。本文在判定PP4、PP5与各污渍的去污效果的相关程度,发现PP4与O16有显著性关系,PP5与O13、O14、O16、O18这几种去污效能都有显著性关系,故虽缺失率较高,但不

7、能剔除,故本文选择仍用均值替代缺失值。在上述数据处理的基础上以均值为参照,即将小于各属性及性能均值的离群值再剔除,以提高模型预测结果的准确性。(2)数据平方处理(3)数据交互作用处理2、对问题二的分析:问题要求在经处理后的数据的基础上,建立拟合出一个统计模型,使得模型能够基于产品的属性数据对产品的功效做出比较可靠的预测,并提供数据说明拟合出的模型的预测能力。由于本问题的输入变量有21种,输出变量有18种,这种高维数多指标的问题会使问题趋于复杂化,不易于解决。在实际中,指标之间经常具备一定的相关性。针对本题来说,本文设想将洗衣粉的21种属性经降维处理成一个综合属性(或几个主要成分),将洗衣粉的1

8、8种污渍的去污效能综合成一个综合效能后,再来寻找这两个(或这些)变量之间的关系,拟合出所对应的统计模型,使得模型能够基于产品的属性数据对产品的功效做出比较可靠的预测。本文采取主成分分析法对该问题进行降维处理。本文在将洗衣粉的21种属性经降维处理成N个主要成分,将去18种污渍的效能降维综合成一个综合效能的基础上,建立GM(0,N+1)和GM(1,N+1),即表示模型是0 (或1)阶方程,包含有N 个变量的灰色模型。 3、对问题三的分析:问题要求选择合适的能够反映模型预测能力的评价准则(可以根据需要提出新的准则),并根据准则选出最优的建模方法和最优模型。本文以相对误差为评判标准来评判所建立的多个预

9、测模型。3 模型的假设4符号说明二、符号说明序号符号符号说明1234567891011125 模型的建立与求解一、模型 数据拟合模型1、去污效能的综合函数指标F本文首先分别对洗衣粉的各种属性及各个效能做相关分析,从属性相关系数矩阵表可看出,PP1、PP2、PP3、PP10等属性存在着极其显著的关系。可见许多变量之间直接的相关性比较强, 证明他们存在信息上的重叠。同理,从性能相关系数矩阵可看出各效能亦存在信息重叠。(相关系数矩阵表见附录)故本文首先对洗衣粉的18种效能做主成分分析,主成分个数提取原则为主成分对应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响力度大小的指

10、标, 如果特征值小于1, 说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大, 因此一般可以用特征值大于1作为纳入标准。通过表4( 方差分解主成分提取分析) 可知, 提取4个主成分, 即m=4。所提取出的4个主成分可反映所有效能88.96%的信息。同理,从21种属性中提取5个主成分,所提取出的5个主成分可反映所有属性76.83%的信息。效能解释的总方差 表4成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %19.69953.88553.8859.69953.88553.88524.10322.79576.6804.10322.79576.68031.1726.

11、51183.1911.1726.51183.19141.0385.76988.9601.0385.76988.960提取方法:主成份分析。属性解释的总方差成份初始特征值提取平方和载入合计方差的 %累积 %合计方差的 %累积 %18.94542.59642.5968.94542.59642.59622.47511.78454.3802.47511.78454.38031.9439.25363.6331.9439.25363.63341.4016.67370.3061.4016.67370.30651.3716.52876.8351.3716.52876.835提取方法:主成份分析。从表5(成分矩

12、阵) 可知O2,O3,O4,O5,O7,O8,O9 ,O10,O11,O17,O18 ,O12 ,O13, O14在第一主成分上有较高成分, 说明第一主成分基本反映了这些指标的信息; O1,O6在第二主成分上有较高成分, 说明第二主成分基本反映了O1和O6两个指标的信息;O16 在第三主成分上有较高成分,O17在第四主成分上有较高成分,说明第三第四主成分分别基本反映了O16和O17两个指标的信息。所以提取四个主成分是可以基本反映全部指标的信息, 所以决定用4个新变量来代替原来的18个变量。成分矩阵表见附录用表5( 成分矩阵) 中的数据即为特征向量A1。将得到的特征向量与标准化后的数据相乘,就可

13、以得出主成分表达式。设Ai表示第i种主成分的特征向量,则有:A=A1;A2;A3;A4; A1=0.16,0.2,0.25,0.25,0.24,0.15,0.24,0.24,0.25,0.27,0.26,0.27 0.29,0.29,0.14,0.16,0.26,0.23; A2=0.37,-0.23,-0.23,0.24,0.3,0.37,-0.26,-0.26,0.25,0.17,0.19,0.19 -0.12,-0.14,-0.14,-0.18,-0.19,-0.24; A3=0.1, -0.36,-0.31,0.14,0.04,-0.1,-0.24,-0.15,0.14,-0.16,-

14、0.18 -0.1,0.09,0.06,0.49,0.51,0.11,0.23; A4=0.25,0.33,0.15,0.12,0.06,0.35,0.15,0.12,0.02,-0.25,-0.32 -0.27,-0.1,-0.09,0.53,-0.2,-0.04,-0.26。设W表示去污功效标准化矩阵(数据见附件),即:,n=1,2,18;m=1,2,86其中amn表示第m种产品对第n种污渍的去污功效标准值。设Fi表示第i种主成分的不同产品的标准值矩阵,则有:,i=1,2,3,4设第i种主成分的贡献率为,则有:,i=1,2,3,4设第m种产品的去污效能的综合函数指标为Fm,以每个主成分所对应的方差贡献率作为权重计算主成分综合模型,令F为不同产品的去污效能的综合函数指标矩阵,则有:,i=1,2,4终上所述,可得去污效能的综合评定值一般模型为:根据主成分综合模型即可计算综合主成分值, 并对其按综合主成分值进行排序, 即可对各种洗衣粉的效能进行综合评价比较, 本文仅列出了排在前20名的洗衣粉及排在后20种洗衣粉的综合效能值。具体所有排序结果见附录。排名12345678910Treatment442622732719103643综合效能6.47125.12494.89774.51614.11714.08363.787

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号