洗衣粉效茉げ庾钣拍

上传人:第*** 文档编号:38909643 上传时间:2018-05-09 格式:DOCX 页数:16 大小:231.56KB
返回 下载 相关 举报
洗衣粉效茉げ庾钣拍_第1页
第1页 / 共16页
洗衣粉效茉げ庾钣拍_第2页
第2页 / 共16页
洗衣粉效茉げ庾钣拍_第3页
第3页 / 共16页
洗衣粉效茉げ庾钣拍_第4页
第4页 / 共16页
洗衣粉效茉げ庾钣拍_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《洗衣粉效茉げ庾钣拍》由会员分享,可在线阅读,更多相关《洗衣粉效茉げ庾钣拍(16页珍藏版)》请在金锄头文库上搜索。

1、洗衣粉效能预测最优模型洗衣粉效能预测最优模型摘摘 要要本文建立了基于洗衣粉属性来判定其去污效能的两种预测模型,一是主成分降维 统计预测模型,二是灰色多变量预测模型。 针对问题一,由于所缺失的值均是洗衣粉的属性值,缺失值都集中在 PP2、PP3、PP4、PP5 这几种属性中,即有缺失值的洗衣粉品种的属性数据缺失率为 9.52%或 19.04%,且其中 PP2、PP3 的缺失值占该两种属性数据总量的 5.75%,PP4、PP5 的缺失值占该两种属性数据总量的 33.72%。经上述分析,本文选择 用均值替代缺失值。 针对问题二,本文基于主成分降维的思想,用 SPSS 统计软件,将从洗衣粉 21 种

2、属性中提取出 5 个主成分,再将每个主成分所对应的方差贡献率作为权重,计算出属 性主成分综合模型。同理,从洗衣粉去除 18 种污渍的效能中提取 4 个主成分,最终计 算出效能主成分综合模型。将上述两个模型求解得的 86 种洗衣粉的属性综合值及效能 综合值进行相关性检验,得出找出其 Pearson 相关系数为 0.36,该相关系数的显著性 值为 0.04,小于 0.1,即属性综合属性 X 和综合效能 Y 之间的线性关系显著。由此本文 对其进行线性拟合所得的模型如下: 0.5160.09YX 上述模型拟合的相对平均误差为 1.03。 针对问题三,本文采取以相对误差为评判标准来评判所建立的多个预测模

3、型。关键词关键词: 主成分分析 灰色多变量预测模型 111 问题的重述问题的重述一、背景知识一、背景知识洗衣粉是通过其中的化学成分溶于水后改变水溶液的物理化学性质来实现去污的 作用的,因此通过测量洗衣产品溶于水后的溶液的一些属性就可以了解产品去污的功 效。如果能建立溶液属性和产品功效之间的模型,就可以找出能够最大化产品功效的 溶液的属性,根据这些属性和化工技术知识我们就可以找出最优的配方。 二、已有的数据:二、已有的数据: 1. 现有 86 个产品的物理属性及功效数据,从中随机选取了 10 个产品作为验证模 型预测精度的数据,请用剩下的 76 组数据来建立模型 2. 每一个产品的 21 个属性

4、作为输入变量 (PP1PP21) 3. 产品在 18 种污渍上的功效作为输出变量 (O1O18) 三、要解决的问题三、要解决的问题 1. 对此数据用多种不同的方法进行分析,考虑所有输入变量的线性项,根据模型 的需要选择它们的平方项及交互作用项; 2. 根据现有数据拟合出一个统计模型,使得模型能够基于产品的属性数据对产品 的功效做出比较可靠的预测,并提供数据说明拟合出的模型的预测能力。 3. 选择合适的能够反映模型预测能力的评价准则(可以根据需要提出新的准则) , 并根据准则选出最优的建模方法和最优模型;注意:注意:某些产品的某些属性有缺失数据,但用来验证模型的 10 组数据里没有缺失值。22

5、问题的分析问题的分析洗衣粉的效能确定问题是一类大样本多数据的计分析与预测类问题。对本问题的 处理要分三个步骤进行:第一,对所给数据进行分析及恰当的处理;第二,在经处理 后的数据的基础上,建立拟合出几个统计模型,使得模型能够基于产品的属性数据对 产品的功效做出比较可靠的预测,并提供数据说明拟合出的模型的预测能力;第三, 选择合适的能够反映模型预测能力的评价准则(可以根据需要提出新的准则) ,并根据 准则选出最优的建模方法和最优模型。要合理准确处理好本问题,关键必须弄清问题 的相关知识并对问题作出深入的分析。一、对问题的具体分析一、对问题的具体分析1、对问题一的分析:、对问题一的分析: 问题要求对

6、此数据用多种不同的方法进行分析,考虑所有输入变量的线性项,根 据模型的需要选择它们的平方项及交互作用项。数据是 86 种洗衣粉的 21 个物理属性 及在 18 污渍上的功效。以下是处理数据的原则。 (1 1)补充缺少属性的数据)补充缺少属性的数据 由于所缺失的值均是洗衣粉的属性值,缺失值都集中在 PP2、PP3、PP4、PP5 这 几种属性中,即有缺失值的洗衣粉品种的属性数据缺失率为 9.52%或 19.04%,且其中 PP2、PP3 的缺失值占该两种属性数据总量的 5.75%,PP4、PP5 的缺失值占该两种属性 数据总量的 33.72%。 基于上述分析,本文认为有两种数据处理方法。法一,忽

7、略缺失值所带来的效应, 直接进行统计分析;法二,由于 PP2、PP3 的缺失值仅占该两种属性数据总量的 5.75%,故可将 PP2、PP3 的缺失值用均值来替代;而 PP4、PP5 的缺失值占该两种属 性数据总量的 33.72%,其比重较大。本文在判定 PP4、PP5 与各污渍的去污效果的相 关程度,发现 PP4 与 O16有显著性关系,PP5 与 O13、O14、O16、O18这几种去污效能都 有显著性关系,故虽缺失率较高,但不能剔除,故本文选择仍用均值替代缺失值。在 上述数据处理的基础上以均值为参照,即将小于各属性及性能均值的离群值再剔除, 以提高模型预测结果的准确性。 (2 2)数据平方

8、处理)数据平方处理 (3 3)数据交互作用处理)数据交互作用处理2、对问题二的分析:、对问题二的分析: 问题要求在经处理后的数据的基础上,建立拟合出一个统计模型,使得模型能够 基于产品的属性数据对产品的功效做出比较可靠的预测,并提供数据说明拟合出的模 型的预测能力。 由于本问题的输入变量有 21 种,输出变量有 18 种,这种高维数多指标的问题会 使问题趋于复杂化,不易于解决。在实际中,指标之间经常具备一定的相关性。针对 本题来说,本文设想将洗衣粉的 21 种属性经降维处理成一个综合属性(或几个主要成 分) ,将洗衣粉的 18 种污渍的去污效能综合成一个综合效能后,再来寻找这两个(或 这些)变

9、量之间的关系,拟合出所对应的统计模型,使得模型能够基于产品的属性数 据对产品的功效做出比较可靠的预测。本文采取主成分分析法对该问题进行降维处理。本文在将洗衣粉的 21 种属性经降维处理成 N 个主要成分,将去 18 种污渍的效能降 维综合成一个综合效能的基础上,建立 GM(0,N+1)和 GM(1,N+1),即表示模型 是 0 (或 1)阶方程,包含有 N 个变量的灰色模型。 33、对问题三的分析:、对问题三的分析:问题要求选择合适的能够反映模型预测能力的评价准则(可以根据需要提出新的 准则) ,并根据准则选出最优的建模方法和最优模型。 本文以相对误差为评判标准来评判所建立的多个预测模型。3

10、模型的假设模型的假设4 符号说明符号说明二、符号说明二、符号说明序号符号符号说明 1 2 3 4 5 6 7 8 9 10 11 1245 模型的建立与求解模型的建立与求解一、模型一、模型 数据拟合模型数据拟合模型1、去污效能的综合函数指标、去污效能的综合函数指标 F 本文首先分别对洗衣粉的各种属性及各个效能做相关分析,从属性相关系数矩阵 表可看出,PP1、PP2、PP3、PP10 等属性存在着极其显著的关系。可见许多变量之间直 接的相关性比较强, 证明他们存在信息上的重叠。同理,从性能相关系数矩阵可看出 各效能亦存在信息重叠。(相关系数矩阵表见附录) 故本文首先对洗衣粉的18种效能做主成分分

11、析,主成分个数提取原则为主成分对 应的特征值大于1的前m个主成分。特征值在某种程度上可以被看成是表示主成分影响 力度大小的指标, 如果特征值小于1, 说明该主成分的解释力度还不如直接引入一个原 变量的平均解释力度大, 因此一般可以用特征值大于1作为纳入标准。通过表4( 方差 分解主成分提取分析) 可知, 提取4个主成分, 即m=4。所提取出的4个主成分可反映所 有效能88.96%的信息。同理,从21种属性中提取5个主成分,所提取出的5个主成分可 反映所有属性76.83%的信息。效能解释的总方差效能解释的总方差 表表 4初始特征值提取平方和载入成份合计方差的 %累积 %合计方差的 %累积 %19

12、.69953.88553.8859.69953.88553.88524.10322.79576.6804.10322.79576.68031.1726.51183.1911.1726.51183.19141.0385.76988.9601.0385.76988.960提取方法:主成份分析。属性属性解释的总方差解释的总方差初始特征值提取平方和载入成份合计方差的 %累积 %合计方差的 %累积 %18.94542.59642.5968.94542.59642.59622.47511.78454.3802.47511.78454.38031.9439.25363.6331.9439.25363.633

13、41.4016.67370.3061.4016.67370.30651.3716.52876.8351.3716.52876.835提取方法:主成份分析。 从表 5(成分矩阵) 可知O2,O3,O4,O5,O7,O8,O9 ,O10,O11,O17,O18 ,O12 ,O13, O14在第一主成分上有较高成分, 说明第一主成分基本反映了这些指标的信息; O1,O6在第二主成分上有较高成分, 说明第二主成分基本反映了O1 和 O6两个指标的信 息;O16 在第三主成分上有较高成分,O17在第四主成分上有较高成分,说明第三第四 主成分分别基本反映了O16 和 O17两个指标的信息。所以提取四个主成

14、分是可以基本反 映全部指标的信息, 所以决定用 4 个新变量来代替原来的 18 个变量。成分矩阵表见 附录 用表5( 成分矩阵) 中的数据即为特征向量A1。将得到的特征向量与标准化后的数5据相乘,就可以得出主成分表达式。 设 Ai表示第 i 种主成分的特征向量,则有:A=A1;A2;A3;A4;A1=0.16,0.2,0.25,0.25,0.24,0.15,0.24,0.24,0.25,0.27,0.26,0.27 0.29,0.29,0.14,0.16,0.26,0.23;A2=0.37,-0.23,-0.23,0.24,0.3,0.37,-0.26,-0.26,0.25,0.17,0.19

15、,0.19 -0.12,-0.14,-0.14,-0.18,-0.19,-0.24;A3=0.1, -0.36,-0.31,0.14,0.04,-0.1,-0.24,-0.15,0.14,-0.16,-0.18 -0.1,0.09,0.06,0.49,0.51,0.11,0.23;A4=0.25,0.33,0.15,0.12,0.06,0.35,0.15,0.12,0.02,-0.25,-0.32 -0.27,-0.1,-0.09,0.53,-0.2,-0.04,-0.26。 设 W 表示去污功效标准化矩阵(数据见附件) ,即:,n=1,2,18;m=1,2,861111nmmnaaWaa K

16、MOML其中 amn表示第 m 种产品对第 n 种污渍的去污功效标准值。 设 Fi表示第 i 种主成分的不同产品的标准值矩阵,则有:,i=1,2,3,4T iiFWA设第 i 种主成分的贡献率为,则有:i,i=1,2,3,453.885%,22.795%,6.511%,5.769%设第 m 种产品的去污效能的综合函数指标为 Fm,以每个主成分所对应的方差贡献 率作为权重计算主成分综合模型,令 F 为不同产品的去污效能的综合函数指标矩阵, 则有:,i=1,2,441ii iFF终上所述,可得去污效能的综合评定值一般模型为:TFWA根据主成分综合模型即可计算综合主成分值, 并对其按综合主成分值进行排序, 即可对各种洗衣粉的效能进行综合评价比较, 本文仅列出了排在前20名的洗衣粉及排 在后20种洗衣粉的综合效能值。具体所有排序结果见附录。部分洗衣粉分综合效能排名表排名12345678910Treatmen t442622732719103643 综合效能6.471

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号