{经营管理知识}多重回归方程介绍

上传人:精****库 文档编号:140716778 上传时间:2020-07-31 格式:PPTX 页数:30 大小:524.76KB
返回 下载 相关 举报
{经营管理知识}多重回归方程介绍_第1页
第1页 / 共30页
{经营管理知识}多重回归方程介绍_第2页
第2页 / 共30页
{经营管理知识}多重回归方程介绍_第3页
第3页 / 共30页
{经营管理知识}多重回归方程介绍_第4页
第4页 / 共30页
{经营管理知识}多重回归方程介绍_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《{经营管理知识}多重回归方程介绍》由会员分享,可在线阅读,更多相关《{经营管理知识}多重回归方程介绍(30页珍藏版)》请在金锄头文库上搜索。

1、第 9部分: 多重回归,第 9部分: 多重回归,目的:,介绍多重回归方程,作为具有多个独立变量工序的可能模型。,目标: 理解多重回归方程式的各个部分-常数和系数(参数) 采用对中概念,确保回归模型为正交 采用残差图评估模型的“ 良好性” 通过观察p值、R2和标准残差变差,评估回归模型。 根据数据得出等值线图,并确定“ X” 的最优状态,注意! 对于所构建的任何形式的模型,对从模型中得出的结论要倍加小心。在对基准数据进行回归时尤其如此。,如果回归用的是基准数据,您必须运行DOE,以确认模型 (证明这些“ X” 确实控制着 “ Y” ),多重回归方程式中的“ X” 可以是独立、不等变量,也可以是互

2、相关联,如X12或X1*X2。 如果平方项(X12)显著,而线性项(X1)不显著,该怎么办?在这两项相关联时,如何区别二者的影响?(X1无疑与X12相关联!) 我们必须 转换 相关联的“ X” 变量,才能将它们各自对“ Y” 的影响区别开来。转换的方法叫做“对中”。 如何“对中”? 将每一X值减去该X变量的平均值, 然后, 计算其平方值, 即:2,让我们举一实例 . . . .,原始数据和对中数据基本正交。这可以区别影响。 要使p值有效,数据必须对中。,对中“ X”,以确保正交,对中举例:,数集:,XX2 416 525 636,X和X2一起改变 图象显示相关系数 (r) 很大。相关系数表示数

3、据点成直线的程度。对于此组数据,r = .998 (如果完全相关,r = 1.0) 我们希望“ X” 变量独立:r=0,如果X和X2都影响工序,可通过 对中对它们的影响进行独立研究。 从每个数据点中减去X的平均值: 平均值 = (4+5+6) / 3 = 5,(X - 5)(X - 5)2 -1 1 0 0 1 1,从每个X数据点减去平均值5,得到 对中 的数据:,转换过的数据的相关系数是: r = 0.0 - 这两个变量现在已经独立!,线性效应可通过比较“ X”处于低水平时的“ Y” 值和“ X”处于高水平时的Y值来估计。 二次方或曲线效应可通过比较“ X” 处于中间水平时的Y值和“ X”

4、处于高水平及低水平时Y值的平均值来估计。,将“ 对中” 数据制成图表:,(StatBasic StatisticsCorrelation.可用于计算 r 值),MINITAB对数据“ 编码” 时,其实是“ 对中” ,如上例所示。,41,1,5,49,2,5,69,3,5,65,4,5,40,1,10,50,2,10,58,3,10,57,4,10,31,1,15,36,2,15,44,3,15,57,4,15,19,1,20,31,2,20,33,3,20,43,4,20,多重回归 - 扭转,下例摘自: Richard A. Johnson. Miller and Freunds Probab

5、ility and Statistics for Engineers: Fifth Edition. Prentice Hall. 1994. 的第358页。 目的是估计描述以下变量之间关系的方程式: 元素A的百分比, 元素B的百分比 使锻造合金棒断裂所需的扭转次数 “ 扭转 (twist)” 指Y(响应)变量,“ A” 和“ B” 是X(独立)变量。 在C1中输入“ twists” ,C2中输入“A” ,C3中输入“B”。 C1 C2 C3 Twists A B,采用交互作用图,制成Y与A对应图和Y与B对应图 STATANOVAInteractions Plots,检查“ X”和“ Y”之间

6、的关系,在对话框中选择“ Twists” 作为响应变量值,并选择“ A” 和“ B” 作为因素(自变量)。 不动“ Base Plots on:” 以及“ Data Means” 。 单击“ Display Full Interaction Plot Matrix” 。 单击“ OK” 。,交互作用图分析,解释: 右上图(“ B” 在水平数轴上;不同线条代表不同的“ A” 值) 扭转次数随着“ B” 的增加而减少 两者之间的关系是曲线还是直线? 左下图(“ A” 在水平轴上。不同线条代表不同的“ B” 值) 扭转次数随着“ A” 的减少而减少 “ Y” 与“ A” 间的关系是曲线还是直线?,采

7、用“ 分析反应面设计”确定平方关系是否具有统计显著性。,定义设计,数据表将显示定义DOE的 “ std order”, “ run order”和“ blocks”。要使用“ 分析RS设计”,必须有这些信息。,为了用反应面(RS)设计法分析数据,首先要确定RS设计。 STATDOEDefine Custom RS Design,在对话框中,选择代表因素设置的栏,单击OK。使用“ 高值/低值”和“ 设计”选项,请参见Minitab帮助。我们采用这些选项的缺省设置。,下一步,用StatDOEAnalyze RS Design来分析模型 选择 response, coded units 然后单击 g

8、raphs,分析反应面模型!,“编码数据” 选择将指导Minitab采用算法对中数据,该算法可用“ 定义定制RS设计” 和“ 低值/高值” 选项来定义。在本例中,我们使用缺省的低值= -1,高值=1,在图形框中,单击这些图表,并选择变量,在主对话框中选择“Terms” 按钮,以确定模型的种类(full quadratic )以及模型中包含的因素(全部Xs ,X的 平方,和交互作用),然后单击OK,接着单击“ 分析反应面设计” 对话框中的OK。,StatDOEAnalyze RS Design,从下拉列表中选择 linear 。 Available Terms 和 Selected Terms

9、应自动改变。 如前所示,从图形选项中选择残差图(9.12页),重新拟合模型,数据显示,仅线性项有显著影响;残差图显示,平方模型可能不是最佳拟合方式。我们重新分析,选择“ Linear” ,而不是“ Quadratic” ,会话窗口输出,X变量和线性模型都具有统计显著性 (p0.05),线性和平方模型的R2值相似,表明线性模型仍为较好的拟合方式。,下一步:复习残差图,平方 线性 R-平方 93.6 91.7 R平方调节 90.3 90.4,两种模型的误差项的大小相似: 4.242 (线性)和4.254 (平方),采用残差图帮助评估线性模型,看上去,误差随拟合值的增加而增加。,残差好象不太呈正态分

10、布(请记住,我们仅有15个数据,线性模型解释:不大可能所有的假设都严格满足。然而,此模型提供了所给定数据良好的近似值,所以,在实际工作中可能会有益。如果需要更好的拟合,可能需要对数据进行转换也许使用“ Y” 的对数或倒数。,下一步:重新运行“ 未编码 ”分析以获得模型系数,“未编码数据”的分析RS图,重新运行STARTDOEAnalyze RS Plots 这次单击“ Uncoded Units” 。打开“ Graphs” 对话框,清除先前用过的残差图。单击OK,然后再单击OK生成输出结果。,生成的输出结果为模型提供了正确、未编码的系数。,单击“ Contours. ” 以设置图形输出. .

11、.,StatDOERS Plots 依次单击 Contour plot, 和Setup,最后,查看等值线图,以找到最佳设置,扭转次数 的等值线,单击 Use different types ,在等值线图中创建短划线,Click OK three times!,解释:要使扭转的数量最大,参照等值线图右下角(扭转次数 = 65)。读取将提供扭转次数 = 65(高值A,低值B)的潜在“ A” 和“ B” 值。,等值线图,另一种工具:逐步回归,在对影响工序的大量 “ X”进行筛选,以确定潜在的关键少数变量时,回归可以是一种宝贵的工具。这甚至可以采用基准数据进行,但要注意:,注意! 如果不先进行DOE,

12、以确认这些确实是控制工序的“ X” ,永远不要得出这些“ X” 就是关键少数因素的结论。,逐步回归 将根据Xs 对响应变量值(“ Y” )的影响而逐步将其添加到模型中。Minitab所用的第一个“ X” 是对Y影响最大的一个变量。 我们采用一种由计算机生成的、称作 工厂模拟器 的工厂来进行逐步回归练习。该工厂生产 小器具 ,其CTQ(“ Y” )是器具长度。 工厂用8个(标注为A至H)连续“ X” 变量生成连续的“ Y” 对应值。 工厂模拟器是一个Excel文件:FACTSIM.xls,The Factory Simulator is an Excel file: FACTSIM.xls,工厂

13、模拟器制作 小器具(中下部所示红盒),单击 Start, 启动工厂,单击Yes,运行工厂模拟器,遵照下页的程序,逐步使用逐步回归方法筛选潜在的关键“ Xs ”,采用逐步回归方法筛选出 潜在“ 关键少数” X(续),基本回归公式为: y=b0+b1x2+b2x2+b3x3+.+bnxn 对于工厂模拟器来说,公式为: 工厂输出=C1A+C2B+C3C+C4D+ C5E + C6F + C7G + C8H+b 其中C1, C2.C8为系数,“ b”为常数(确切地说是直线的Y截距) 步骤: 1.运行工厂模拟器得出的数据(确保您具有足够大的样本,并具有适当的有理数子群) 2.将输出的数据复制到Minit

14、ab中,但要先删除空行。 3.采用GRAPHMATRIX PLOT给输出数据绘图,这可使您绘制Y对每个X变量(A, B, C, D等)的关系图 在此对话框中,选择输出结果(响应值栏)和4个输入变量栏。单击OK。重复此过程,制作输出与其它4个输入变量的对照图表。这些图表将显示出趋势。这些Y与X的关系是否为线性?是否为曲线? 4.选择STATREGRESSIONSTEPWISE “ 响应值”:Y(输出栏 - C1) “ 预测变量值”:A至H(栏2至栏9) 单击“ Options”按钮,在“ Take _steps between pauses”处输入1。 点击两次“ OK”。 Minitab将按顺

15、序排列有影响的“ X”变量,并首先对影响最大的X进行回归分析,Minitab将询问您是否希望运行更多步骤,键入“ yes”,然后点击回。车键。持续这样做,直到Minitab不再进行计算。这时,您就得到了所有的潜在“ 关键少数”! 注意:在Minitab计算的最后一步,检查R2值。只有您能够决定拟合模型是否好得足以可以应用。,关键概念:第9部分多重回归,始终首先将数据绘图! 如果数据散点图显示“ Y”与“ X”存在着潜在的曲线关系(或者您不能确定,而需要一个起点进行分析),就用二次方模型拟合数据 反应面 要将“ X2”的影响与“ X”的影响分开,可通过从每个“ X”值中减去相应栏平均值的方法 对

16、中 数据(这保证了正交性)在所有的分析中使用对中的数据,在完成时将其转换回未对中的数据。 观察用于模型初始评估的p值、R2和R2adj、以及s;使用残差图检查误差项。 使用等值线图找出产生预期“ Y” 所需的“ Xs” 值组合。 采用逐步回归方法依次向模型添加“ X” (根据其对“ Y” 的影响)。,附录,如何安排数据能提供线索找出影响显著的“ X” ,找出扭转次数的最高值 - “ A”和“ B”合金的哪种组合可使扭转最大?,使用Cross-Tabulation查看数据的趋势 (采用本部分初始的 “ 扭转次数” 数据),从此表来看,似乎高百分比的合金 A 和低百分比的合金 B 使扭转次数最大。用这些信息复查回归分析的结果.,StatTablesCross Tabulation 选择 Display Counts,Excel Solver,采用Excel Solver解答回归方程,步骤1:打开Excel,建立空白表格。在

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号