六西格玛培训讲义-方差与回规

上传人:luobi****88888 文档编号:94230783 上传时间:2019-08-04 格式:PPT 页数:44 大小:903KB
返回 下载 相关 举报
六西格玛培训讲义-方差与回规_第1页
第1页 / 共44页
六西格玛培训讲义-方差与回规_第2页
第2页 / 共44页
六西格玛培训讲义-方差与回规_第3页
第3页 / 共44页
六西格玛培训讲义-方差与回规_第4页
第4页 / 共44页
六西格玛培训讲义-方差与回规_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《六西格玛培训讲义-方差与回规》由会员分享,可在线阅读,更多相关《六西格玛培训讲义-方差与回规(44页珍藏版)》请在金锄头文库上搜索。

1、本 章 目 标,1.理解方差分析的概念 2.知道方差分析解决什么样的问题 3.掌握单因素和多因素方差分析的原理 4.会利用Minitab对实际问题进行方差分析 5.能够对方差分析的结果作出解释,返回目录,方差分析的引入(续一),方差分析(ANOVA:analysis of variance)能够解决多个均值是否相等的检验问题。,方差分析是要检验各个水平的均值是否相等,采用的方法是比较各水平的方差。,返回目录,方差分析的引入(续三),方差分析实际上是用来 辨别各水平间的差别是否 超出了水平内正常误差的 程度 观察值之间的差异包括 系统性差异和随机性差异。,返回目录,方差分析的引入(续四),观察值

2、,期望值,差距,总离差,组内方差,组间方差,水平1,水平2,返回目录,7.2 怎样得到F统计量,返回目录,怎样得到F统计量,水平间(也称组间)方差和水平内(也称组内)方差之比 是一个统计量。实践证明这个统计量遵从一个特定的 分布,数理统计上把这个分布称为F分布。即,注意:组间方差(SSB)+组内方差(SSw)=总方差(SST),F=组间方差组内方差,返回目录,方差分析的前提,不同组样本的方差应相等或至少很接近,水平1,水平2,水平1组内方差远远超过两水平组间方差,我无法分离这两种差别!,返回目录,检验方差是否一致,在方差分析之前,我们可利用Minitab对数据作方差一致性检验,Minitab能

3、够读取的数据格式与上表给出的格式不同,我们必须 把数据转化为Minitab能够理解的形式,具体做法是: 将所有变量值输入工作表的第一列,对因素进行编码,按照一定 的顺序编为1、2、3.,输入后面几列。 对本例: 先将素质测评的得分输入工作表列一; 三个分支分别编码为1、2、3,对应于变量值填入第二列;,返回目录,给出假设,因素是方差分析研究的对象,在这个例子里,两个变量分别是分支机构位置和员工素质测评分数,这里分支机构的位置就是一个因素,因素中的内容就称为水平。该因素中有三个水平,即机构的不同位置。学过第5章的知识后,我们可以给出下面的假设:,返回目录,相关分析是研究事物的相互关系,测定它们联

4、系的紧密程度,揭示其变化的具体形式和规律性的统计方法,是构造各种经济模型、进行结构分析、政策评价、预测和控制的重要工具。,相关关系度量工具,返回目录,符号:r0 正相关;r0 负相关,测定两变量是否线性相关?,返回目录,相关系数的检验:,统计量t 遵从 t(n2)分布,将r变换成 t后,可以用 t 检验方法检验 =0是否成立。,返回目录,1.一元线性回归模型拟合优度的评价,判定系数(R2)是对回归模型拟合优度的评价。,总偏差 = 回归偏差 + 剩余偏差,返回目录,2. 一元线性回归模型的显著性检验,回归系数b的检验: 1提出假设。 H0:=0;H1:0 2.确定显著性水平。 3.计算回归系数的

5、 t 值。,4.确定临界值。 双侧检验查t分布表所确定的临界值是(-t/2)和(t/2);单侧检验所确定的临界值是(t)。 5.做出判断。,返回目录,当样本量n30,用t 检验,当样本量n30,t分布接近于标准正态分布Z,所以可以用正态分布代替。,系数检验的方法选择:,返回目录,1.提出假设: H0:R2=0;H1:R20 2.计算检验统计量 3.比较做出判断,回归模型整体的F检验,返回目录,8.6 一元线性回归模型的Minitab实现,例82.某家电集团1989年至1998年10年的广告费支出与销售量的资料如下表所示:,试根据此资料确定销售量y与广告费支出x的是否存在线性关系,并进行模型分析

6、。,返回目录,结果输出:,返回目录,常见的可线性化的曲线回归方程:,返回目录,常用的非线性函数的线性变换法,下面是我们常用的4种线性变换法,分别举例进行说明,其他的非线性方程也可以以此类推,得到相应的线性形式。 1.倒数变换。 例如:双曲线模型 令 ,将其代入得 2.半对数变换。 例如:对数函数 令 ,代入得,返回目录,常用的非线性函数的线性变换法(续),3.双对数变换。 例如:幂函数 两边取对数的变换得: 令 代入得: 4.多项式变换。 如二元二次多项式 令 代入得:,返回目录,回归分析的一般程序,定性和定量分析相 结合正确选择变量,搜集(试验)统计数据,估计回归方程,检验回归方程,返回目录

7、,9.1 多元线性回归分析的基本理论,多元线性回归是简单线性回归的推广,指的是多个因变量对多个自变量的回归(Multivariate Regression),最常用的是一个因变量对多个自变量的回归。,返回目录,多元线性回归模型的性质,例,二元线性回归模型:,b2:假定x2固定时x1每变动1个单位引起的y的增量。,b3:假定x1固定时x2每变动1个单位引起的y的增量。,是x1和x2共同变动引起的y的平均 变动,反映一组自变量与因变量的平均变动关系。,是给定x1、x2计算得到的估计值,是y的实际值的数学期望。,返回目录,一.拟合程度的评价 调整可决系数 式中,n是样本容量;k是模型中回归系数的个数

8、。 调整可决系数 的特点。,9.4 多元线性回归模型的检验,返回目录,二. 多元线性回归模型的显著性检验,回归系数 b 的检验 1提出假设。 H0: j =0;H1: j0 2.确定显著水平。 3.计算回归系数的t 值。 式中, 是的标准差的估计值。 按下式计算: 式中, 是(XX)-1的第 j 个对角线元素, S2 是随机误差项方差的估计值。,返回目录,二. 多元线性回归模型的显著性检验(续一),4.确定临界值。 双侧检验查t分布表所确定的临界值是(-t/2)和(t/2);单侧检验所确定的临界值是(t)。 5.做出判断。,拒绝域,拒绝域,接受域,双侧检验图示:,返回目录,回归方程的显著性检验

9、 具体的方法步骤 回归模型方差分析表 F统计量,二. 多元线性回归模型的显著性检验(续二),返回目录,例91:在研究某超市顾客人数y与该超市促销费用x1 、超市面积x2 、超市位置x3之间关系时,选取变量如下: y某超市某一周六顾客人数(千人) x1该超市上周促销所花的费用(万元) x2该超市的面积(百平方米) x3超市所处位置(0表示市区、1表示郊区) 按照y变量排序后的原始数据是:,多元回归案例分析:,返回目录,输入数据见图,直接回归法:,返回目录,输出结果:,返回目录,若我们上面的预测方程不显著,但确实知道其中几个变量存在着一定的线性关系,我们也可以运用逐步回归的方法对变量进行分析处理

10、。,逐步回归实现:,返回目录,返回目录,SS(factor)的自由度 是,SS(error)的自由度 是,Computing Degree of Freedom 自由度的计算,One-Way ANOVA Principles One-Way ANOVA的原理,DOF of SS (total),SS(total)的自由度 是,DOF of SS (factor),DOF of SS (error),One-Way ANOVA Principles One-Way ANOVA的原理,Regression Analysis: Oxygen purity % versus Hydrocarbon %

11、 The regression equation is Oxygen purity % = 74.3 + 14.9 Hydrocarbon % Predictor Coef SE Coef T P Constant 74.283 1.593 46.62 0.000 Hydrocar 14.947 1.317 11.35 0.000 S = 1.087 R-Sq = 87.7% R-Sq(adj) = 87.1% Analysis of Variance Source DF SS MS F P Regression 1 152.13 152.13 128.86 0.000 Residual Er

12、ror 18 21.25 1.18 Total 19 173.38,Example 1A: Minitab Session Window 例1A: Minitab的对话窗口,The F - test shows that the 87.7% explained by the regression relationship is statistically significant. F测试显示测定系数87.7%,具备统计显著性,87.7% of the variability in y values is explained by the relationship to Hydrocar. 与H

13、ydrocar的关系解释了y值87.7%的变异,R2 = 1 means the regression equation provides a perfect fit for the sample data. R2 = 1表示回归等式与抽样数据完全吻合,Coefficient of Determination - R2 测定系数- R2定义,The coefficient of determination, R2 is the amount of the variation in y that is explained by the regression line. 测定系数,R2是由回归线代

14、表y中变异数量,SSR = Si (Yi - Y)2 SSE = Si (Yi - Y)2 SST = Si (Yi - Y)2 SST=SSR+SSE,Influential Observations 具有影响的数据点,Influential Observations are Observations that: 具有影响的数据点包括下列现象 1) lie outside of general patterns of the data set 在正常数据模式以外的数据 significantly influence the regression results (i.e. significa

15、ntly change the slope or y-intercept) 强烈影响回归结果的数据 (也就是显著改变斜率或y轴截取值),These observations are not necessarily bad, therefore you may not need to censor them. 这些现象并不一定是坏现象,因此你不一定要删除他们。,However, they should be identified and their impact evaluated before analyzing the regression results. 不管怎样,在分析回归结果之前应该识别这些数据点并评估其影响。,Influential Observations 具有影响的数据点,Influential Observations : Outliers 具有影响的数据现象:界外点,Outliers 界外点 Observations that have large residual values. 具有很大的残差数值的现象数据。,Influential Observations: Leverage Points 具有影响的数据现象:杠杆点,Leverage Points 杠杆点 Extreme high values in the X-

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号