统计培训教材之方差分析

上传人:F****n 文档编号:97074855 上传时间:2019-09-01 格式:PPT 页数:52 大小:1.76MB
返回 下载 相关 举报
统计培训教材之方差分析_第1页
第1页 / 共52页
统计培训教材之方差分析_第2页
第2页 / 共52页
统计培训教材之方差分析_第3页
第3页 / 共52页
统计培训教材之方差分析_第4页
第4页 / 共52页
统计培训教材之方差分析_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《统计培训教材之方差分析》由会员分享,可在线阅读,更多相关《统计培训教材之方差分析(52页珍藏版)》请在金锄头文库上搜索。

1、方差分析 (ANOVA),主要内容,变异 方差分析 假设检验 假设 模型 ANOVA 模型 单因子方差分析(One-Way ANOVA) 双因子方差分析(Two-Way ANOVA) 多因子方差分析(Multi-Factor ANOVA),变异的类型,固有变异 由许多不可避免的小因素累积而成的变异 通常也叫噪声( noise) 特殊变异 a) 不适当地调教机器 b) 操作错误 c) 原材料有缺陷,方差分析(ANOVA),方差分析 (ANOVA) 是 R.A. Fisher 在进行农业试验时发展起来的对实验数据的变异性进行分析的一套统计方法。 方差分析做法:通过试验,以观察某一种或多种因素的变化

2、,对试验结果的观察数值是否有显著影响,从而选取最优方案。 例:在化工生产中,影响结果的因素有:配方、设备、温度、压力、催化剂、操作人员等。需要通过观察或试验判断哪些因素是重要的,有显著影响的,哪些因素是不重要的,没有显著影响的。,方差分析(ANOVA),试验中考虑的因素只有一个,即只有一个因素在变,其他因素保持不变,这种试验称为单因素方差分析 (One-Way ANOVA)。 试验中考虑的因素有两个,这种试验称为双因素方差分析(Two-Way ANOVA)。 试验中考虑的因素有 k 个,这种试验称为 k 因素方差分析(k-Way ANOVA)。,ANOVA 的应用,因素所处的状态,称为水平(L

3、evel)。例如,温度是一个因素,可在50, 60, 70三个水平下做试验。 ANOVA 可用于 估计每个变异来源对总变异的贡献。 明确各效应的显著性 估计过程中的随机误差或噪声 计算方差的成份,ANOVA 假设检验,H0 : 1 = 2 = = r 所有总体均值相等 H1 : 至少有两个总体的均值不等 ANOVA 通过比较组间差和组内差来进行F-检验: 如果 ,则拒绝原假设。 .,ANOVA 假设检验,N(1,1),N(2,2),N(3,3),N(4,4),N(groups,between),ANOVA 假设,观察值相互独立. 各水平的数据服从正态分布,即 因子水平 i N(i,i) 各水平

4、的方差相同,即 1 = 2 = = r,ANOVA 模型,固定效应模型 (ANOVA I) 因子水平是指定的 相关结论只能对指定的因子水平而言 随机效应模型 (ANOVA II) 因子水平是随机抽取的 结论对整个处理总体有效 混合效应模型 (ANOVA III) 有些因子是固定的,有些因子是随机的,ANOVA 模型,一个 kWay ANOVA 模型,是指试验中包含有k 个因素. kWay ANOVA I : k 个因素; 所有因素效应固定 kWay ANOVA II : k 个因素; 所有因素效应随机 kWay ANOVA III : k 个因素; 有些因素效应固定,有些 因素效应随机 注意:

5、当 k 大于等于 2 时,还要考虑各因素之间的相互作用(或交互效应)(Interaction).,我们要观察的一个 input 变量(因子)有多个样本时, 我们实际上在实施 单因子实验 (Single Factor Experiment). 我们要分析对象的 因子是否有水平间的差异 确定3个供应商的平均交货期是否有差异 确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同 现在开始做第一次实验! 观察.,One way ANOVA的概念(1) 概要,One ANOVA的概念(2) 例题,考虑如下情景:一个产品开发工程师要研究某个电阻焊接系统中5种不同的电流设置对焊接强度的影响 她要研究的

6、电流范围为15-19安培。她将调查5个水平的输入变量(因子): 15A, 16A, 17A, 18A 和 19A。她将对每个水平进行5次实验 输出: 焊接强度 输入: 电流 这是一个具有5个水平的单因子实验(电流) 该实验的结果参考下页., ? ?,One ANOVA的概念(3) 例题,存在电流对焊接强度的影响吗?,对于这个设备使用哪个电流,你的结论是什么?为什么?,输入结果DATA的 design matrix同下. 实习: 打开窗口 Mont52.mtw 制作各列数据的 dotplot . 使用对所有变量相同的格式 (SCALE)!,One ANOVA的概念(3) 例题,各均值的 95%

7、置信区间(CI)如下. DATA Stack 后 StatANOVAInterval Plot,对电流和焊接强度的关系做什么结论? 这结论的置信度是怎样?,One way ANOVA的概念(3) 例题,设定假设!,One ANOVA的概念(4) 假设,Ha: 至少有一个水平产生不同过程,H0: 数据只描述一个过程的自然散布,你认为答案是什么?为什么?,One ANOVA的概念(5) 假设,此设计的数学模型是:,Ho 假设处理项是零,数学模型假设,常规假设,Yti = +t+ti 其中: yti=来自处理t的单个响应 =总平均值 t=处理t ti=随机误差,One ANOVA的概念(6) 变量选

8、定,输入变量作为一个因子。 在单因子设计中,因子被当作特征变量处理,即使它可能是间隔值或比率。 如果因子自然为连续型的,可以把它分类成子群。 - 例如,我可以采用低和高来度量生产线的压力值。 - 我们可以作中值分离(Median Split)来把因子分成两个水平:低和高。 - 对于我们的例子,因为电流是连续型变量,我们把它分成5个等级。 输出一般以间隔值或比率范围来度量(合格率,温度,电压,等等)输出变量可以是分离型或间隔/比率变量,ANOVA的原理 (1) 总变动,因子A的水平是I个,各水平的反复数都是m次,则数据矩阵 排列成下面的样子,总均值 是用右边的公式求.,利用各个DATA 和总均值

9、 把总均值 分解为两个, 同下表示. 左边和右边平方时同下.,ANOVA的原理 (2) 总变动,上面的第三项变为如下.,SS(total) SS(error) SS(factor),同样第8页式从写如下,这意义的略写SS(Sum of Squares)来表示.,ANOVA的原理 (3) 总变动,SS(total)的自由度 是,SS(factor)的自由度 是,SS(error)的自由度 是,因此,ANOVA的原理 (4) 自由度,在一个系统中不影响其他变量能够独立移动的数 Ex) a*b*c = 4 这式中变量的自由度是 2 . 假如 a,b定为 1,2, c必须是 2 . 即能够自然的移动的

10、变量。,自由度是?,自由度的计算,ANOVA的原理 (5) 方差分析表,方差分析表的制作,对错误的均值平方因子,利用A的均值平方的大小 观察 A效果的大小. F越大 A效果越大. ( 利用F 分布确认 P-value),ANOVA的原理 (6) F分布,F分布的参考,自由度 k1,k2的变量的 F值的 F(k1,k2:)按 的大小 占有面积(发生概率).,(显著水平),F(k1,k2),F(k1,k2: ),F-分布,6,5,4,3,2,1,0,0,.,7,0,.,6,0,.,5,0,.,4,0,.,3,0,.,2,0,.,1,0,.,0,S,c,o,r,e,s,P,r,o,b,10%,1%,

11、5%,Exercise,某个 coating 工程认为 反应温度对生产的 产品的强度有影响, 所以对反应温度变化强度有什么变化, 还有温度在什么水平时强度最好,进行了实验. 反应温度设为因子水平,各温度反复3回,总共12回实验数据随机整理. 这结果同下表. 制作方差分析表(ANOVA table) . (参考Excel sheet.),ANOVA的原理 (7) 例题,ANOVA table,ANOVA的原理 (8) 例题,F分布表中 F是(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 . 那么 A是显著水平 1%中是否采用零假设? 还是推翻? - 要推翻.,ANOVA的

12、原理 (9) 统计的假定,输出的总体方差在给定因子所有水平上都相等(方差均一性( Test for Equal Variance )。 我们可以用Stat ANOVA Test for Equal Variance程序来检验这个假设。 响应均值是独立的,并服从正态分布。 - 如果使用随机化和适当的样本数,这个假设一般有效。 - 警告:在化学过程中,均值相关的风险很高,应永远考虑随机化。 残差(数学模型的误差)是独立的,其分布是均值=0,方差为恒量的正态分布。,单一因子实验分析,实验结果移动到 MINITAB Worksheet. 数据有没有异常点利用管理图进行确认. (稳定性分析) 利用Sta

13、tANOVATest for Equal Variance 进行等方差检验. 方差同一时实施(p-value ANOVAOne-way 进行分析 . 所有的数据在1列时 (Stacked) : One-way 按水平别数据分几列时(Unstacked) :采用 One-way(Unstacked) . 解释F-ratio. F-value 高 p-value 显著水平时(一般 5-10%) 推翻零假设(Ho) . 推翻零假设时, 利用StatANOVAMain Effects Plot 或StatANOVAInterval Plot 对均值差异利用区间图说明. 利用Minitab 的 Anov

14、a 视窗中的 残差项目(残差 Plot) 对残差实施评价. 为测试实际的显著性,对有影响的 Epsilon-Squared 进行计算. 根据分析结果找出方案.,应用MINITAB分析(1) 分析顺序,零假设 (Ho): 3名作业者刷漆厚度相同. 备择假设(Ha): 作业者中至少有一名刷的厚度与其他作业者刷的厚度不同(或大或小).,应用MINITAB分析(1) 老板的思考,是谁刷漆刷的这么厚? Bob? Jane? Walt? 一定要查找出来! (显著水平设为 5%),设置假设,按照下列样式在Minitab中输入数据,打开ANOVA.MPJ的 (3 Level ANOVA )worksheet,

15、Bob Jane Walt 25.2969 26.0056 28.4268 26.0578 25.9400 27.5085 24.0700 26.0063 27.5825 24.8199 26.4356 27.4018 25.9851 25.9927 24.9209 .,应用MINITAB分析(2) 输入数据,1、判信,2、判量,参考MSA章节,参考抽样与样本大小章节,应用MINITAB分析(3) 稳定性分析,目的:确认各水平数据中是否有异常现象(逃逸点、不随机等). 路径:Stat- Control Chart(参考下图),3、判异,应用MINITAB分析(3) 稳定性分析,输出结果,结论 各水平中的数据没发现有异常点, 可继续往后分析,应用MINITAB分析(4) 正态性分析,目的:确认各水平数据是否服从正态分布. 路径:Stat- Basic Statistics - Normality Test(参考下图),4、判形,应用MINITAB分析(4) 正态性分析,输出结果,结论 各水平中的数据都服从正态分布, 可继续往后分析,应用MINITAB分析(5) 等方差

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号