变异源分析-方差分析【精制材料】

上传人:8** 文档编号:151234093 上传时间:2020-11-13 格式:PPT 页数:75 大小:3.25MB
返回 下载 相关 举报
变异源分析-方差分析【精制材料】_第1页
第1页 / 共75页
变异源分析-方差分析【精制材料】_第2页
第2页 / 共75页
变异源分析-方差分析【精制材料】_第3页
第3页 / 共75页
变异源分析-方差分析【精制材料】_第4页
第4页 / 共75页
变异源分析-方差分析【精制材料】_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《变异源分析-方差分析【精制材料】》由会员分享,可在线阅读,更多相关《变异源分析-方差分析【精制材料】(75页珍藏版)》请在金锄头文库上搜索。

1、变异源分析 -方差分析,例如: 比较各省籍(台湾、大陆、客家人)人士在收入及教育年数上的差异。 大学中各年级的同学智商是否有别? 三种不同的教学方法对于学生的成绩是否有影响?,变异源 分析的一般方法,变异源分析是指通过对过程的有关数据的统计分析,得出变异由哪几部分原因组成,并且定量给出每部分原因所产生的变异在总变异中占的比例。主要是分析问题,尚未考虑解决问题。主要统计工具就是“方差分析”和更深入的有关差分量的计算。 一般方法: 1、采用按不同因子的不同水平有计划进行分层,然后抽样,不得影响现有的生产条件; 2、对数据进行详尽的分析得到各因子在产生响应变量的变异方面的贡献率,确认减少变异的主攻方

2、向。,例如:我们关心生产的螺钉的直径的波动,到仓库随机抽取200颗,发现方差大得超出我的想象。但随机收集的数据能说明什么呢?只能说明产品性能的总体波动太大,而我们希望更进一步的信息,到底什么原因造成这么大波动,必须从不同维度有计划的分层抽样。,目 录,ANOVA(方差分析)的概念 One way ANOVA的概念 ANOVA的原理 应用MINITAB 实习 弹射器 再多想一想 简要及 附录,一、方差分析的基本思想 方差分析的基本思想借助以下例题予以说明: 例9-1 为研究煤矿粉尘作业环境对尘肺的影响,将18只大鼠随机分到甲、乙、丙3个组,每组6只,分别在地面办公楼、煤炭仓库和矿井下染尘,12周

3、后测量大鼠全肺湿重(g),数据见表92,问不同环境下大鼠全肺湿重有无差别?,从以上资料可看出,三个组的数据各不相同,这种差异(总变异)可以分解成两部分: 即 (1)组间变异:甲、乙、丙三个组大鼠全肺湿重 各不相等(此变异反映了处理因素的作用,以及随机误差的作用 ) (2)组内变异:各组内部大鼠的全肺湿重各不相等(此变异主要反映的是随机误差的作用),各部分变异的计算:,总变异(全部试验数据间大小不等)用总离均差平方和 来表示。,其中,组间变异(由于所接受的处理因素不同而致各组间大小不等)用组间离均差平方和 来表示。 各组均数 之间相差越大,它们与总均数 的差值就越大, 越大;反之, 越小。,组内

4、变异(同一处理组内部试验数据大小不等)用组内离均差平方和 来表示。,三个变异之间的关系:,其中:,离均差平方和只能反映变异的绝对大小。变异程度除与离均差平方和的大小有关外,还与其自由度有关,由于各部分自由度不相等,因此各部分离均差平方和不能直接比较,须除以相应的自由度,该比值称均方差,简称均方(MS)。 的大小就反映了各部分变异的平均大小。,方差分析就是通过比较组内均方 和组间均方 的大小关系来判断处理因素有无效应。,检验统计量:,如果各组的总体均数相等,即无处理因素的作用,则组内变异和组间变异都只反映随机误差的大小,此时组间均方 和组内均方 大小相当,即 F 值则接近1,各组均数间的差异没有

5、统计学意义;反之,如果处理有作用,则组间变异不仅包含随机误差,还有处理因素引起的变异 ( 组间变异主要反映处理因素的作用 ),此时组间均方 远大于组内均方 ,则F值远大于1,各组均数间的差异有统计学意义。故依据 F 值的大小可判断各组之间有无差别。,15,实操应用,可见,方差分析的基本思想就是根据实验设计的类型,将全部测量值总的变异分解成两个或多个部分,每个部分的变异可由某个因素的作用(或某几个因素的作用)加以解释,通过比较各部分的均方与随机误差项均方的大小,借助 F 分布来推断各研究因素对实验结果有无影响。,二、方差分析的应用条件,(1)各观测值相互独立,并且服从正态分布; (2)各组总体方

6、差相等,即方差齐性。,例如:某企业为分析研究成品车间的产品质量控制问题,对车间的5个班组产品合格率进行抽查,在每个班组独立抽取5个合格品率数据构成随机样本。,指出方差分析的因素、水平和观察值?,班组是分析的因素,不同组即水平,合格率观察值关键产品质量特性。,研究班组间的差异是随机性的还是系统性的,就是方差分析研究的内容,总变异,每一观察值与总均值的离差的平方的总和。 总变异=组内离差+组间离差 在方差分析中,假定组内差异(每一班组的方差)是随机性的,组间的差异(每一班组均值与总均值的方差)有随机性也有系统性的,也就是系统性的。 辨别方法:如果在一定显著水平下,组间不存在显著差异,在概率程度上认

7、为组间差异是随机的。如过是系统的,说明差异是影响的主要原因。 练习:,ANOVA的概念(1) - ANOVA是什么?,在什么情况下使用? 当有3个以上水平时检验均值差异. One way ANOVA 当有2个以上因子时检验均值的差异. Two, Three way ANOVA 用什么原理分析? 把所有实验结果的方差,对几个因子的方差和其他误差的方差来区分,并分析均值的差异的方法 利用“总方差 = 因子效果的方差 + 误差方差”,目的: 提供一种比较两个以上总体均值的客观方法。,X数据,有1个X变量,有多个 X 变量,Y 数据,有1个 Y 变量,有多个 Y变量,X Data,离散型,连续型,Y

8、Data,离散型,连续型,One-way ANOVA Means/ Medians Tests,X Data,离散型,连续型,Y Data,离散型,连续型,Chi-Square,Regression,Multiple Regression,Medians Tests,2, 3, 4 way.,ANOVA,ANOVA的概念(2) - 包含在哪里?,当X是离散型或连续型, Y是连续型变量时使用. 是对“均值是否相等”的检验方法,ANOVA的概念(3) 路径分析,包含3个以上水平X变量的均值比较,稳定性,分布的形态,散布(Spread),中心的位置 (Centering),ANOVA,2sample

9、 t test,1sample t test,我们要观察的一个 input 变量(因子)有多个样本时, 我们实际上在实施 单因子实验 (Single Factor Experiment). 我们要分析对象的 因子是否有水平间的差异 确定3个供应商的平均交货期是否有差异 确定某个机器的设定值在5个水平间变化时,零件的尺寸是否不同 现在开始做第一次实验! 观察.,One way ANOVA的概念(1) 概要,ANOVA的原理 (1) 总变动,因子A的水平是I个,各水平的反复数都是m次,则数据矩阵 排列成下面的样子,总均值 是用右边的公式求.,利用各个DATA 和总均值 把总均值 分解为两个, 同下

10、表示. 左边和右边平方时同下.,ANOVA的原理 (2) 总变动,上面的第三项变为如下.,SS(total) SS(error) SS(factor),同样第8页式从写如下,这意义的略写SS(Sum of Squares)来表示.,ANOVA的原理 (3) 总变动,SS(total)的自由度 是,SS(factor)的自由度 是,SS(error)的自由度 是,因此,ANOVA的原理 (4) 自由度,在一个系统中不影响其他变量能够独立移动的数 Ex) a*b*c = 4 这式中变量的自由度是 2 . 假如 a,b定为 1,2, c必须是 2 . 即能够自然的移动的变量。,自由度是?,自由度的计

11、算,ANOVA的原理 (5) 方差分析表,方差分析表的制作,对错误的均值平方因子,利用A的均值平方的大小 观察 A效果的大小. F越大 A效果越大. ( 利用F 分布确认 P-value),ANOVA的原理 (6) F分布,F分布的参考,自由度 k1,k2的变量的 F值的 F(k1,k2:)按 的大小 占有面积(发生概率).,(显著水平),F(k1,k2),F(k1,k2: ),F-分布,6,5,4,3,2,1,0,0,.,7,0,.,6,0,.,5,0,.,4,0,.,3,0,.,2,0,.,1,0,.,0,S,c,o,r,e,s,P,r,o,b,10%,1%,5%,Exercise,某个

12、coating 工程认为 反应温度对生产的 产品的强度有影响, 所以对反应温度变化强度有什么变化, 还有温度在什么水平时强度最好,进行了实验. 反应温度设为因子水平,各温度反复3回,总共12回实验数据随机整理. 这结果同下表. 制作方差分析表(ANOVA table) . (参考Excel sheet.),ANOVA的原理 (7) 例题,ANOVA table,ANOVA的原理 (8) 例题,F分布表中 F是(3,8:0.05) = 4.07, F(3,8:0.01)=7.59 . 那么 A是显著水平 1%中是否采用零假设? 还是推翻? - 要推翻.,检验三组大鼠全肺湿重的总体均数是否相同。

13、解: () 建立假设,并确定检验水准。 H0: H1:不等或不全相等,ANOVA的原理 (8) 例题,() 计算F 值,表9-2 三组大鼠的全肺湿重(g),本例 , , 以上计算结果代入方差分析表,并求出相应的MS 及F 值:,方差分析表,() 查F 界值表,确定P 值并作结论。 由附表 5 查得F0.05(2,15)=3.68,F= 4.70 F0.05(2,15),故P0.05,按 =0.05水准拒绝H0,接受H1,差别有统计学意义,可认为不同粉尘环境影响大鼠的全肺湿重。 当g =2时,方差分析的结果与两样本均数比较的 t 检验等价,且有 。,ANOVA的原理 (9) 统计的假定,输出的总

14、体方差在给定因子所有水平上都相等(方差均一性 Test for Equal Variance )。 我们可以用统计 方差分析 等方差检验程序来检验这个假设。 响应均值是独立的,并服从正态分布。 - 如果使用随机化和适当的样本数,这个假设一般有效。 - 警告:在化学过程中,均值相关的风险很高,应永远考虑随机化。 残差(数学模型的误差)是独立的,其分布是均值=0,方差为恒量的正态分布。,单一因子实验分析,实验结果移动到 MINITAB Worksheet. 数据有没有异常点利用管理图进行确认. (稳定性分析) 利用统计 方差分析 等方差检验程序进行等方差检验. 方差同一时实施(p-value 方差

15、分析 单因子方差分析 进行分析 . 所有的数据在1列时 (Stacked) : One-way 按水平别数据分几列时(Unstacked) :采用 One-way(Unstacked.) . 解释F-ratio. F-value 高 p-value 显著水平时(一般 5-10%) 推翻零假设(Ho) . 推翻零假设时, 利用统计 方差分析主效应图 或统计 方差分析区间图对均值差异利用区间图说明. 利用Minitab 的 Anova 视窗中的 残差项目(残差 Plot) 对残差实施评价. 为测试实际的显著性,对有影响的 Epsilon-Squared 进行计算. 根据分析结果找出方案.,应用MINITAB分析(1) 分析顺序,零假设 (Ho): 3名作业者刷漆厚度相同. 备择假设(Ha): 作业者中至少有一名刷的厚度与其他作业者刷的厚度不同(或大或小).,应用MINITAB分析(1)老板的思考,是谁刷漆刷的这么厚? Bob? Jane? Walt? 一定要查找出来! (显著水平设为 5%),设置假设,按照下列样式在Minitab中输入数据,打开ANOVA.MPJ的 (3 Level ANOVA )worksheet,BobJaneWalt 25.836425.455328.2005 24.306925.197427.6520 24.905227.662727.5087 24.992

展开阅读全文
相关资源
相关搜索

当前位置:首页 > IT计算机/网络 > 行业软件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号