北京科技大学-质量控制与管理课件第4章-方差分析

上传人:F****n 文档编号:88030947 上传时间:2019-04-17 格式:PPT 页数:42 大小:977KB
返回 下载 相关 举报
北京科技大学-质量控制与管理课件第4章-方差分析_第1页
第1页 / 共42页
北京科技大学-质量控制与管理课件第4章-方差分析_第2页
第2页 / 共42页
北京科技大学-质量控制与管理课件第4章-方差分析_第3页
第3页 / 共42页
北京科技大学-质量控制与管理课件第4章-方差分析_第4页
第4页 / 共42页
北京科技大学-质量控制与管理课件第4章-方差分析_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《北京科技大学-质量控制与管理课件第4章-方差分析》由会员分享,可在线阅读,更多相关《北京科技大学-质量控制与管理课件第4章-方差分析(42页珍藏版)》请在金锄头文库上搜索。

1、第4章 方差分析(ANOVA),主要内容,4.1 方差分析引论 4.2 单因素方差分析 4.3 方差分析中的多重比较 4.4 双因素方差分析,一、方差分析及其有关术语 二、方差分析的基本思想和原理 三、方差分析的基本假定 四、问题的一般提法,方差分析(ANOVA),什么是方差分析,检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等 研究自变量对数值型因变量的影响 有单因素方差分析和双因素方差分析 单因素方差分析:涉及一个分类的自变量 双因素方差分析:涉及两个分类的自变量,什么是方差分析,【例】为了对几个行业的服务质量进行评价,消费者协会在四个行业分别抽取了不同的企业作为样本。最

2、近一年中消费者对总共23家企业投诉的次数如下表,什么是方差分析?,分析四个行业之间的服务质量是否有显著差异,也就是要判断“行业”对“投诉次数”是否有显著影响 作出这种判断最终被归结为检验这四个行业被投诉次数的均值是否相等 如果它们的均值相等,就意味着“行业”对投诉次数是没有影响的,即它们之间的服务质量没有显著差异;如果均值不全相等,则意味着“行业”对投诉次数是有影响的,它们之间的服务质量有显著差异,方差分析中的有关术语,因素或因子(factor or treatment) 所要检验的对象 要分析行业对投诉次数是否有影响,行业是要检验的因素或因子 水平或处理 因子的不同表现 零售业、旅游业、航空

3、公司、家电制造业就是因子的水平 观察值 在每个因素水平下得到的样本值 每个行业被投诉的次数就是观察值,方差分析中的有关术语,试验 这里只涉及一个因素,因此称为单因素四水平的试验 总体 因素的每一个水平可以看作是一个总体 比如零售业、旅游业、航空公司、家电制造业可以看作是四个总体 样本数据 被投诉次数可以看作是从这四个总体中抽取的样本数据,比较两类误差,以检验均值是否相等 比较的基础是方差比 如果系统(处理)误差明显地不同于随机误差,则均值就是不相等的;反之,均值就是相等的 误差是由各部分的误差占总误差的比例来测度的,方差分析的基本思想和原理,方差分析的基本思想和原理 (两类误差),随机误差 因

4、素的同一水平(总体)下,样本各观察值之间的差异 这种差异可以看成是随机因素的影响,称为随机误差 系统误差 因素的不同水平(不同总体)下,各观察值之间的差异 这种差异可能是由于抽样的随机性所造成的,也可能是由系统性因素造成的,称为系统误差,方差分析的基本思想和原理 (两类方差),数据的误差用平方和表示,称为方差 组内方差 因素的同一水平(同一个总体)下样本数据的方差 组内方差只包含随机误差 组间方差 因素的不同水平(不同总体)下各样本之间的方差 组间方差既包括随机误差,也包括系统误差,方差分析的基本假定,每个总体都应服从正态分布 对于因素的每一个水平,其观察值是来自服从正态分布总体的简单随机样本

5、 各个总体的方差必须相同 (方差齐次性, Homogeneity of variance) 各组观察数据是从具有相同方差的总体中抽取的 观察值是独立同分布的 (independent identical distribution, iid),问题的一般提法, 如果原假设成立,即H0: m1 = m2 = m3 = m4 四个样本均值都相等 意味着每个样本都来自均值为、差为2的同一正态总体,X,f(X),1 2 3 4,问题的一般提法,若备择假设成立,即H1: mi (i=1,2,3,4)不全相等 至少有一个总体的均值是不同的 四个样本分别来自均值不同的四个正态总体,4.2 单因素方差分析,一、

6、数据结构 二、分析步骤,单因素方差分析的数据结构,分析步骤提出假设,一般提法 H0 : m1 = m2 = mk 自变量对因变量没有显著影响 H1 : m1 ,m2 , ,mk不全相等 自变量对因变量有显著影响 注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等,分析步骤构造检验的统计量 (计算水平的均值),假定从第i个总体中抽取一个容量为ni的简单随机样本,第i个总体的样本均值为该样本的全部观察值总和除以观察值的个数 计算公式为,式中: ni为第 i 个总体的样本观察值个数 xij 为第 i 个总体的第 j 个观察值,分析步骤构造检验的统计量 (计算全部观察值的

7、总均值),全部观察值的总和除以观察值的总个数 计算公式为,分析步骤构造检验的统计量 (计算误差平方和 ),总误差平方和 SST 水平项平方和 SSA 误差项平方和 SSE 三个平方和的关系,SST = SSA + SSE,分析步骤构造检验的统计量 (计算均方MS),各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差 计算方法是用误差平方和除以相应的自由度 三个平方和对应的自由度分别是 SST 的自由度为n-1,其中n为全部观察值的个数 SSA的自由度为k-1,其中k为因素水平(总体)的个数 SSE 的自由度为n-k,分析步骤构造检

8、验的统计量 (计算均方 MS),组间方差:SSA的均方,记为MSA,计算公式为,组内方差:SSE的均方,记为MSE,计算公式为,分析步骤构造检验的统计量 (计算检验统计量 F ),将MSA和MSE进行对比,即得到所需要的检验统计量F 当H0为真时,二者的比值服从分子自由度为k-1、分母自由度为 n-k 的 F 分布,即,分析步骤构造检验的统计量 (F分布与拒绝域),如果均值相等,F=MSA/MSE1,统计决策,将统计量的值F与给定的显著性水平的临界值F进行比较,作出对原假设H0的决策 根据给定的显著性水平,在F分布表中查找与第一自由度df1k-1、第二自由度df2=n-k 相应的临界值 F 若

9、FF ,则拒绝原假设H0 ,表明均值之间的差异是显著的,所检验的因素对观察值有显著影响 若FF ,则不能拒绝原假设H0 ,表明所检验的因素对观察值没有显著影响,单因素方差分析表 (例题:男女头围差异),4.3 双因素方差分析,一、双因素方差分析及其类型 二、无交互作用的双因素方差分析 三、有交互作用的双因素方差分析,双因素方差分析,分析两个因素(行因素Row和列因素Column)对试验结果的影响 如果两个因素对试验结果的影响是相互独立的,分别判断行因素和列因素对试验数据的影响,这时的双因素方差分析称为无交互作用的双因素方差分析或无重复双因素方差分析(Two-factor without rep

10、lication) 如果除了行因素和列因素对试验数据的单独影响外,两个因素的搭配还会对结果产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析或可重复双因素方差分析 (Two-factor with replication ),双因素方差分析的基本假定,每个总体都服从正态分布 对于因素的每一个水平,其观察值是来自正态分布总体的简单随机样本 各个总体的方差必须相同 对于各组观察数据,是从具有相同方差的总体中抽取的 观察值是独立的,数据结构,数据结构,行因素的第i个水平下各观察值的平均值,列因素的第j个水平下的各观察值的均值,全部 kr 个样本数据的总平均值,分析步骤(提出假设),

11、提出假设 对行因素提出的假设为 H0: m1 = m2 = = mi = = mk (mi为第i个水平的均值) H1: mi (i =1,2, , k) 不全相等 对列因素提出的假设为 H0: m1 = m2 = = mj = = mr (mj为第j个水平的均值) H1: mj (j =1,2,r) 不全相等,分析步骤(构造检验的统计量),计算平方和(SS) 总误差平方和 行因素误差平方和 列因素误差平方和 随机误差项平方和,分析步骤(构造检验的统计量),总离差平方和(SST )、水平项离差平方和 (SSR和SSC) 、误差项离差平方和(SSE) 之间的关系,SST = SSR +SSC+SS

12、E,分析步骤(构造检验的统计量),计算均方(MS) 误差平方和除以相应的自由度 三个平方和的自由度分别是 总离差平方和SST的自由度为 kr-1 行因素的离差平方和SSR的自由度为 k-1 列因素的离差平方和SSC的自由度为 r-1 随机误差平方和SSE的自由度为 (k-1)(r-1),分析步骤(构造检验的统计量),计算均方(MS) 行因素的均方,记为MSR,计算公式为 列因素的均方,记为MSC ,计算公式为 随机误差项的均方,记为MSE ,计算公式为,分析步骤(构造检验的统计量),计算检验统计量(F) 检验行因素的统计量 检验列因素的统计量,分析步骤统计决策,将统计量的值F与给定的显著性水平

13、的临界值F进行比较,作出对原假设H0的决策 根据给定的显著性水平在F分布表中查找相应的临界值 F 若FRF ,则拒绝原假设H0 ,表明均值之间的差异是显著的,即所检验的行因素对观察值有显著影响 若FC F ,则拒绝原假设H0 ,表明均值之间有显著差异,即所检验的列因素对观察值有显著影响,双因素方差分析表 (基本结构),有交互作用的双因素方差分析 (方差分析表的结构),有交互作用的双因素方差分析 (平方和的计算),设: 为对应于行因素的第i个水平和列因素的第j个 水平的第l行的观察值 为行因素的第i个水平的样本均值 为列因素的第j个水平的样本均值 对应于行因素的第i个水平和列因素的第j个水平组合的样本均值 为全部n个观察值的总均值,有交互作用的双因素方差分析 (平方和的计算),总平方和: 行变量平方和: 列变量平方和: 交互作用平方和: 误差项平方和:,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号