第九章方差分析与实验设计

上传人:人*** 文档编号:592226693 上传时间:2024-09-20 格式:PPT 页数:52 大小:1.02MB
返回 下载 相关 举报
第九章方差分析与实验设计_第1页
第1页 / 共52页
第九章方差分析与实验设计_第2页
第2页 / 共52页
第九章方差分析与实验设计_第3页
第3页 / 共52页
第九章方差分析与实验设计_第4页
第4页 / 共52页
第九章方差分析与实验设计_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第九章方差分析与实验设计》由会员分享,可在线阅读,更多相关《第九章方差分析与实验设计(52页珍藏版)》请在金锄头文库上搜索。

1、第九章第九章 方差分析与实验设计方差分析与实验设计9.4 实验设计初步实验设计初步 9.2 单因素方差分析单因素方差分析9.3 双因素方差分析双因素方差分析 9.1 方差分析引论方差分析引论 9.1 方差分析引论方差分析引论 一、方差分析及其有关术语一、方差分析及其有关术语 方差分析(方差分析(analysis of variance ,ANOVA)analysis of variance ,ANOVA) ; ; 通过检验各总体均值是否相等来判断分类型自通过检验各总体均值是否相等来判断分类型自 变量对数值型因变量是否有显著影响。变量对数值型因变量是否有显著影响。【例例】:为了对几个行业的服务质

2、量进行评价,消费者协会在零为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空公司、家电制造业分别抽取了不同售业、旅游业、航空公司、家电制造业分别抽取了不同的企业作为样本,每个行业中抽取的这些企业,假定他的企业作为样本,每个行业中抽取的这些企业,假定他们在服务对象、服务内容、企业规模等方面基本上是相们在服务对象、服务内容、企业规模等方面基本上是相同的。然后统计处最近一年消费者对总共同的。然后统计处最近一年消费者对总共2323家企业投诉家企业投诉的次数,结果如表的次数,结果如表10-110-1表表9-1 消费者对四个行业的投诉次数消费者对四个行业的投诉次数问题:四个行业之间服务质量

3、是否有显著性差异问题:四个行业之间服务质量是否有显著性差异因素因素(或因子或因子factor):检验对象检验对象水平(或处理水平(或处理treatment):因素的不同表现。):因素的不同表现。单因素方差分析:一个因素即一个分类型变量,单因素方差分析:一个因素即一个分类型变量, 一个数值型因变量一个数值型因变量 。二、方差分析的基本思想和原理二、方差分析的基本思想和原理1、图形描述、图形描述2、误差分解、误差分解总误差总误差(SST)组内误差组内误差(SSE)组间误差组间误差(SSA)3、误差分析、误差分析三、方差分析中的基本假定三、方差分析中的基本假定1、每个总体都服从正态分布;、每个总体都

4、服从正态分布;2、各个总体的方差必须相同;、各个总体的方差必须相同;3、观测值是独立的。、观测值是独立的。1.1.在在上上述述假假定定条条件件下下,判判断断行行业业对对投投诉诉次次数数是是否否有有显显著著影影响响,实实际际上上也也就就是是检检验验具具有有同同方方差差的的四个正态总体的均值是否相等四个正态总体的均值是否相等2.2.如如果果四四个个总总体体的的均均值值相相等等,可可以以期期望望四四个个样样本本的均值也会很接近的均值也会很接近四四四四个个个个样样样样本本本本的的的的均均均均值值值值越越越越接接接接近近近近,推推推推断断断断四四四四个个个个总总总总体体体体均均均均值值值值相相相相等等等

5、等的证据也就越充分的证据也就越充分的证据也就越充分的证据也就越充分样样样样本本本本均均均均值值值值越越越越不不不不同同同同,推推推推断断断断总总总总体体体体均均均均值值值值不不不不同同同同的的的的证证证证据据据据就就就就越越越越充分充分充分充分 n n 如果原假设成立,即如果原假设成立,即如果原假设成立,即如果原假设成立,即HH0 0: : 1 1 = = 2 2 = = 3 3 = = 4 4 四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等四个行业被投诉次数的均值都相等 意味着意味着意味着意味着每个样本都来自均值为每个样本都来自均值为每个样本都来自

6、均值为每个样本都来自均值为、差为、差为、差为、差为 2 2的同一正的同一正的同一正的同一正态总体态总体态总体态总体 X X Xf(X)f(X)f(X) 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 n n若备择假设成立,即若备择假设成立,即若备择假设成立,即若备择假设成立,即HH1 1: : i i ( (i i=1=1,2 2,3 3,4)4)不不不不全相等全相等全相等全相等 至少有一个总体的均值是不同的至少有一个总体的均值是不同的至少有一个总体的均值是不同的至少有一个总体的均值是不同的 四个样本分别来自均值不同的四个正态总体四个样本分别来自均值不同的四个正态总体四个样本分

7、别来自均值不同的四个正态总体四个样本分别来自均值不同的四个正态总体 X X Xf(X)f(X)f(X) 3 3 3 3 1 1 1 1 2 2 2 2 4 4 4 4 1.1.设设设设因因因因素素素素有有有有k k个个个个水水水水平平平平,每每每每个个个个水水水水平平平平的的的的均均均均值值值值分分分分别别别别用用用用 1 1、 2 2、 k k 表示表示表示表示2.2.要要要要检检检检验验验验k k个个个个水水水水平平平平( (总总总总体体体体) )的的的的均均均均值值值值是是是是否否否否相相相相等等等等,需需需需要要要要提提提提出出出出如如如如下假设:下假设:下假设:下假设: HH0 0:

8、 : 1 1 2 2 k k HH1 1: : 1 1 , , 2 2 , , , k k 不全相等不全相等不全相等不全相等3.3.设设设设 1 1为为为为零零零零售售售售业业业业被被被被投投投投诉诉诉诉次次次次数数数数的的的的均均均均值值值值, 2 2为为为为旅旅旅旅游游游游业业业业被被被被投投投投诉诉诉诉次次次次数数数数的的的的均均均均值值值值, 3 3为为为为航航航航空空空空公公公公司司司司被被被被投投投投诉诉诉诉次次次次数数数数的的的的均均均均值值值值, 4 4为为为为家电制造业家电制造业家电制造业家电制造业被投诉次数的均值被投诉次数的均值被投诉次数的均值被投诉次数的均值,提出的假设为

9、提出的假设为提出的假设为提出的假设为 HH0 0: : 1 1 2 2 3 3 4 4 HH1 1: : 1 1 , , 2 2 , , 3 3 , , 4 4 不全相等不全相等不全相等不全相等四、问题的一般提法四、问题的一般提法9.2 单因素方差分析单因素方差分析 (one-way analysis of variance) 一、数据结构一、数据结构表表9-2单因素方差分析的数据结构单因素方差分析的数据结构二、分析步骤二、分析步骤1、提出假设、提出假设自变量对因变量没有显著性影响自变量对因变量没有显著性影响不全相等,自变量对因变量有显著影响不全相等,自变量对因变量有显著影响2、构造检验的统计

10、量、构造检验的统计量(1)计算各样本均值)计算各样本均值 对表对表9-1中数据计算各行业均值中数据计算各行业均值(2)、计算全部观测值的总均值)、计算全部观测值的总均值(3) 计算各误差平方和计算各误差平方和总平方和:总平方和:组组间间间间平平方方和和组组内内平平方方和和零售业:零售业:旅游业:旅游业:航空公司:航空公司:家电制造业:家电制造业:SSE=700+924 +434+650 =2708于是:于是:ST=SSE+SSA(4)计算统计量)计算统计量SSTSST的自由度为的自由度为n-1n-1;SSASSA的自由度为的自由度为k-1k-1;SSESSE的自由度为的自由度为n-kn-k。各

11、平方和自由度的比值称为均方(各平方和自由度的比值称为均方(mean square): 3、统计决策、统计决策拒绝域拒绝域拒绝原假设,表明确有显著性差异;拒绝原假设,表明确有显著性差异; 接受原假设,表明差异不显著。接受原假设,表明差异不显著。4、方差分析表、方差分析表表表9-4方差分析表的一般形式方差分析表的一般形式表表9-5 四个行业被投诉次数的方差分析表四个行业被投诉次数的方差分析表5、用、用Excel进行方差分析进行方差分析第第1步:选择步:选择【工具工具】下拉菜单,并选择下拉菜单,并选择【数据分析数据分析】选项,选项,第第2步:在分析工具中选择步:在分析工具中选择【单因素方差分析单因素

12、方差分析】,然后单击,然后单击 【确定确定】 ,第第3步:当对话框出现时,步:当对话框出现时, 在在【输入区域输入区域】方框内输入数据单元格区域方框内输入数据单元格区域A3:D9。 在在【a】方框内输入方框内输入0.05(可根据需要确定。(可根据需要确定。 在在【输出选项输出选项】中选择优输出区域。中选择优输出区域。结果如图结果如图9-6图图9-6 用用XExcel 进行方差分析的步骤进行方差分析的步骤表表9-6 Excel输出的方差分析结果输出的方差分析结果三、关系强度的测量三、关系强度的测量当组间方差不为当组间方差不为0时就意味着变量之间有关系,特别的当时就意味着变量之间有关系,特别的当S

13、SA大于大于SSe时,而且达到一定程度,就意味着两个变量时,而且达到一定程度,就意味着两个变量之间的关系显著,大得越多他们之间的关系就越强。之间的关系显著,大得越多他们之间的关系就越强。关系强度(判定系数):关系强度(判定系数):前例中的数据:前例中的数据:四、方差分析中的多重比较四、方差分析中的多重比较 (multiple comparison procedures ) 费希尔最小显著差异方法费希尔最小显著差异方法(least significant difference): 第第1步:提出假设:步:提出假设:第第2步:计算检验统计量:步:计算检验统计量:第第3步:计算步:计算LSD:第第4

14、步:根据显著性水平做出决策,如果步:根据显著性水平做出决策,如果则拒绝原假设,否则接受原假设。则拒绝原假设,否则接受原假设。例例10.2。根据表。根据表9-6种输出结果,对四个行业均值多重种输出结果,对四个行业均值多重 比较(比较(a=0.05)解:解:第第1步,提出如下假设:步,提出如下假设:检验检验1:检验检验4:检验检验3:检验检验6:检验检验5:检验检验2:第第2步步 计算检验统计量计算检验统计量第第3步步 计算计算LSD检验检验1:检验检验2:检验检验3:检验检验4:检验检验5:检验检验6:第第4步:作出决策步:作出决策接受原假设,不能认为零售业与旅游接受原假设,不能认为零售业与旅游

15、业的投诉次数之间有显著性差异;业的投诉次数之间有显著性差异;接受原假设,不能认为零售业与航空公司接受原假设,不能认为零售业与航空公司的投诉次数之间有显著性差异;的投诉次数之间有显著性差异;接受原假设,不能认为零售业与家电制接受原假设,不能认为零售业与家电制造业的投诉次数之间有显著性差异;造业的投诉次数之间有显著性差异;接受原假设,不能认为旅游业与航空公接受原假设,不能认为旅游业与航空公司的投诉次数之间有显著性差异;司的投诉次数之间有显著性差异;接受原假设,不能认为旅游业与家电制造接受原假设,不能认为旅游业与家电制造业的投诉次数之间有显著性差异;业的投诉次数之间有显著性差异;拒绝原假设,航空公司

16、与家电制造业的拒绝原假设,航空公司与家电制造业的投诉次数之间有显著性差异。投诉次数之间有显著性差异。9.3 双因素方差分析双因素方差分析(two-two-wayanalysiswayanalysis of variance) of variance) 一、双因素方差分析及其类型一、双因素方差分析及其类型例例9.3 9.3 有四个品牌的彩电在有四个品牌的彩电在5 5个地区销售,为分析彩个地区销售,为分析彩电的品牌(电的品牌(“品牌品牌”因素)和销售地区(因素)和销售地区(“地区地区”因素)因素)对销售的影响,组队每个品牌在各地区的销售量取得对销售的影响,组队每个品牌在各地区的销售量取得以下数据以

17、下数据9 9(单位:台)如表(单位:台)如表10-710-7所示。试分析品牌所示。试分析品牌和销售地区对彩电销售量是否有显著性影响(和销售地区对彩电销售量是否有显著性影响(a=0.05a=0.05)表表9-7 4个品牌的彩电在个品牌的彩电在5个地区的销售数据个地区的销售数据无重复双因素方差分析无重复双因素方差分析(two-factor without replication) ,无交互作用无交互作用(interaction)的双因素方差分析:的双因素方差分析: 两个因素相互独立,如本例中的两个因素相互独立,如本例中的“地区地区”和和“品品牌牌”可重复双因素方差分析可重复双因素方差分析(two-

18、factor witht replication) , 两个因素之间相互作用可对数值变量产生影响。两个因素之间相互作用可对数值变量产生影响。二、无交互作用的双因素方差分析二、无交互作用的双因素方差分析1、数据结构、数据结构表表9-8 双因素方差分析的数据结构双因素方差分析的数据结构二、分析步骤二、分析步骤1、提出假设、提出假设行因素提出假设:行因素提出假设:行因素对因变量没有显著性影响行因素对因变量没有显著性影响不全相等,行因素对因变量有显著影响不全相等,行因素对因变量有显著影响列因素提出假设:列因素提出假设:列因素对因变量没有显著性影响列因素对因变量没有显著性影响不全相等,列因素对因变量有显

19、著影响不全相等,列因素对因变量有显著影响2、构造检验统计量、构造检验统计量行因素产生误差平方和:行因素产生误差平方和:列因素产生误差平方和:列因素产生误差平方和:随机误差平方和:随机误差平方和:计算均方计算均方行因素均方:行因素均方:列因素均方:列因素均方:随机误差均方:随机误差均方:行因素检验统计量:行因素检验统计量:列因素检验统计量:列因素检验统计量:(3) 统计决策统计决策若若,则拒绝原假设,表明行因素,则拒绝原假设,表明行因素之间差异显著,即行因素对观测值有显著性影响。之间差异显著,即行因素对观测值有显著性影响。若若,则拒绝原假设,表明列因素,则拒绝原假设,表明列因素之间差异显著,即行

20、因素对观测值有显著性影响。之间差异显著,即行因素对观测值有显著性影响。表表9-9 双因素方差分析表双因素方差分析表例例9.4.根据例根据例9.3种数据,分析品牌和地区对销售种数据,分析品牌和地区对销售 量是否有显著性影响量是否有显著性影响解:解:结结果果分分析析 根据计算可知,可因素及品牌对销售量有显著性根据计算可知,可因素及品牌对销售量有显著性影响,而列因素及地区因素对销售量得影响不显著。影响,而列因素及地区因素对销售量得影响不显著。3、关系强度的测定、关系强度的测定多重判定系数:多重判定系数:上例中:上例中:表明品牌因素和地区因素总共揭示了销售量差异的表明品牌因素和地区因素总共揭示了销售量

21、差异的83.94%,其他,其他因素之揭示了销售量差异的因素之揭示了销售量差异的16.06%,而,而R=0.916 2,表明品牌和,表明品牌和地区两个因素和起来与销售量之间有较强的关系。地区两个因素和起来与销售量之间有较强的关系。表表9-11 品牌与销售量的单因素方差分析表品牌与销售量的单因素方差分析表表表9-11 地区与销售量的单因素方差分析表地区与销售量的单因素方差分析表三、有交互作用的双因素方差分析三、有交互作用的双因素方差分析【例例9.5 】城市道路交通管理部本为研究不同路段和不同时间段对行城市道路交通管理部本为研究不同路段和不同时间段对行车时间的影响,让一名交通警察分别在两个路段的高峰

22、期车时间的影响,让一名交通警察分别在两个路段的高峰期与非高峰期亲自轿车进行试验,通过试验共获得与非高峰期亲自轿车进行试验,通过试验共获得2020个行车个行车时间(单位:分钟)的数据,如表时间(单位:分钟)的数据,如表10-1310-13所示。试分析路段、所示。试分析路段、时段、及路段和时段的交互作用对行车时间的影响时段、及路段和时段的交互作用对行车时间的影响(a=0.05a=0.05)表表9-13表表9-14 有交互作用的双因素方差分析表的结构有交互作用的双因素方差分析表的结构总平方和:总平方和:行变量平方和:行变量平方和:列变量平方和:列变量平方和:交互作用平方和:交互作用平方和:各平方满足

23、:各平方满足:Excel步骤:步骤:第第1步:选择步:选择【工具工具】下拉菜单,并选择下拉菜单,并选择【数据分析数据分析】选项,选项,第第2步:在分析工具中选择步:在分析工具中选择【方差分析:可重复双因素方方差分析:可重复双因素方差分析差分析】,然后单击,然后单击【确定确定】 ,第第3步:当对话框出现时,步:当对话框出现时, 在在【输入区域输入区域】方框内输入数据单元格区域方框内输入数据单元格区域A1:C11。 在在【a】方框内输入方框内输入0.05(可根据需要确定。(可根据需要确定。 在在【每一样本的行数每一样本的行数】内输入内输入5。 在在【输出选项输出选项】中选择优输出区域。中选择优输出

24、区域。结果如图结果如图9-7表表9-15 EXcel输出的有交互作用的双因素方差分析结果输出的有交互作用的双因素方差分析结果10.4 实验设计初步实验设计初步试验试验(experiment) :收集样本数据的过程收集样本数据的过程实验设计实验设计(experiment design):收集样本数据收集样本数据的计划,通过科学安排实验,以便用尽可能少的的计划,通过科学安排实验,以便用尽可能少的实验获得尽可能多的信息。实验获得尽可能多的信息。一、完全随机化设计一、完全随机化设计(completely randomized design) 将将k种种“处理处理”随机指派给随机指派给“试验单元试验单元

25、”的设计。的设计。 【例例9.6】一家种业开发公司研究出三个小麦品种,品种一家种业开发公司研究出三个小麦品种,品种1、品种、品种2、品种品种3。公司需要分析不同品种对产量的影响。为此需要。公司需要分析不同品种对产量的影响。为此需要选择一些地块,在每一个地块上种上不同的品种,然后获选择一些地块,在每一个地块上种上不同的品种,然后获得差量数据,进而分析小麦品种对产量的影响是否显著,得差量数据,进而分析小麦品种对产量的影响是否显著,这一过程就是实验设计的过程。这一过程就是实验设计的过程。完全随机化除要求完全随机化除要求“随机化随机化”外,还要求外,还要求“可重复性可重复性”,即可即可“复制复制”。表

26、表9-16 3个小麦品种在个小麦品种在12个地块上的产量数据个地块上的产量数据表表9-17 3个小麦品种的方案分析结果个小麦品种的方案分析结果由由P值小于显著性水平可知小麦品种对产量有显著性影响,值小于显著性水平可知小麦品种对产量有显著性影响,R2=2186/3354=65.18% ,表明品种因素解释了产量差,表明品种因素解释了产量差异的异的65.18%二、随机化区组设计二、随机化区组设计(randomized block design)分组后再将每个分组后再将每个“处理处理”随即指派给每个区组的设计就是随机化随即指派给每个区组的设计就是随机化 区组设计。区组设计。表表9-18 3个小麦品种在个小麦品种在4个区组上的产量数据个区组上的产量数据表表9-18 三个品种小麦在三个品种小麦在4个区组上的产量数据个区组上的产量数据小麦品种对产量影响显著小麦品种对产量影响显著三、因子设计三、因子设计(factorial design)表表9-20 小麦品种与施肥方式的因子实验的数据小麦品种与施肥方式的因子实验的数据表表9-21 小麦品种与施肥方式因子实验的方差分析表小麦品种与施肥方式因子实验的方差分析表

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号