一元方差分析

上传人:博****1 文档编号:578567072 上传时间:2024-08-24 格式:PPT 页数:50 大小:1.42MB
返回 下载 相关 举报
一元方差分析_第1页
第1页 / 共50页
一元方差分析_第2页
第2页 / 共50页
一元方差分析_第3页
第3页 / 共50页
一元方差分析_第4页
第4页 / 共50页
一元方差分析_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《一元方差分析》由会员分享,可在线阅读,更多相关《一元方差分析(50页珍藏版)》请在金锄头文库上搜索。

1、二、二元方差分析二、二元方差分析 一一 、一元方差分析、一元方差分析 第六章方差分析方差分析二、统计分析二、统计分析一一 、总平方和的分解、总平方和的分解第一节第一节单因素试验的方差分析 例1 假定某型号的电子管的使用寿命服从正态分布,并且原料差异只影响平均寿命,不影响方差 。现用三种不同来源的材料各试生产了一批电子管。从每批中各抽取若干只做寿命实验,得数据如下表。试问测试结果是否说明这批电子管的寿命有明显差异?材料批号寿命测定值 (单位:小时)1231600 1610 1650 1680 1700 1700 18001580 1640 1640 1700 17501460 1550 1600

2、 1620 1640 1660 1740 18201.引例引例三个水平因素试验指标例例2 2 设对设对四种玉米品种四种玉米品种进行对比实验,每个品进行对比实验,每个品种都在同一块田的五个小区各做一次实验,实种都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的平验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?均产量是否有显著影响?品种品种产量(斤产量(斤/小区)小区)32.3 34.0 34.3 35.0 36.5 33.3 33.0 36.3 36.8 34.530.8 34.3 35.3 32.3 35.8 29.3 26.0 29.8 28.0 29

3、.8水平因素试验指标设在试验中,因素A有m个不同水平在水平下的试验结果其中 和 是未知参数。在水平 下作 次独立实验,其结果如表1所示。123子样均值 容量样本水平2. 数学模型表1 是来自总体 的容量为 的 一个 样本,其观察值为 (1)由于 相互独立,且若记则且相互独立 要判断因素的各水平间是否有显著差异,也就是要 判断各正态总体的均值是否相等,即检验假设(2)其中 与 均为未知参数。式(2)称为单因素方差分析的数学模型。(3)再令(5)则是各水平下总体均值的加权平均,称为总平均值; 代表了第i水平下的总体均值与平均值的差异,这个差异称为 的效应,(4)由式(2),(3)可以得到单因素方差

4、分析的等价数学模型它满足式式(5)表明:样本由表明:样本由总平均值总平均值 因素的因素的水平效应水平效应 随机误差随机误差三部分叠加而成。三部分叠加而成。因而式因而式(5)也称为也称为线性可加模型线性可加模型。(5)由于当 为真时,=各水平的效应=统计假设模型(1)等价于(6)基本任务:根据样本提供的信息,对假设 (6)进行检验,并估计未知参数检验此假设的方法就是方差分析检验此假设的方法就是方差分析3. 3. 总离差平方和的分解总离差平方和的分解: :样本总平均样本总平均通过分解,构造统计量组内平均(7)(8)两者间的关系称为称为总离差平方和总离差平方和。引入记号引入记号(10)总离差平方和分

5、解总离差平方和分解全部数据与总平均之全部数据与总平均之间的差异,又叫总变差间的差异,又叫总变差其中其中为各为各水平下的样本与该水平下样本均值的离差平方和,水平下的样本与该水平下样本均值的离差平方和,反映了各水平下样本值的随机波动情况,称为反映了各水平下样本值的随机波动情况,称为组内平组内平方和。方和。它是由试验的随机误差引起的,故又称它是由试验的随机误差引起的,故又称误差平方和。误差平方和。为各水平下的样本均值与样本为各水平下的样本均值与样本总总均值的(加权)均值的(加权)离差平方和,反映了各水平间的样本值的差异,离差平方和,反映了各水平间的样本值的差异,称为称为组间平方和。组间平方和。形成它

6、的主要原因是因素形成它的主要原因是因素A的各水平下的不同的各水平下的不同效应,故又称为效应,故又称为效应平方和。效应平方和。常见统计量常见统计量1 1、样本均值、样本均值2 2、样本方差、样本方差设设是是来自总体来自总体X的一个样本,的一个样本,常用来估计常用来估计EX. 复习复习结论:设为来自总体结论:设为来自总体 的一个样本,的一个样本,4. 4. S SE E,S SA A的统计特性的统计特性的统计特性的统计特性故故(12)(13)记(14)(15)的的均方均方的均方的均方4. 4. S SE E,S SA A的统计特性的统计特性的统计特性的统计特性(14)(15)(14)(14)及及(

7、15)(15)两式表明:两式表明:是是 的无偏估计的无偏估计,仅当仅当成立时才是成立时才是 的无偏估计,的无偏估计,否则它的期望值要大于否则它的期望值要大于在在 成立时应接近于成立时应接近于1 1,而当而当 H1成立时总有偏大的倾向成立时总有偏大的倾向。如果比值如果比值比比1大得大得多,就应拒绝假设多,就应拒绝假设为此,我们采用为此,我们采用(16)作为作为检验统计量。检验统计量。当 成立时,与相互独立,且分别服从自由度相互独立,且分别服从自由度(n-m),(m-1)的的 分布,故分布,故复习:复习:F 分布分布的分位点的分位点 对于给定的正数对于给定的正数称称满足条件满足条件的点的点为为分位

8、点分位点分布分布的上的上对给定的显著性水平 ,由得检验问题(1.1)或(1.6)的拒绝域为(17)上述分析的结果可排列成表2的形式称为方差分析表方差来源方差来源误差误差E因素因素A总和总和均方均方自由度自由度平方和平方和显著性显著性F比比在实际计算时,通常使用下列公式在实际计算时,通常使用下列公式其中其中例例1 1设对设对四种玉米品种四种玉米品种进行对比实验,每个品种进行对比实验,每个品种都在同一块田的五个小区各做一次实验,实都在同一块田的五个小区各做一次实验,实验结果如下表所示。试问不同品种对玉米的验结果如下表所示。试问不同品种对玉米的平均产量是否有显著影响?平均产量是否有显著影响?(=0.

9、01)品种品种产量(斤产量(斤/小区)小区)32.3 34.0 34.3 35.0 36.5 33.3 33.0 36.3 36.8 34.530.8 34.3 35.3 32.3 35.8 29.3 26.0 29.8 28.0 29.8解解 分别以分别以 表示不同品种玉米平均表示不同品种玉米平均产量总体的均值,按题意需检验假设产量总体的均值,按题意需检验假设品种地块产量1 32.3 33.3 30.8 29.3 172.1 173.9 168.5 141.9 656.45 36.5 34.5 35.8 28.84 35.0 36.8 32.3 28.03 34.3 36.3 35.3 29

10、.82 34.0 33.0 34.3 26.0 5923.682 6048.242 5678.45 4027.122 21677.5029618.41 30241.21 28392.25 20135.61 5933.03 6060.07 5696.15 4035.97 21725.22注意到注意到可得可得方差分析表方差分析表方差分析表方差分析表方差来源方差来源误差误差E因素因素A总和总和均均 方方自由度自由度平方和平方和显著性显著性F 比比当当 时,时,由由F分布表可查得分布表可查得由于由于故故拒绝拒绝即即认为认为这四个这四个品种对玉米平均产量的影响高度显著。品种对玉米平均产量的影响高度显著。

11、31916若检验结果为原假设若检验结果为原假设H H0 0不成立,不成立,有时需要对有时需要对则 的置信度为1 的置信区间为由由上面讨论,可得未知参数上面讨论,可得未知参数的的估计估计是是 的无偏估计的无偏估计。5.5.未知参数的估计未知参数的估计 如果检验结果为拒绝如果检验结果为拒绝 ,即即不全相等。不全相等。 有时需要对第有时需要对第i个水平及第个水平及第k个水平均个水平均值差值差 作出区间估计。作出区间估计。 为此,我们可以取为此,我们可以取作为作为 的点估计的点估计,注意到注意到又又是是 的无偏估计,的无偏估计,而而可以证明可以证明 与与 相互独立。相互独立。的的置信度为置信度为 的置

12、信区间为的置信区间为 求求例例2中未知参数中未知参数 的点估计及均的点估计及均值差的置信度为值差的置信度为0.95的区间估计。的区间估计。解解 的的点点估计为估计为 及及 的无偏估计分别为的无偏估计分别为例例2当 时, 的的置信度为置信度为0.95的置信的置信区间分别为区间分别为 因素因素A分分3个水平,对每个水平进行个水平,对每个水平进行4次试验,次试验,结果如下表:结果如下表:1 38 20 21 试验号试验号2 36 24 22 3 35 26 31 4 31 30 34 因因 素素 水水 平平假定样本都是从假定样本都是从同方差的正态总体同方差的正态总体中抽取的。中抽取的。 (1)在显著

13、性水平)在显著性水平 下,检验假设下,检验假设组组均值相等均值相等。 (2)求未知参数)求未知参数及的点的点估计以及均值差的置信区间(置信度为估计以及均值差的置信区间(置信度为95%)例例3解解(1)用下表进行计算)用下表进行计算1 38 1444 20 400 21 414 试验号试验号2 36 1296 24 576 22 484 3 35 1225 26 676 31 9614 31 961 30 900 34 1156因因 素素 水水 平平 4926 2552 3042 140 100 108 19600 10000 11664 4900 2500 2916 方差分析表方差分析表方差来

14、源因素误差总和 224 3-1=2 112 4.94 204 13-3=9 22.67 428 12-1=11 均方自由度平方和 比查表得查表得拒绝拒绝即在显著性水平下,可以认为组平即在显著性水平下,可以认为组平均值在整体上是有显著差异的。均值在整体上是有显著差异的。(2)查表查表的置信度为的置信度为95%的置信区间分别为的置信区间分别为 一共进行了一共进行了13次试验,假设样本都是从同次试验,假设样本都是从同方差的正态总体中抽取的,试验结果如下表:方差的正态总体中抽取的,试验结果如下表: 1 2 3 4 5 6试验号因素水平 37 47 40 60 60 86 67 92 95 98 69

15、100 98 (1)在显著性水平)在显著性水平 下检验假设下检验假设(2)求)求 及及 的点估计及均值的点估计及均值差的差的95%置信区间。置信区间。例例4解解用下表进行计算,得用下表进行计算,得试验号因 素 水 平 8778 42578 42365 184 498 267 8464 41334 23763 1 37 1369 60 3600 69 4761 2 47 2209 86 7396 100 10000 3 40 1600 67 4489 98 96044 60 3600 92 8464 34 11565 95 90256 98 9604方差分析表方差分析表方差来源因素误差总和 4284 2 2142 9.9167 2160 10 216 6444 12均方自由度平方和比(1)查表得)查表得拒绝拒绝在显著性水平下,在显著性水平下,可以认为可以认为3个水平下的期望有显著差异。个水平下的期望有显著差异。(2)又由由得得的置信区间为的置信区间为即即 (67.1, 7.1)。由由可得可得的置信区间为的置信区间为即即 (78.6, 7.4)。由由可得可得的置信区间为的置信区间为即即 (38.9,26.9)。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号