第九章 方差分析及回归分析

上传人:s9****2 文档编号:569976249 上传时间:2024-08-01 格式:PPT 页数:93 大小:2.09MB
返回 下载 相关 举报
第九章 方差分析及回归分析_第1页
第1页 / 共93页
第九章 方差分析及回归分析_第2页
第2页 / 共93页
第九章 方差分析及回归分析_第3页
第3页 / 共93页
第九章 方差分析及回归分析_第4页
第4页 / 共93页
第九章 方差分析及回归分析_第5页
第5页 / 共93页
点击查看更多>>
资源描述

《第九章 方差分析及回归分析》由会员分享,可在线阅读,更多相关《第九章 方差分析及回归分析(93页珍藏版)》请在金锄头文库上搜索。

1、2024/8/11第九章第九章 方差分析及回归分析方差分析及回归分析1 单因素试验的方差分析单因素试验的方差分析(一)单因素试验(一)单因素试验 在科学试验和生产实践中,影响一事物的因素很多。在科学试验和生产实践中,影响一事物的因素很多。 方差分析是根据试验的结果进行分析,鉴别方差分析是根据试验的结果进行分析,鉴别各个有关因素对试验结果影响的有效方法。各个有关因素对试验结果影响的有效方法。 在试验中,我们将要考察的指标称为在试验中,我们将要考察的指标称为试验指标试验指标。影响试验。影响试验指标的条件称为指标的条件称为因素因素。因素可分为两类,一类是人们可以。因素可分为两类,一类是人们可以控制的

2、(可控因素);一类是人们不可控制的。以下我们控制的(可控因素);一类是人们不可控制的。以下我们所说的因素都是指可控因素。因素所处的状态,称为该因所说的因素都是指可控因素。因素所处的状态,称为该因素的素的水平水平。如果在一项试验中只有一个因素在改变时称为。如果在一项试验中只有一个因素在改变时称为单因素试验单因素试验。如果多于一个因素在改变称为。如果多于一个因素在改变称为多因素试验多因素试验。2024/8/12例例1 设有三台机器,用于生产规格相同的铝设有三台机器,用于生产规格相同的铝合金薄板。取样,测量薄板的厚度精确至千合金薄板。取样,测量薄板的厚度精确至千分之一厘米。得结果如下表所示。分之一厘

3、米。得结果如下表所示。机器机器1 机器机器2 机器机器30.236 0.257 0.2580.238 0.253 0.2640.248 0.255 0.2590.245 0.254 0.2670.243 0.261 0.262这里,试验的指标是薄板的厚度。机器为因素,不同的这里,试验的指标是薄板的厚度。机器为因素,不同的三台机器就是这个因素的三个不同的水平。我们假定除三台机器就是这个因素的三个不同的水平。我们假定除机器这一因素外,材料的规格、操作人员的水平等其他机器这一因素外,材料的规格、操作人员的水平等其他条件都相同。这就是单因素试验。试验的目的是为了考条件都相同。这就是单因素试验。试验的目

4、的是为了考察各台机器所生产的薄板的厚度有无显著的差异。察各台机器所生产的薄板的厚度有无显著的差异。铝合金板的厚度铝合金板的厚度2024/8/13例例2 下面列出了随机选取的、用于计算器的下面列出了随机选取的、用于计算器的四种类型的电路的响应时间(以毫秒计)。四种类型的电路的响应时间(以毫秒计)。类型类型1 类型类型2 类型类型3 类型类型41915 20 40 16 17 1822 21 15 2220 33 18 1918 27 26电路的响应时间电路的响应时间这里,试验的指标是电路的响应时间。电路类这里,试验的指标是电路的响应时间。电路类型为因素,这一因素有四个水平。这是一个单型为因素,这

5、一因素有四个水平。这是一个单因素的试验。试验的目的是为了考察各种类型因素的试验。试验的目的是为了考察各种类型电路的响应时间有无显著性差异。电路的响应时间有无显著性差异。2024/8/14例例3 三三名名工工人人分分别别在在四四种种不不同同的的机机器器上上生生产产同同一一种种零零件件,每人在每台机器上工作每人在每台机器上工作3天,其日产量如下表所示:天,其日产量如下表所示:工人工人(B)B1B2B3机机器器(A)A115,15,1719,19,1616,18,21A217,17,1718,15,1519,22,22A315,17,1618,17,1618,18,18A418,20,2215,16

6、,1717,17,172024/8/15 这里试验指标是零件的日产量,工人和机器这里试验指标是零件的日产量,工人和机器是因素,它们分别有是因素,它们分别有3个、个、4个水平。这是一个双个水平。这是一个双因素试验。试验目的在于考察不同工人在不同机因素试验。试验目的在于考察不同工人在不同机器上生产零件的日产量有无显著差异。器上生产零件的日产量有无显著差异。 本节先讨论单因素试验的方差分析。本节先讨论单因素试验的方差分析。 2024/8/161、对变量因素的某一个水平,第、对变量因素的某一个水平,第 个水平进个水平进行试验,得到的观察结果行试验,得到的观察结果 看作是从看作是从正态总体正态总体 中取

7、出的一个容中取出的一个容量为量为 的样本,且的样本,且 均未知均未知 。(二)方差检验的基本前提:(二)方差检验的基本前提:2024/8/17设因素设因素A有有r个水平个水平A1,A2,Ar,在每个水平,在每个水平Ai(i=1,2,r)下,进行下,进行ni (ni2)次独立试验,整理试验结果如下表所示。次独立试验,整理试验结果如下表所示。 试验结果结果试试 验验 批批 号号样本样本和和样本均样本均值值1 2 j ni因因素素水水平平其中其中Xij表示在水平表示在水平Ai下进行第下进行第j次试验的结果次试验的结果(j=1,2,ni,i=1,2,r)。 2024/8/18(1.1)2024/8/1

8、9(三)统计假设(三)统计假设(1.2)2024/8/1102024/8/1112024/8/112(四)检验方法(四)检验方法2024/8/113因为因为所以所以2024/8/114若记若记2024/8/1152024/8/1162024/8/1172024/8/1182024/8/119单因素试验方差分析表单因素试验方差分析表方差来源方差来源平方和平方和自由度自由度 均方均方F比比因素因素A误差误差总和总和r-1n-rn-12024/8/1202024/8/1212024/8/122例例4 设在例设在例1中符合模型(中符合模型(1.1)条件,)条件,检验假设(检验假设( =0.05):20

9、24/8/123方差来源方差来源平方和平方和自由度自由度均方均方F比比因因 素素误误 差差0.001053330.0001922120.000526670.00001632.92总总 和和0.0012453314例例1的的 方差分析表方差分析表2024/8/124(五)未知参数的估计(五)未知参数的估计2024/8/1252024/8/1262024/8/127(一)双因素等重复试验的方差分析(一)双因素等重复试验的方差分析2 双因素试验的方差分析双因素试验的方差分析2024/8/1282024/8/1292024/8/130此时,此时,2024/8/131对于这一模型要检验以下三个假设202

10、4/8/1322024/8/133双因素试验的方差分析表双因素试验的方差分析表方差来源 平方和 自由度均方F 比因素A误差总和s-1(r-1)(s-1)rst-1因素Br-1rs(t-1)交互作用2024/8/134记记2024/8/1352024/8/136例例5 5 在某种金属材料的生产过程中,对热处理温度在某种金属材料的生产过程中,对热处理温度(因素(因素B)与时间(因素)与时间(因素A)各取两个水平,产品强)各取两个水平,产品强度的测定结果(相对值)如下表所示。在同一条件下度的测定结果(相对值)如下表所示。在同一条件下每个实验重复两次。设各水平搭配下强度的总体服从每个实验重复两次。设各

11、水平搭配下强度的总体服从正态分布且方差相同。各样本独立。问热处理温度、正态分布且方差相同。各样本独立。问热处理温度、时间以及这两者的交互作用对产品强度是否有显著的时间以及这两者的交互作用对产品强度是否有显著的影响(取影响(取 =0.05)?)?ABA1A2B2B1Ti.T.j.38.038.6(76.6)45.043.8(88.8)47.044.8(91.8)42.440.8(83.2)168.4172165.4175340.42024/8/1372024/8/138得方差分析表如下:得方差分析表如下:方差来源方差来源 平方和平方和 自由度自由度均方均方F 比比因素因素A误差误差总和总和1 7

12、因素因素B1AB1.6211.5254.084.671. 82141.6211.5254.081.152024/8/1392024/8/140(二)双因素无重复试验的方差分析(二)双因素无重复试验的方差分析如果两个因素不存在交互作用,或者交互如果两个因素不存在交互作用,或者交互作用对试验的指标影响很小,则可以不考作用对试验的指标影响很小,则可以不考虑交互作用。虑交互作用。 因素因素B B1 B2 Bs因素因素A A1 X11 X12 X1s A2 X21 X22 X2s Ar Xr1 Xr2 Xrs 2024/8/141此时,需要检验的假设有:此时,需要检验的假设有:2024/8/142可得方

13、差分析表如下:可得方差分析表如下:方差来源方差来源 平方和平方和 自由度自由度均方均方F 比比因素因素A误差误差总和总和s-1rs-1因素因素Br-1(r-1)(s-1)2024/8/143表中平方和的计算如下:表中平方和的计算如下:2024/8/1442024/8/145例例6 6 为了解为了解3种不同配比的饲料对仔猪生长种不同配比的饲料对仔猪生长影响的差异,对影响的差异,对3种不同品种的猪各选种不同品种的猪各选3头头进行试验,分别测得其进行试验,分别测得其3个月间体重增加量个月间体重增加量如下表:如下表:饲料饲料品种品种A1A2A3B1B3B2TjTi5153521565657581714

14、54947141152159157T=4682024/8/146 假定其体重增长量服从正态分布,且假定其体重增长量服从正态分布,且各种配合的方差相等。试分析不同饲料与各种配合的方差相等。试分析不同饲料与不同品种对猪生长有无显著影响。不同品种对猪生长有无显著影响。2024/8/1472024/8/148列出方差分析表列出方差分析表方差来源方差来源 平方和平方和 自由度自由度均方均方F 比比因素因素A误差误差总和总和28因素因素B242024/8/1492024/8/150 前面讨论的方差分析是考察因素对试验指标前面讨论的方差分析是考察因素对试验指标影响的显著性,而在有些问题中还需要了解指标影响的

15、显著性,而在有些问题中还需要了解指标随因素改变的变化规律,也就是寻找指标与因素随因素改变的变化规律,也就是寻找指标与因素之间的定量表达式。之间的定量表达式。 在现实世界中,我们常常会遇到多个变量在现实世界中,我们常常会遇到多个变量同处于一个过程之中,它们之间存在着相互联同处于一个过程之中,它们之间存在着相互联系,相互制约的关系。系,相互制约的关系。3 一元线性回归一元线性回归2024/8/151 回归分析就是寻找这类具有不完全确定关系的回归分析就是寻找这类具有不完全确定关系的变量间的数学关系式并进行统计推断的方法。变量间的数学关系式并进行统计推断的方法。 (2) 统计关系或称相关关系统计关系或

16、称相关关系, 即变量之间虽然存在着种种即变量之间虽然存在着种种关系,但从一个关系,但从一个(或一组或一组)变量的每一确定值,却不能求变量的每一确定值,却不能求出另一变量的值。出另一变量的值。: (1)确定性关系确定性关系,即高等数学中所学过的函数关系。例如,即高等数学中所学过的函数关系。例如电压电压V,电阻,电阻R与电流强度与电流强度I之间有关系式:之间有关系式:V=IR,圆的,圆的面积面积S与圆的半径与圆的半径R之间有关系之间有关系S = 等等。等等。例如人们的身高例如人们的身高X与体重与体重Y之间关系,某种商品的销售量之间关系,某种商品的销售量Y与商品的价格与商品的价格X之间的关系,某种农

17、作物的产量与施肥量、之间的关系,某种农作物的产量与施肥量、气候、农药之间的关系等等。其特点是它们之间的关系是气候、农药之间的关系等等。其特点是它们之间的关系是不能用一个确定的函数关系表达出来。不能用一个确定的函数关系表达出来。 两类关系两类关系2024/8/152 设随机变量设随机变量y与与x之间存在着相关关系,这里,之间存在着相关关系,这里,x是可控是可控变量,如身高、价格、温度等,可以将变量,如身高、价格、温度等,可以将x看成一个普通变量看成一个普通变量而不是一个随机变量。而不是一个随机变量。 由于由于y与与x之间不存在完全确定的函数关系,因此必须之间不存在完全确定的函数关系,因此必须把随

18、机波动产生的影响考虑在内。也就是说把随机波动产生的影响考虑在内。也就是说y可以看作两可以看作两部分叠加而成,一部分是随部分叠加而成,一部分是随 x的变化而变化,记为的变化而变化,记为f(x),另一部分是由随机因素引起的,记为另一部分是由随机因素引起的,记为 其中其中f (x)随随x而确定,是而确定,是x的普通函数,故又称的普通函数,故又称回归函数回归函数。 1、回归模型、回归模型2024/8/1532024/8/1542. 定义定义为了研究y与x之间的关系,进行n次独立试验,实测数据对为: 。 其中, 是可控变量x的一个指定值, 是当 时随机变量 y的对应实测值。讨论时,一般是将实测数据在坐标

19、系中画出散点图讨论时,一般是将实测数据在坐标系中画出散点图2024/8/1552024/8/1562024/8/1572024/8/158例例1 以家庭为单位,为研究某商品的价格以家庭为单位,为研究某商品的价格(元元)对商对商品的需求量品的需求量(kg)的影响,现测得一组数据如下:的影响,现测得一组数据如下: 价格价格xi(元元)1222.32.52.62.833.33.5需求量需求量yi(kg)53.532.72.42.521.51.21.2试求试求y关于关于x的线性回归方程。的线性回归方程。 解解: 作散点图,从这作散点图,从这10对数据的散点图可以看出,所有的散对数据的散点图可以看出,所

20、有的散点大致分布在一条直线附近。故可用线性回归方程求解。点大致分布在一条直线附近。故可用线性回归方程求解。设设y对对x的回归方程为:的回归方程为: 2024/8/1592024/8/160序号12345678910xi1222.32.52.62.833.33.525yi53.532.72.42.521.51.21.225xiyi5766.2166.55.64.53.964.254.97xi21445.296.256.767.84910.89 12.25 67.28yi22512.2597.295.766.2542.251.441.4474.682024/8/161于是,所求的回归方程为于是,所

21、求的回归方程为2024/8/1622024/8/163(四)回归系数的假设检验(四)回归系数的假设检验2024/8/1642024/8/1652024/8/166例例2 在显著性水平在显著性水平 下,检验例下,检验例1得到的得到的线性回归方程的显著性。线性回归方程的显著性。 解解 沿用例沿用例1 1的结果的结果 因此因此2024/8/167值值得得注注意意的的是是,当当我我们们检检验验后后,接接受受H0:b=0时时,即即认认为为y对对x的的线线性性关关系系不不显显著著时时,并并不不意意味味着着y与与x就就不不相相关关。事事实实上,线性回归效果不显著可能有如下上,线性回归效果不显著可能有如下几种

22、情形几种情形:(1) 影响影响y取值的,除了取值的,除了x外,还有其它不可忽略的因素;外,还有其它不可忽略的因素;(2) y与与x的关系不是线性的,但存在着其他相关关系;的关系不是线性的,但存在着其他相关关系;(3) y与与x确实不存在相关关系。确实不存在相关关系。因此,需要作进一步的分析、研究。因此,需要作进一步的分析、研究。2024/8/1682024/8/1692024/8/1702024/8/1712024/8/1722024/8/173挂物的重量挂物的重量xi(牛牛) 弹簧的长度弹簧的长度yi(厘米厘米)50 100 150 200 250 3007.25 8.12 8.95 9.9

23、0 10.9 11.82024/8/1742024/8/1752024/8/1762024/8/1772024/8/178(八)可化为一元线性回归的例子(八)可化为一元线性回归的例子2024/8/1792024/8/1802024/8/1814 多元线性回归多元线性回归2024/8/1822024/8/1832024/8/1842024/8/1852024/8/1862024/8/1872024/8/188 x 20 25 30 35 40 50 60 65 70 75 80 90 y 1.81 1.70 1.65 1.55 1.48 1.40 1.30 1.26 1.24 1.21 1.20 1.18散点图如下:散点图如下:1.21.31.41.51.61.71.81.920 30 40 50 60 70 80 902024/8/189求回归方程:求回归方程:2024/8/190现在:现在:2024/8/191经计算经计算2024/8/192即得正规方程组的解为即得正规方程组的解为:2024/8/193于是,得到回归方程为:于是,得到回归方程为:为了考察这种假定模型是否符合实际观察结为了考察这种假定模型是否符合实际观察结果,还需要进行以下的假设检验:果,还需要进行以下的假设检验:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号