《2方差分析(轻化版)wyf》由会员分享,可在线阅读,更多相关《2方差分析(轻化版)wyf(50页珍藏版)》请在金锄头文库上搜索。
1、第第 一一 章章 方方 差差 分分 析析授课老师:王授课老师:王 一一 非非 15901786915 15901786915 QQ:46478797 QQ:46478797 上海应用技术学院上海应用技术学院香料香精技术与工程学院香料香精技术与工程学院计算机在轻化专业中的应用计算机在轻化专业中的应用1单因素方差分析单因素方差分析多因素方差分析多因素方差分析研究生产条件的改变对产品的质量和产量有无显著影响研究生产条件的改变对产品的质量和产量有无显著影响显著作用的因素在什么时候对生产起最好的影响显著作用的因素在什么时候对生产起最好的影响2单因素方差分析 在一项试验中,若只有一个因素的水平在改变,而
2、其他因在一项试验中,若只有一个因素的水平在改变,而其他因素的水平固定不变,试验的目的在于比较因素各水平上指标值素的水平固定不变,试验的目的在于比较因素各水平上指标值之间的差别,这就叫做之间的差别,这就叫做单因素试验单因素试验问题。问题。3离差(偏差):对试验进行多次测量得到的一组数据,由于受到各种因素的离差(偏差):对试验进行多次测量得到的一组数据,由于受到各种因素的影响,各个测量值通常都参差不齐,它们之间的差异称为偏差。影响,各个测量值通常都参差不齐,它们之间的差异称为偏差。偏差平方和公式偏差平方和公式偏差平方和表示每个试验数据与其平均值的偏离程度的一个总的度量,它的偏差平方和表示每个试验数
3、据与其平均值的偏离程度的一个总的度量,它的数值越大,表示测量值之间的差异越大。数值越大,表示测量值之间的差异越大。 优点优点能充分利用测试数据所提供的信息能充分利用测试数据所提供的信息 缺点缺点随着测量数目的增多而增大随着测量数目的增多而增大为了克服这一缺点,用为了克服这一缺点,用方差方差来表征偏差的大小来表征偏差的大小, ,公式为公式为 V=S/fV=S/ff f为自由度为自由度,独立的偏差数目,独立的偏差数目,样本所包含的数据个数减去受约束的条件数样本所包含的数据个数减去受约束的条件数 方差优点方差优点充分利用测试数据所提供的信息充分利用测试数据所提供的信息 避免对测量数目的依赖性避免对测
4、量数目的依赖性单因素方差分析4单因素方差分析设因素设因素A有有m个水平个水平A1, A2,Am,对水平,对水平Ai(i=1,2,m)重复做重复做r次试验,得到试验指标的观察值次试验,得到试验指标的观察值5单因素方差分析SA表示在表示在Ai水平下的试验数据平均值和总平均值之间的差水平下的试验数据平均值和总平均值之间的差异,叫因素异,叫因素A偏差平方和,它主要是由偏差平方和,它主要是由试验条件改变引起试验条件改变引起的。如果因素的。如果因素A水平的改变对试验指标没有影响,则所有水平的改变对试验指标没有影响,则所有试验数据的值相等,即试验数据的值相等,即SA等于零。等于零。Se表示在表示在Ai水平下
5、试验数据与该水平下试验数据平均值间水平下试验数据与该水平下试验数据平均值间的差异,它是由的差异,它是由随机误差引起随机误差引起的,叫误差平方和。如果没的,叫误差平方和。如果没有试验误差,则每个水平下试验数据与该水平下试验数据有试验误差,则每个水平下试验数据与该水平下试验数据平均值应该相等,即平均值应该相等,即Se等于零。等于零。ST表示全部试验数据与总平均值之间的差异,又叫总偏差表示全部试验数据与总平均值之间的差异,又叫总偏差平方和平方和。如果没有试验误差,且因素。如果没有试验误差,且因素A水平的改变对试验水平的改变对试验指标没有影响,则所有试验数据的值相等,即指标没有影响,则所有试验数据的值
6、相等,即ST等于零。等于零。6单因素方差分析1、总偏差平方和的分解、总偏差平方和的分解水平水平Ai下的样本均值(试验结果平均值)为下的样本均值(试验结果平均值)为样本数据的总平均值为样本数据的总平均值为总偏差平方和为总偏差平方和为7单因素方差分析8单因素方差分析ST=SA+Se9单因素方差分析2、平均偏差平方和(方差)与自由度、平均偏差平方和(方差)与自由度为了消除数据个数的多少给平方和带来的影响,采用偏差平方和除为了消除数据个数的多少给平方和带来的影响,采用偏差平方和除以相应的自由度,两者之比称为以相应的自由度,两者之比称为平均偏差平方和平均偏差平方和,也称为,也称为均方和均方和或或均方均方
7、或或方差方差。 总偏差平方和的自由度总偏差平方和的自由度fT fT=n-1 因素偏差平方和的自由度因素偏差平方和的自由度fA 为水平数减为水平数减1 误差平方和的自由度误差平方和的自由度fe 各平均偏差平方和为各平均偏差平方和为10单因素方差分析3、用、用F检验法进行显著性检验检验法进行显著性检验根据数学原理,对因素偏差平方和与误差偏差平方和进行合理的比根据数学原理,对因素偏差平方和与误差偏差平方和进行合理的比较,就能分析出因素对试验结果的影响程度、性质。较,就能分析出因素对试验结果的影响程度、性质。令令 FA=VA/Ve均方之比均方之比FA是一个统计量,它服从于自由度为(是一个统计量,它服从
8、于自由度为(fA, fe)的)的F分布分布 如果如果FA的值接近于的值接近于1,则说明因素,则说明因素A水平的改变对试验指标的影水平的改变对试验指标的影响与试验误差对试验指标的影响相近,可以认为响与试验误差对试验指标的影响相近,可以认为因素因素A水平之间没有水平之间没有显著差异显著差异或或因素对指标的影响不显著因素对指标的影响不显著。 对于给定的显著水平对于给定的显著水平值,从值,从F分布表中查出临界值分布表中查出临界值F(fA, fe),如果如果F F(fA, fe),说明因素,说明因素A变化的影响大于误差的影响,即变化的影响大于误差的影响,即该因该因素影响显著素影响显著。11单因素方差分析
9、4、制定方差分析表、制定方差分析表单因素方差分析表单因素方差分析表12例:考察生产某化工产品时反应温度例:考察生产某化工产品时反应温度A对回收率(对回收率(%)的影响。)的影响。单因素二水平试验:单因素二水平试验:A1=30oC, A2=40oC 只各做一次试验,误差较大只各做一次试验,误差较大 能否说能否说A2效果比效果比A1好好 虽然平均值的代表性强一点,受误差的影响小一点,但由于虽然平均值的代表性强一点,受误差的影响小一点,但由于不知道误差的大小,仍旧不知道误差的大小,仍旧不能判断这个差别是否是由于因素水不能判断这个差别是否是由于因素水平的改变所引起的。平的改变所引起的。12345平均值
10、平均值A17578606183y1=71.4A28962937185y2=80.0单因素方差分析13如何做一个合理的判断如何做一个合理的判断 对对误差影响的大小误差影响的大小或或误差引起的指标波动误差引起的指标波动有个定量估计有个定量估计 对对指标总的波动指标总的波动以及以及因素水平改变引起的指标波动因素水平改变引起的指标波动也应给以数量表示也应给以数量表示全部全部10个试验数据与个试验数据与总平均值总平均值y = (75+78+85)/10 = 75.7之差的之差的离差平方离差平方和和反映了指标观察值的总的波动,记为反映了指标观察值的总的波动,记为S2T,那么那么S2T = (75-75.7
11、)2+ (75-75.7)2 + (75-75.7)2 = 1294.10如果因素水平改变对指标不发生影响,也不存在试验误差,那么全部试验数如果因素水平改变对指标不发生影响,也不存在试验误差,那么全部试验数据应一致据应一致 S2T 为零为零 S2T 是由是由因素水平引起的指标波动因素水平引起的指标波动和和误误差引起的指标波动差引起的指标波动两部分组成的。两部分组成的。单因素方差分析14单因素方差分析如果没有试验误差,如果没有试验误差,A1的的5个数据应该相同,个数据应该相同,A2的的5个数据也应该相同个数据也应该相同试验误差对指标的影响的大小或误差引起的指标的波动可用试验误差对指标的影响的大小
12、或误差引起的指标的波动可用误差离差平方和误差离差平方和S2e来表示来表示S2e = (75-71.4)2+ (78-71.4)2 + (83-71.4)2 + (89-80.0)2+ (62-80.0)2 + (85-80.0)2 = 1109.20A1的平均收率为的平均收率为71.4近似表示水平近似表示水平1各次试验对指标的影响各次试验对指标的影响A2的平均收率为的平均收率为80.0近似表示水平近似表示水平2各次试验对指标的影响各次试验对指标的影响S2A = 5(71.4-75.7)2+ 5(80.0-75.7)2 =184.90反映了因素的水平的改变引起指标波动的大小反映了因素的水平的改变
13、引起指标波动的大小S2T = S2e + S2A 15 试验次数(数据的个数的影响)试验次数(数据的个数的影响)采用平均离差平方和采用平均离差平方和S2A /fA与与S2e /fe进行比较进行比较fA,fe分别称为分别称为S2A 与与S2e的的自由度自由度(离差平方和试中独立数据的个数离差平方和试中独立数据的个数) 对于对于S2e 而言,其中的而言,其中的10个数据满足两个关系式个数据满足两个关系式 (75+78+60+61+83)/5=71.4 (89+62+93+71+85)/5=80.8 fe = 10-2 = 8对于对于S2A 而言,其中的而言,其中的2个数据满足一个关系式个数据满足一
14、个关系式 (71.4+80.8)=75.7 fA = 2-1 = 8单因素方差分析16单因素方差分析为了便于计算为了便于计算 fA定义为因素离差平方和的自由度,为定义为因素离差平方和的自由度,为水平数水平数-1 fe定义为误差平方和的自由度,为定义为误差平方和的自由度,为水平数水平数*(重复次数(重复次数-1) 即即水平数水平数*重复次数重复次数-水平数水平数17单因素方差分析进行比较进行比较 FA值接近值接近1因素水平的改变对指标的影响和试验误差对指标的影响相近因素水平的改变对指标的影响和试验误差对指标的影响相近 因素水平之间没有显著差异因素水平之间没有显著差异S2e / feFA =S2A
15、 / fA18单因素方差分析?FA多大时认为因素对指标的影响显著多大时认为因素对指标的影响显著在一些假定条件下,可以证明在一些假定条件下,可以证明FA服从自由度为(服从自由度为(fA, fe)的)的F分分布布。对于给定的显著水平。对于给定的显著水平,查,查F分布表分布表可得一临界值可得一临界值F(fA, fe),),若若FA F(fA, fe),则认为因素),则认为因素A对指标的影响显著。对指标的影响显著。本例中,本例中, FA=1.33,对,对=0.05,查表得,查表得F0.05(1,8)= 5.3在水平在水平= 0.05下,下,反应温度反应温度A对回收率的影响不显著对回收率的影响不显著 (
16、或反应温度之间没有显著差异或反应温度之间没有显著差异)19单因素方差分析F分布表分布表-对于不同的对于不同的值值通常有:通常有: = 0.01,0.05,0.10一般说来,一般说来,F值与对应临界值之间的差距越大,说明该因素对值与对应临界值之间的差距越大,说明该因素对试验结果的影响越显著,或者说该因素越重要。试验结果的影响越显著,或者说该因素越重要。20单因素方差分析1.1.在数量上将因素对指标的影响和误差对指标的影响加以区分并作出估计在数量上将因素对指标的影响和误差对指标的影响加以区分并作出估计2.2.将它们进行比较将它们进行比较3.3.判断:因素各水平之间的差异是否显著判断:因素各水平之间
17、的差异是否显著21单因素方差分析22单因素方差分析23单因素方差分析24两因素方差分析两因素无重复试验两因素无重复试验两因素等重复试验两因素等重复试验25两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析设有两个因素设有两个因素A和和B,A有有m个水平:个水平:A1,A2,Am,B有有r个个水平:水平:B1,B2,Br,试验设计时把每个因素的每个水平都,试验设计时把每个因素的每个水平都搭配到,在搭配到,在A因素和因素和B因素的每个组合水平(因素的每个组合水平(Ai,Bj)下,做一)下,做一次试验(无重复),共进行了次试验(无重复),共进行了mr次试
18、验,得到试验指标的观察次试验,得到试验指标的观察值值26两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析1、总偏差平方和的分解、总偏差平方和的分解水平水平Ai下的试验结果平均值下的试验结果平均值水平水平Bj下的试验结果平均值下的试验结果平均值样本数据的总平均值样本数据的总平均值总偏差平方和总偏差平方和27两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析将将ST改些并分解得改些并分解得则有则有 ST=SA+SB+SeSA为因素为因素A的偏差平方和,反映了的偏差平方和,反映了A因素水平改变时对试验结果的
19、影响因素水平改变时对试验结果的影响SB为因素为因素B的偏差平方和,反映了的偏差平方和,反映了B因素水平改变时对试验结果的影响因素水平改变时对试验结果的影响Se为误差平方和为误差平方和28两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析2、平均偏差平方和与自由度、平均偏差平方和与自由度总自由度总自由度 fT=总的试验次数总的试验次数-1=mr-1=n-1因素的自由度为因素水平数减一,即因素的自由度为因素水平数减一,即 fA=m-1 fB=r-1误差的自由度误差的自由度 fe=fT-fA-fB=(m-1)()(r-1)因素平均偏差平方和因素平均偏差平
20、方和 VA=SA/(m-1) VB=SB/(r-1)误差平均偏差平方和误差平均偏差平方和 Ve=Se/(m-1)(r-1)29两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析3、用、用F检验法进行显著性检验检验法进行显著性检验计算计算F值值 FA=VA/Ve FB=VB/Ve对于给出的对于给出的,从从F分布表中查出分布表中查出F(fA,fe),F(fB,fe)30两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析为了计算方便,常采用为了计算方便,常采用两因素无重复试验方差分析表两因素无重复试验方差分析
21、表31两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析例:一种火箭使用了四种燃料,三种推进器做射程试验。每种例:一种火箭使用了四种燃料,三种推进器做射程试验。每种燃料和每种推进器的组合各做了一次试验,得火箭射程如表所燃料和每种推进器的组合各做了一次试验,得火箭射程如表所示。试问不同的燃料、不同的推进器分别对射程有无显著影响示。试问不同的燃料、不同的推进器分别对射程有无显著影响?推进器推进器B1B2B3燃料燃料A158.256.265.3A249.154.151.6A360.170.939.2A475.858.248.732两因素无重复试验方差分析
22、两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析方差分析表方差分析表 从表中可以看出,误差的平均偏差平方和比因素从表中可以看出,误差的平均偏差平方和比因素A和和B的都大,所的都大,所以以F值较小。根据误差平均偏差平方和的意义,它主要反映了随机误值较小。根据误差平均偏差平方和的意义,它主要反映了随机误差所引起的波动的大小,应该是不大的,而现在竟出现较大的值,可差所引起的波动的大小,应该是不大的,而现在竟出现较大的值,可能是没有考虑两种因素搭配起来的作用能是没有考虑两种因素搭配起来的作用交互作用交互作用的缘故。但是上的缘故。但是上述试验对每种搭配只做了一次试验,不能分辨出交
23、互作用,将在下面述试验对每种搭配只做了一次试验,不能分辨出交互作用,将在下面讨论。讨论。方差来源方差来源偏差平方和偏差平方和自由度自由度平均偏差平均偏差平方和平方和F值值F临界值临界值=0.05显著性显著性A15759.0352530.434.76不显著不显著B22384.7211192.350.925.14不显著不显著E73198.0612199.7总和总和111341.71133两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析设有两个因素设有两个因素A和和B,A有有m个水平:个水平:A1,A2,Am,B有有r个个水平:水平:B1,B2,Br,
24、试验设计时把每个因素的每个水平都,试验设计时把每个因素的每个水平都搭配到,在搭配到,在A因素和因素和B因素的每个组合水平(因素的每个组合水平(Ai,Bj)下,做)下,做n次次试验,每个观察值记为试验,每个观察值记为xijk(i=1,2,m;j=1,2,r;k=1,2,n)共共进行了进行了mrn次试验,得到试验指标的观察值次试验,得到试验指标的观察值34两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析1、总偏差平方和的分解、总偏差平方和的分解 计算总偏差平方和计算总偏差平方和35两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分
25、析两因素等重复试验方差分析1、总偏差平方和的分解、总偏差平方和的分解 计算因素偏差平方和计算因素偏差平方和36两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析37两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析1、总偏差平方和的分解、总偏差平方和的分解 计算试验误差平方和计算试验误差平方和38两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析2、平均偏差平方和与自由度、平均偏差平方和与自由度总自由度总自由度 fT=总的试验次数总的试验次数-1=mrn-1
26、因素的自由度为因素水平数因素的自由度为因素水平数-1,即,即 fA=m-1 fB=r-1因素交互作用自由度为交互作用因素自由度乘积因素交互作用自由度为交互作用因素自由度乘积 fAB= (m-1)()(r-1)误差的自由度误差的自由度 fe=fT-fA-fB-fAB=mr(n-1)因素平均偏差平方和因素平均偏差平方和 VA=SA/fA VB=SB/fB VAB=SAB/fAB误差平均偏差平方和误差平均偏差平方和 Ve=Se/fe39两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析两因素无重复试验方差分析3、用、用F检验法进行显著性检验检验法进行显著性检验计算计算F值值 F
27、A=VA/Ve FB=VB/Ve FAB=VAB/Ve对于给出的对于给出的,从从F分布表中查出分布表中查出F(fA,fe),F(fB,fe), F(fAB,fe)40两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析为了计算方便,常采用为了计算方便,常采用两因素有交叉作用方差分析表两因素有交叉作用方差分析表41两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析例:在前面的例子中,对于燃料和推进器每种组合各做了二次例:在前面的例子中,对于燃料和推进器每种组合各做了二次试验,得火箭射程如表所示。试问不同的燃
28、料、不同的推进器试验,得火箭射程如表所示。试问不同的燃料、不同的推进器分别对射程有无显著影响?哪种搭配最好分别对射程有无显著影响?哪种搭配最好推进器推进器B1B2B3燃料燃料A158.2 52.656.2 41.265.3 60.8A249.1 42.854.1 50.551.6 48.4A360.1 58.370.9 73.239.2 40.7A475.8 71.558.2 51.048.7 51.042两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析43两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方
29、差分析方差分析表方差分析表 44两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析方差分析表方差分析表 因素因素A,B和交互作用和交互作用AB均显著均显著 A4与与B1, A3与与B2搭配的效果最好搭配的效果最好方差来源方差来源偏差平方和偏差平方和自由度自由度平均偏差平均偏差平方和平方和F值值F临界值临界值=0.05显著性显著性A261.6750387.22504.423.49显著显著BAB370.98081768.692526185.4904294.78219.3914.903.893.00显著显著显著显著E236.95001219.7458总和
30、总和2638.29832345实际案例实际案例实际案例实际案例46(1)三线表)三线表(2)标准偏差)标准偏差(3)实际中,一个多因素试验往往进行单因素分析,)实际中,一个多因素试验往往进行单因素分析,但是在一个图但是在一个图/表中表示表中表示4748两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析两因素等重复试验方差分析方差分析方差分析全面试验法全面试验法因素增加因素增加水平增加水平增加49复习要点复习要点复习要点复习要点(1)掌握单因素重复试验方差分析)掌握单因素重复试验方差分析(2)理解水平之间差异性的含义)理解水平之间差异性的含义(3)正确区分因素与水平)正确区分因素与水平50