《ANOVA统计学之方差分析推荐课件》由会员分享,可在线阅读,更多相关《ANOVA统计学之方差分析推荐课件(39页珍藏版)》请在金锄头文库上搜索。
1、方差分析方差分析方差分析方差分析Analysis of Variance Analysis of Variance (ANOVA )ANOVA ) 因素也称为因素也称为处理处理因素(因素(因素(因素(factorfactor)(名义分类变量)(名义分类变量)(名义分类变量)(名义分类变量),每,每一处理因素至少有两个一处理因素至少有两个水平水平(level)(也称(也称“处理组处理组”)。)。 一个一个因素因素(水平水平间独立)间独立) 单向方差分析单向方差分析 (第十章)(第十章) 两个两个因素因素(水平水平间独立或相关)间独立或相关)双向方差分析双向方差分析 (第十一章)(第十一章) 一个
2、个体多个测量值一个个体多个测量值重复测量资料的方差分析重复测量资料的方差分析 ANOVA与回归分析相结合与回归分析相结合协方差分析协方差分析 目的:目的:用这类资料的样本信息来推断各处理组间用这类资料的样本信息来推断各处理组间多个总多个总体均数体均数的差别有无统计学意义。的差别有无统计学意义。2021/8/221SiS1S2S3S4合计值5.994.153.784.716.652021/8/2222021/8/223 ANOVA ANOVA 由英国统计由英国统计学家学家R.A.FisherR.A.Fisher首创,首创,为纪念为纪念FisherFisher,以,以F F命命名,故方差分析又称名
3、,故方差分析又称 F F 检验检验 (F F test test)。用)。用于推断于推断多个总体均数多个总体均数有有无差异无差异 2021/8/224第十章第十章 单向方差分析单向方差分析One-way analysis of variance第一节第一节 方差分析的基本思想方差分析的基本思想将所有测量值间的总变异总变异按照其变异的来源分解为多个部份分解为多个部份,然后进行比较,评价由某种因素某种因素所引起的变异是否具有统计学意义。2021/8/225一、离均差平方和的分一、离均差平方和的分解解组间变异组间变异总变异总变异组内变异组内变异2021/8/226对于例对于例8-1(完全随机设计)(
4、完全随机设计)资料,共有三种不同的变异资料,共有三种不同的变异1.总变异总变异(Total variation):):全部测量值全部测量值Yij与与总均数总均数 间的差异间的差异2.组间变异组间变异( between group variation ):各):各组的均数组的均数 与总均数与总均数 间的差异间的差异3.组内变异组内变异(within group variation ):每组的:每组的每个测量值每个测量值Yij与该组均数与该组均数 的差异的差异下面用下面用离均差平方和离均差平方和(sum of squares of (sum of squares of deviations fro
5、m meandeviations from mean,SSSS) )反映变异的大小反映变异的大小 2021/8/2271. 1. 总变异总变异: :所有测量值之间总所有测量值之间总的变异程度,的变异程度,计算公式计算公式校正系数校正系数:2021/8/2282 2组组间间变变异异:各各组组均均数数与与总总均均数数的的离均差平方和,离均差平方和,计算公式为计算公式为SS组间反映了各组均数 的变异程度组间变异组间变异随机误差随机误差+处理因素效应处理因素效应 2021/8/229 3组内变异:在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异,也称SS误差。
6、用各组内各测量值Yij与其所在组的均数差值的平方和来表示,反映随机误差的影响。计算公式为2021/8/2210三种三种“变异变异”之间的关系之间的关系离均差平方和离均差平方和分解分解:2021/8/2211One-FactorANOVAPartitionsofTotalVariationVariation Due to Treatment SSBVariation Due to Random Sampling SSWTotal Variation SSTFCommonlyreferredtoas:oSumofSquaresWithin,oroSumofSquaresError,oroWithi
7、nGroupsVariationFCommonlyreferredtoas:oSumofSquaresAmong,oroSumofSquaresBetween,oroSumofSquaresModel,oroAmongGroupsVariation=+2021/8/2212均方差,均方均方差,均方( (mean square,MS) ) 2021/8/2213二、二、F 值与值与F分布分布,2021/8/2214F 分布曲线分布曲线2021/8/2215F 界值表界值表附表附表5 5 F F界界值表(方差分析用,表(方差分析用,单侧界界值)上行:上行:P P=0.05 =0.05 下行:下行:
8、P P=0.01=0.01分母自由度分母自由度2 2分子的自由度,分子的自由度,1 11 12 23 34 45 56 61 11611612002002162162252252302302342344052405249994999540354035625562557645764585958592 218.5118.5119.0019.0019.1619.1619.2519.2519.3019.3019.3319.3398.4998.4999.0099.0099.1799.1799.2599.2599.3099.3099.3399.3325254.244.243.393.392.992.992
9、.762.762.602.602.492.497.777.775.575.574.684.684.184.183.853.853.633.6352021/8/2216F F 分布曲线下面积与概率分布曲线下面积与概率2021/8/22172021/8/2218第二节第二节第二节第二节 实例实例实例实例8.18.18.18.1的方差分的方差分的方差分的方差分析析析析2021/8/2219H0: 即即4个试验组总体均数相等个试验组总体均数相等 H1:4个试验组总体均数个试验组总体均数不全相等不全相等 检验水准检验水准 一、一、 建立检验假设建立检验假设2021/8/2220SiS1S2S3S4合计值
10、5.994.153.784.716.652021/8/2221二、二、 计算离均差平方、自由度、均方计算离均差平方、自由度、均方2021/8/2222三、计算三、计算F值值2021/8/2223四、下结论四、下结论 注意:当组数为注意:当组数为2时,完全随机设计的方时,完全随机设计的方差分析结果与两样本均数比较的差分析结果与两样本均数比较的t检验结果等检验结果等价,对同一资料价,对同一资料,有:有:2021/8/2224第三节第三节第三节第三节 平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较平均值之间的多重比较不拒绝不拒绝H0,表示拒绝总体均数相等的证据,表示拒绝总体均数相等的证
11、据不足不足 分析终止。分析终止。拒绝拒绝H0,接受,接受H1, 表示总体均数不全相等表示总体均数不全相等哪两两均数之间相等?哪两两均数之间相等?哪两两均数之间不等?哪两两均数之间不等? 需要进一步作多重比较。需要进一步作多重比较。2021/8/2225控制累积控制累积控制累积控制累积类错误概率增大的方法类错误概率增大的方法类错误概率增大的方法类错误概率增大的方法采用采用Bonferroni法、法、SNK法和法和Tukey法等方法法等方法2021/8/2226累积累积累积累积类错误的概率为类错误的概率为类错误的概率为类错误的概率为当有当有k个均数需作两两比较时,比较的次数共有个均数需作两两比较时
12、,比较的次数共有c= k!/(2!(k-2)!)=k(k-1)/2设每次检验所用设每次检验所用类错误的概率水准为类错误的概率水准为,累积,累积类类错误的概率为错误的概率为,则在对同一实验资料进行,则在对同一实验资料进行c次检验时,次检验时,在样本彼此独立的条件下,根据概率乘法原理,其累积在样本彼此独立的条件下,根据概率乘法原理,其累积类错误概率类错误概率与与c有下列关系:有下列关系:1(1)c (8.6)例如,设例如,设0.05,c=3(即即k=3),其累积,其累积类错误类错误的概率为的概率为1(1-0.05)3 =1-(0.95)3 = 0.1432021/8/2227一、一、一、一、Bon
13、ferroniBonferroniBonferroniBonferroni法法法法方法:采用方法:采用/c作为下结论时所采用的作为下结论时所采用的检验水准。检验水准。c为两两比较次数,为两两比较次数, 为累积为累积I类错误的概率。类错误的概率。2021/8/2228例例例例8-18-18-18-1四个均值的四个均值的四个均值的四个均值的BonferroniBonferroniBonferroniBonferroni法比较法比较法比较法比较 设设/c0.05/6=0.0083,由此由此t的临的临界值为界值为t(0.0083/2,20)=2.92712021/8/2229BonferroniBon
14、ferroniBonferroniBonferroni法的适用性法的适用性法的适用性法的适用性 当当比较次数不多时比较次数不多时,Bonferroni法的效果法的效果较好。较好。 但当但当比较次数较多比较次数较多(例如在例如在10次以上次以上)时,时,则由于其检验水准选择得过低,结论偏于保则由于其检验水准选择得过低,结论偏于保守。守。2021/8/2230二、二、二、二、SNKSNKSNKSNK法法法法SNK(student-Newman-Keuls)法又称q检验,是根据q值的抽样分布作出统计推论(例8-1)。1将各组的平均值按由大到小的顺序排列由大到小的顺序排列:顺序顺序(1)(2)(3)(
15、4) 平均值平均值28.018.718.514.8 原组号原组号BCAD2.计算两个平均值之间的差值及组间跨度差值及组间跨度k,见表8-3第(2)、(3)两列。3.计算统计量计算统计量q值值4.根据计算的q值及查附表6得到的q界值(p286),作出统计统计推断推断。2021/8/2231附表附表62021/8/2232三、三、三、三、TukeyTukeyTukeyTukey法法法法2021/8/2233第四节第四节第四节第四节 方差分析的假定条件和数据转换方差分析的假定条件和数据转换方差分析的假定条件和数据转换方差分析的假定条件和数据转换一、方差分析的假定条件一、方差分析的假定条件(上述条件与
16、两均数比较的上述条件与两均数比较的t检验检验的应用条件相同。)的应用条件相同。)1.各处理组样本来自随机、独立的正态总体(D法、W法、卡方检验);2.各处理组样本的总体方差相等(不等会增加I型错误的概率,影响方差分析结果的判断)二、方差齐性检验二、方差齐性检验1.Bartlett检验法2.Levene等3.最大方差与最小方差之比3,初步认为方差齐同。2021/8/22341. Bartlett 检验法2021/8/22352. Levene 检验法将原样本观察值作离均差变换,或离均差平方变换,然后执行完全随机设计的方差分析,其检验结果用于判断方差是否齐性。因为levene检验对原数据是否为正态
17、不灵敏,所以比较稳健。目前均推荐采用LEVENE方差齐性检验2021/8/2236三、数据变换三、数据变换改善数据的正态性或方差齐性。使之满足方差分析的假定条件。1.平方根反正弦变换适用于二项分布率(比例)数据。2.平方根变换适用于泊松分布的计数资料3.对数变换适用于对数正态分布资料2021/8/2237第五节第五节第五节第五节 完全随机设计方法简介完全随机设计方法简介完全随机设计方法简介完全随机设计方法简介将将120120名高血脂患者完全随机分成名高血脂患者完全随机分成4 4个例数相等的组个例数相等的组1. 1. 编编号号:120120名名高高血血脂脂患患者者从从1 1开开始始到到12012
18、0,见下面表第,见下面表第1 1行;行;2. 2. 取取随随机机数数字字:从从附附表表1515中中的的任任一一行行任任一一列列开开始始,如如第第5 5行行第第7 7列列开开始始,依依次次读读取取三三位位数数作作为为一一个个随随机机数数录录于于编编号号下下,见下面表的第见下面表的第2 2行;行;2021/8/22383. 3. 排排序序:按按随随机机数数字字从从小小到到大大 ( (数数据据相相同同则则按按先先后后顺序)编序号,见下面表的第顺序)编序号,见下面表的第3 3行。行。4. 4. 事事先先规规定定:序序号号1-301-30为为甲甲组组,序序号号31-6031-60为为乙乙组组,序序号号61-9061-90为为丙丙组组,序序号号91-12091-120为为丁丁组组,见见下下面面表表的的第第4 4行。行。2021/8/2239