4第四章方差分析修改

上传人:飞*** 文档编号:4526787 上传时间:2017-08-06 格式:PPT 页数:116 大小:2.67MB
返回 下载 相关 举报
4第四章方差分析修改_第1页
第1页 / 共116页
4第四章方差分析修改_第2页
第2页 / 共116页
4第四章方差分析修改_第3页
第3页 / 共116页
4第四章方差分析修改_第4页
第4页 / 共116页
4第四章方差分析修改_第5页
第5页 / 共116页
点击查看更多>>
资源描述

《4第四章方差分析修改》由会员分享,可在线阅读,更多相关《4第四章方差分析修改(116页珍藏版)》请在金锄头文库上搜索。

1、1,第四章 方差分析 analysis of variance 简写 ANOVA,宁夏医学院公共卫生学院流行病与卫生统计学系主讲人 李吴萍2009.10,2,第四章 方差分析,讲授内容方差分析的基本思想(掌握)及应用条件(熟悉)完全随机设计资料的方差分析(掌握)随机区组设计资料的方差分析(掌握)拉丁方设计资料的方差分析(掌握)两阶段交叉设计资料的方差分析(熟悉)析因设计资料的方差分析(熟悉)重复测量资料的方差分析(熟悉)多个样本均数间的多重比较(掌握)方差齐性和变量变换(了解),3,第一节 基本思想及应用条件,目的:推断多个总体均数是否有差别。 也可用于两个方法:方差分析,即多个样本均数比较的

2、F检验。明确几个概念:处理因素在实验过程中,影响实验结果的条件(施加的干预)。因素的水平因素在实验中可能处的状态。试验指标衡量实验结果好坏的标准。,4,认识单因素实验方差分析样本观测值,5,第一节 基本思想及应用条件,一、基本思想:P71 根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,借助F分布做出统计推断,从而推论各种研究因素对实验结果有无影响。,6,二、应用条件:1)各样本是相互独立的随机样本2)各样本来自正态总体3)各处理组总体方差相等,即方差齐性,基本思想及应用条件,7,第

3、二节 完全随机设计资料的方差分析,一、完全随机设计(completely random design) 是采用完全随机化的分组方法,将全部试验对象分配到k个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推断处理因素的效应。,8,第二节 完全随机设计资料的方差分析,例1 某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果

4、如表9-1所示。问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?,9,第二节 完全随机设计资料的方差分析,一、完全随机设计,10,表91 2型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L),11,完全随机设计资料在进行统计分析时,需根据数据的分布特征选择方法,对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析(one-way ANOVA)或成组资料的 t 检验(k=2);对于非正态分布或方差不齐的资料,可进行数据变换或采用秩和检验。,第二节 完全随机设计资料的方差分析,12,完全随机设计资料的方差分析,总变异 SS总,第二节 完全随机设计资料的方差分析,组

5、内变异(随机误差) SS组内,组间变异(处理效应、随机误差)SS组间,13,完全随机设计资料的方差分析,1. 总变异 60名2型糖尿病患者的餐后2小时血糖Xij大小各不相同,与它们的总均数(overall mean)也不相同,这种变异称为总变异(total variation)。该变异既包含了随机误差(即2型糖尿病患者的个体差异和测量误差),又包含了三组用药即处理的不同,其大小用所有数据(N=60)的方差即均方MS(mean square)来表示。,第二节 完全随机设计资料的方差分析,14,1总变异 全部测量值大小不同,这种变异称为总变异。总变异的大小可以用离均差平方和(sum of squa

6、res of deviations from mean,SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。总变异SS总反映了所有测量值之间总的变异程度,第二节 完全随机设计资料的方差分析,15,完全随机设计资料的方差分析,第二节 完全随机设计资料的方差分析,16,完全随机设计资料的方差分析,2组间变异 各处理组由于接受处理的水平不同,各组的样本均数 (i1,2,g)也大小不等,三组2型糖尿病患者餐后2小时血糖的样本均数各不相同,它与总均数也不相同,这种变异称为组间变异。 其大小可用各组均数与总均数的离均差平方和表示,记为SS组间,它反映了三组用药不同的影响(如处理确实有作用),同时

7、也包括了随机误差,第二节 完全随机设计资料的方差分析,17,完全随机设计资料的方差分析,第二节 完全随机设计资料的方差分析,18,完全随机设计资料的方差分析,各组均数之间相差越悬殊,它们与总均数的差值越大,SS组间就越大,反之SS组间越小。SS组间反映了各组间的变异程度。存在组间变异的原因有:随机误差(包括个体变异和测量误差)处理的不同水平可能对试验结果的影响。,第二节 完全随机设计资料的方差分析,19,完全随机设计资料的方差分析,3组内变异 在同一处理组中,虽然每个受试对象接受的处理相同,但测量值各不相同,各组内Xij大小各不相同,与本组的样本均数也不相同,这种变异称为组内变异(误差)。组内

8、变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内, 表示随机误差(含个体差异和测量误差)的影响。又称误差变异,第二节 完全随机设计资料的方差分析,20,完全随机设计资料的方差分析,第二节 完全随机设计资料的方差分析,21,完全随机设计资料的方差分析,根据方差分析的基本思想:,第二节 完全随机设计资料的方差分析,22,变异程度除了与离均差平方和的大小有关外,还与其自由度有关,将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(mean square,MS)。,第二节 完全随机设计资料的方差分析,23,组间均方与组内均方的比值称为F 统计量,第二节 完全随机设

9、计资料的方差分析,24,F 值(Fisher)接近于l,就没有理由拒绝H0;反之,F 值越大,拒绝H0的理由越充分。数理统计的理论证明,当H0成立时,F 统计量服从F 分布。F 分布有两个自由度, 分子自由度为1,分母自由度为2,记为F 。,第二节 完全随机设计资料的方差分析,25,完全随机设计资料的方差分析,方差分析的基本思想就是根据实验设计的类型,将全部测量值总的离均差平方和及其自由度分解为两个或多个部分,除随机误差作用外,每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如组间变异SS组间可由处理因素的作用加以解释。通过比较不同变异来源的均方,借助F分布做出统计推断,从

10、而推论各种研究因素对试验结果有无影响。,第二节 完全随机设计资料的方差分析,26,完全随机设计资料的方差分析,分析步骤 (1)建立检验假设,确定检验水准 H0:三个总体均数相等,即1=2=3 H1:三个总体均数不全相等。 =0.05(2)计算统计量F 值(3)确定P 值,做出推断结论,第二节 完全随机设计资料的方差分析,27,表9-5 完全随机设计资料的方差分析表,29,表96完全随机设计资料的方差分析表,按=0.05水准,拒绝H0,接受H1,差别有统计学意义。可认为2型糖尿病患者经药物(新药和标准药物)治疗4周,其餐后2小时血糖的总体平均水平不全相同,即三个总体均数中至少有两个不同。,F0.

11、05(2,60)=3.15 F0.01(2,60)=4.98,30,注意:方差分析的结果若拒绝H0,接受H1,不能说明各组总体均数两两间都有差别。如果要分析哪两组间有差别,要进行多个均数间的多重比较(见本章第六节)。当k=2时,方差分析的结果与两样本均数比较的t 检验等价,有 。,第二节 完全随机设计资料的方差分析,31,第三节 随机区组设计资料的方差分析,随机区组设计随机区组设计(randomized block design)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组

12、内的受试对象随机分配到各处理或对照组。,32,与完全随机设计相比,随机区组设计的特点是随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。在进行统计分析时,将区组离均差平方和从完全随机设计的组内离均差平和中分离出来,从而减小组内离均差平方和(误差平方和),提高了统计检验效率。若将区组作为另一处理因素的不同水平,随机区组设计等同于无重复观察的两因素设计。,第三节 随机区组设计资料的方差分析,33,例4-4 某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3

13、只小白鼠随机接受三种抗癌药物(具体分配结果见例4-3),以肉瘤的重量为指标,试验结果见表4-9。问三种不同的药物的抑瘤效果有无差别?,第三节 随机区组设计资料的方差分析,34,方法:先将小白鼠的体重从轻到重编号,体重相近的3只小白鼠配成一个区组,共5个区组。在随机数字表(附表15)中任选一行一列开始的2位数作为1个随机数;在每个区组内将随机数按大小排序;各区组中序号为1 的接受A方案、序号为2的接受B方案、序号为3的接受C方案.,第三节 随机区组设计资料的方差分析,35,第三节 随机区组设计资料的方差分析,表4-6 15只小白鼠分5个区组的随机区组设计分配结果,37,随机区组设计资料分析需根据

14、数据的分布特征选择方法:对于正态分布且方差齐同的资料,应采用双向分类的方差分析(two-way classification ANOVA)或配对t 检验(k=2)。当不满足方差分析和t 检验条件时,可对数据进行变量转换或采用随机区组设计资料的Friedman M 检验。,第三节 随机区组设计资料的方差分析,38,第三节 随机区组设计资料的方差分析,39,一、离均差平方和与自由度的分解(1) 总变异SS总:反映所有观察值之间的变异,计算见公式(4-1)。(2) 处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理,计算见公式(4-2)。(3)区组间变异:由不同区组作用和随机误差

15、产生的变异,记为SS区组,计算公式为,第三节 随机区组设计资料的方差分析,40,(4) 误差变异: 完全由随机误差产生的变异,记为SS误差。,第三节 随机区组设计资料的方差分析,41,表98 随机区组设计方差分析的计算公式,42,二、随机区组设计资料方差分析的基本步骤(1)建立检验假设,确定检验水准对于处理组: H0:三个总体均数相等,即1= 2= 3 H1: 三个总体均数不等或不全相等对于区组: H0:五个总体均数相等 H1:五个总体均数不等或不全相等 =0.05,第三节 随机区组设计资料的方差分析,43,(2)计算检验统计量,44,(2)计算检验统计量,第三节 随机区组设计资料的方差分析,

16、F0.05(2,8)=4.46,F处理 F0.05(2,8),P F0.05(4,8) ,P 0.05。在=0.05水准上拒绝H0,还认为5个区组间有差别.,45,注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较(见本章第六节)。当k=2时,随机区组设计方差分析与配对设计资料的t 检验等价,有 。,第三节 随机区组设计资料的方差分析,46,随机区组设计确定区组因素应是对试验结果有影响的非处理因素。区组内各试验对象应均衡,区组之间试验对象具有较大的差异为好,这样利用区组控制非处理因素的影响,并在方差分析时将区组间的变异从组内变异中分解出来。因此,当区组间差别有统计学意义时,这种设计的误差比完全随机设计小,试验效率得以提高。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 调研报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号