方差分析(ANOVA)1

上传人:最**** 文档编号:118176263 上传时间:2019-12-11 格式:PPT 页数:70 大小:1.44MB
返回 下载 相关 举报
方差分析(ANOVA)1_第1页
第1页 / 共70页
方差分析(ANOVA)1_第2页
第2页 / 共70页
方差分析(ANOVA)1_第3页
第3页 / 共70页
方差分析(ANOVA)1_第4页
第4页 / 共70页
方差分析(ANOVA)1_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《方差分析(ANOVA)1》由会员分享,可在线阅读,更多相关《方差分析(ANOVA)1(70页珍藏版)》请在金锄头文库上搜索。

1、方差分析(ANOVA) 例子:某研究者在某单位工作人员中进行了体重指数 (BMI)抽样调查,随机抽取不同年龄组男性受试者 各16名,测量了被调查者的身高和体重值,由此按照 BMI=体重/身高2公式计算了体重指数,请问,不同 年龄组的体重指数有无差异。 项项目18岁岁30岁岁4560岁岁 21.6527.1520.28 20.6628.5822.88 18.8223.9326.49 样样本量161616 平均值值22.0725.9425.49 标标准差8.978.117.19 一、方差分析的基本思想 5 组间变异 总变异 组内变异 思想来源: 观察值总变异可以分解为组间变异和组内变异 6 1.

2、总变异(Total variation): 全部测量值Xij与总 均数 间的差异 2. 组间变异(between group variation ): 各组的 均数 与总均数 间的差异 3. 组内变异(within group variation ):每组的 每个测量值 与该组均数 的差异 可用离均差平方和反映变异的大小 1. 总变异: 所有测量值之间总的变异 程度,SS总 2组间变异:各组均数与总均数的离 均差平方和, SS组间 SS组间反映了各组均数 的变变异程度 组间变异随机误差+处理因素效应 3组内变异:用各组内各测量值Xij与 其所在组的均数差值的平方和来表示 ,SS组内 SS组内反

3、映随机误差的影响(个体差异和测量误差) 。 均方差,均方(mean square,MS) VS VS 组间均方与组内均方比值越小,样本越可能来 源于同一个总体,比值越大,样本越可能不是 来源于一个总体 二、F 值与F分布 , 如果各组样本的总体均数相等(H0成立),即各处理组的样 本来自相同总体,无处理因素的作用,则组间变异同组内变异 一样,只反映随机误差作用的大小。组间均方与组内均方的比 值称为F统计量 F值接近于1,就没有理由拒绝H0;反之,F值越大,拒 绝 H0的理由越充分。数理统计的理论证明,当H0成立时,F 统计量服从F分布。 F 分布曲线 回忆t分布和t检验 17 18 F 界值表

4、 二、完全随机设计方差分析(单因素方差分析) 关于因素与水平 因素也称为处为处 理因素(factor) 每一处处理因素至少有两个水平(level)(也称“处处理组组 ”)。 完全随机设计: 将实验对象随机分配到不同处理组的单因素 设计方法。针对一个处理因素,通过比较该 因素不同水平组均值,推断该处理因素不同 水平组的均值是否存在统计学差异。 例 在评价某药物耐受性及安全性的I期临床试验 中,对符合纳入标准的30名健康自愿者随机分为 3组每组10名,各组注射剂量分别为0.5U、1U、 2U,观察48小时部分凝血活酶时间(s)试问不 同剂量的部分凝血活酶时间有无不同? 方差分析步骤 : (1)提出

5、检验假设,确定检验水准 H0:1=2=3 H1:1,2,3不全相同 a=0.05 (2)计算检验统计量F 值 (3)确定P值,做出推断结论 F0.05(2,26) =2.52,FF0.05(2,26) ,P0.05,拒绝 H0。 三种不同剂量48小时部分凝血活酶时间 不全相同。 例子:某研究者在某单位工作人员中进行了体重指数 (BMI)抽样调查,随机抽取不同年龄组男性受试者 各16名,测量了被调查者的身高和体重值,由此按照 BMI=体重/身高2公式计算了体重指数,请问,不同年 龄组的体重指数有无差异。 项项目18岁岁30岁岁4560岁岁 21.6527.1520.28 20.6628.5822

6、.88 18.8223.9326.49 样样本量161616 平均值值22.0725.9425.49 标标准差8.978.117.19 方差分析适合于任何多组独立均衡可比的数据 基本步骤 (1)建立假设,确定检验水准 H0:三个总体均数相等,即三组工作人员 的体重指数总体均数相等 H1:三个总体均数不等或不全相等 a=0.05 (2)计算检验统计量F值 变异来源SS自由度(df ) MSF 组间143.406271.7038.87 组内363.86458.09 总变异507.3647 (3)确定p值,作出统计推断 P2,45=3.20-3.218.87,本次F值处于F界值之 外,说明组间均方组

7、内均方比值属于小概率 事件,因此拒绝H0,接受H1,三个总体均 数不等或不全相等 方差分析的关键条件 第一、各组服从正态分布! 第二、各组符合方差齐性! 第三、独立性 方差齐性检验 Bartlett检验法 Levene F 检验 最大方差与最小方差之比3,初步认为方 差齐同。 问题: 不符合条件怎么办? 第一招:数据转换 方差齐性转换;正态性转换 第二招:特别分析方法 非参数检验 三、多个样本均数的两两比较 方差分析能说明什么问题? 不拒绝H0,表示拒绝总体均数相等的证据不 足 分析终止 拒绝H0,接受H1, 表示总体均数不全相等 哪两两均数之间相等?哪两 两均数之间不等? 需要进一步作多重比

8、较 能否用T检验呢 当有k个均数需作两两比较时,比较的次数共 有c= k!/(2!(k-2)!)=k(k-1)/2 设每次检验所用类错误的概率水准为,累 积类错误的概率为,则在对同一实验资 料进行c次检验时,在样本彼此独立的条件下 ,根据概率乘法原理,其累积类错误概率 与c有下列关系: 1(1)c 例如,设0.05,c=3(即k=3),其累积类错 误的概率为1(1-0.05)3 =1-(0.95)3 = 0.143 多重比较的方法: SNK检验(q 检验):探索性研究,进行 两两比较。 LSD-t 检验:证实性检验,可认为LSD法是 最灵敏的 Turkey 检验方法,探索性研究,要求样本 量相

9、同。 Duncan 检验方法,探索性研究 Dunnet 检验方法,证实性检验,常用于多 个试验组与一个对照组间的比较。 例1 在肾缺血再灌注过程的研究中,将36只雄性大鼠随机等 分成三组,分别为正常对照组、肾缺血60分组和肾缺血60 分再灌注组,测得各个体的NO数据见数据文件no.sav,试 问各组的NO平均水平是否相同? 单因素方差分析 分析: 对于单因素方差分析,其资料在SPSS中的数据结构应当由 两列数据构成,其中一列是观察指标的变量值,另一列是用 以表示分组变量。实际上,几乎所有的统计分析软件,包括 SAS,STATA等,都要求方差分析采用这种数据输入形式, 这一点也暗示了方差分析与线

10、性模型间千丝万缕的联系。 单因素方差分析 预分析(重要):检验其应用条件 单因素方差分析 选择data 中的split file,出现如下对话框: 单因素方差分析 单因素方差分析 单因素方差分析 v 这里仅取其中一组结果,表明该资料符合 分组正态性的条件。 单因素方差分析 注意分组检验正态性后,要先回到data菜单下的split file ,如下操作取消拆分后才能进行后续的方差分析: 单因素方差分析 单因素方差分析 选入分组变量 选入因变量 给出各组间样本 均数的折线图 指定进行方差 齐性检验 单因素方差分析 结果分析单因素方差分析 (1) 方差齐性检验 v Levene方法检验统计量为3.2

11、16,其P值为0.053,可 认为样本所来自的总体满足方差齐性的要求。 单因素方差分析结果分析 (2) 方差分析表 v 第1列为变异来源,第2、3、4列分别为离均差平方和、自 由度、均方,检验统计量F值为5.564,P0.008,组间均数 差别统计学意义,可认为各组的NO不同。 变 异 来 源 单因素方差分析结果分析 (3) 各组样本均数折线图 Means plots 选项给出,更直观。 注意:当分组变量体现出顺序的趋势时,绘制这种折线图可以提示 我们选择正确的趋势分析模型。 通过以上分析得到了拒绝H0的结论,但实际上单因素方差分 析并不这样简单。在解决实际问题时,往往仍需要回答多个 均数间到

12、底是哪些存在差异。虽然结论提示不同组别个体的 NO量不同,但研究者并不知道到底是三者之间均有差别,还 是某一组与其他两组有差别。这就应当通过两两比较(多重 比较)进行考察。 均数两两比较方法 直接校正检验水准(相对粗糙) 专用的两两比较方法: 计划好的多重比较(Planned Comparisons) 非计划的多重比较(PostHoc Comparisons) 均数两两比较方法 Contrasts按钮Post Hoc按钮 点击单因素方差分析主对话框中的Post Hoc按钮,总共 有14种两两比较的方法,如下: 均数两两比较方法 LSD法:最灵敏,会犯假阳性错误; Sidak法:比LSD法保守;

13、 Bonferroni法:比Sidak法更为保守一些; Scheffe法:多用于进行比较的两组间样本含量不等时; Dunnet法:常用于多个试验组与一个对照组的比较; S-N-K法:寻找同质亚组的方法; Turkey法:最迟钝,要求各组样本含量相同; Duncan法:与Sidak法类似。 均数两两比较方法 仍以例1为例,LSD法的输出格式: 均数两两比较方法 结果分析 仍以例1为例,SNK法的输出格式: 结果分析 均数两两比较方法 v 该方法的目的是寻找同质子集,故各组在表格的纵向上,均 数按大小排序,然后根据多重比较的结果将所有的组分为若干 个子集,子集间有差别,子集内均数无差别。 当各组样

14、本含量不同,选择Scheffe法,得结果: 均数两两比较方法 结果分析 假设在调查的设计阶段,就计划好了第二组和第一组,以及第三组 和第一组的比较,可以使用主对话框中的contrast 按钮实现。 v 在coefficients后面的框中输入1,-1,0,每次输入后点击add,就 可以比较第一组和第二组的NO;再点击next按钮,继续输入下一个组 合,即0,-1,1。 均数两两比较方法 均数两两比较方法结果分析 可见,第一个组合无统计学意义,而第二个组合有显著性差异。 四、多因素方差分析 多因素方差分析 一个因素(水平间独立)单因素方差分析 两个因素(水平间独立或相关)多(两)因素方差分析 一

15、个个体多个测量值重复测量资料的方差分析 目的:用这类资 料的样本信息来推断各处理组间 多 个总体均数的差别有无统计 学意义。 (一)随机区组方差分析(水平间独立两因素) 随机区组设计: 先将受试对象按条件相同或相近分成m个区 组(或配伍组),每个区组有k个受试对象, 再将其随机地分配到k个处理组中,称之为随 机区组设计,属于两因素方差分析。 区组(B)处理因素(A) X11X21Xk1 区组1X12X22Xk2 区组2X13X23Xk3 区组mX1mX2mXkm 总变异分解 SS总=SS组间+SS组内(完全随机) SS总=SS组间+(SS区组+SS组内)(随机区组 ) 在存在着区组的情况下,随机区组 设计的方差分析效率要高于单因素 方差分析 计算公式 总变异: ,自由度N-1。 处理组变异: ,自由度k-1 区组变异:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号