667编号医学统计学(方差分析)

上传人:玩*** 文档编号:145835887 上传时间:2020-09-23 格式:PPT 页数:61 大小:2.08MB
返回 下载 相关 举报
667编号医学统计学(方差分析)_第1页
第1页 / 共61页
667编号医学统计学(方差分析)_第2页
第2页 / 共61页
亲,该文档总共61页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《667编号医学统计学(方差分析)》由会员分享,可在线阅读,更多相关《667编号医学统计学(方差分析)(61页珍藏版)》请在金锄头文库上搜索。

1、19名要求持续镇痛的病人被随机分到四组,接受同剂量的吗啡,6小时后测量血中游离吗啡水平,问四组之间有无差别?,用什么检验方法?,总体样本?,已知多组样本的信息 推断多个总体的信息(均数),统计推断,随机抽样,参数?,统计量,( 、),(x、s、p),参数估计 假设检验,方差分析 ANOVA,ANALYSIS OF VARIANCE,第6章,均方分析,变异数分析,F 检验(由英国著名统计学家R.A.Fisher推导出来的),是对变异的来源及大小进行分析的一种统计方法。,教学目的与要求,掌握: 1、方差分析的基本思想 2、方差分析前提条件 3、多重比较 4、重复测量资料方差分析 了解: 1、两因素

2、方差分析,教学内容提要,重点讲解: 方差分析的基本思想 完全随机设计的单因素方差分析 多个样本均数间的多重比较 介绍:方差分析的原理与条件,不同的是:方差分析用于多个均数的比较。,与前面讲过的假设检验相同的是:,方差分析的任务:统计量F的计算 FMS1/MS2,t检验是用 t值进行假设检验,方差分析则用F值进行假设检验,方差分析的基本概念,7,方差分析的几个概念和符号,什么是方差? 离均差 离均差之和 离均差平方和(SS) 方差(2 S2 )也叫均方(MS) 标准差:S 自由度: 关系: MS= SS/ ,方差分析的基本概念,方差分析的几个符号,xij表示第i组第j个观察值,表示第i组的均数(

3、= ) 表示总平均=,基本思想:先假设(H0)各总体均数全相等;将总变异SS总,按设计和资料分析的需要分为两个或多个组成部分,其自由度也相应地分为几个部分,以随机误差为基础,按F分布的规律作统计推断。,目的:推断总体平均数是否相等. 独特之处:不直接比较均数,利用变异的关系进行判别.,第一节 完全随机设计资料的方差分析,(单因素方差分析),一、方差分析的意义 前一章介绍了两个样本均数比较的假设检验方法,但对于3个、4个、5个均数或更多个的比较,t检验或u检验就无能为力了,或许有人会想起将几个均数两两比较分别得到结论,再将结论综合,其实这种做法是错误的。试想假设检验时通常检验水平取0.05,亦即

4、弃真概率控制在0.05以内,但将3个均数作两两比较,要作三次比较,可信度成为 (1-0.05)3=0.857,四均数比较作6次 (1-0.05)6=0.735 五均数比较作10次 (1-0.05)10=0.599 六均数比较作15次 (1-0.05)15=0.463 鉴于以上的原因,对多组均数的比较问题我们采用方差分析,例1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同? 患者x1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人x2:0.54 0.64

5、 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87,二、单因素方差分析的基本思想,24名患者与健康人的血磷值大小不等,称这种变异为总变异。可以用总离均差平方和 及N来反映,总自由度 T=N-1。,SS总,2个组各组内部血磷值也不等,这种变异称为组内变异,其大小可用2组组内离均差平方和 及各组例数ni来反映,自由度组内=N-k(k是组数),它反映了随机误差。,SS组内 ,2组样本均数也不等,这种变异称为组间变异,反映了克山病对血磷值的影响和随机误差,组间变异(between groups variation): SS组间,v组间k1,三

6、者关系,SS总=SS组间+SS组内 v总=组间+组内,直观意义,检验统计量 F统计量具2个自由度: v1, v2,如果两组样本来自同一总体,即克山病患者与健康人血磷值相同,则理论上F应等于1,因为两种变异都只反映随机误差。由于抽样误差的影响,F值未必是1,但应在1附近。若F较小,我们断定2组均数相同,或者说来自同一总体,F较大,推断不是来自同一总体。,三、优点, 不受比较的组数限制。 可同时分析多个因素的作用。 可分析因素间的交互作用。,四、方差分析的应用条件,各样本是相互独立的随机样本 各样本来自正态总体 各组总体方差相等,即方差齐,【例题1】,某社区随机抽取糖尿病患者、IGT异常和正常人共

7、30人进行载脂蛋白测定,结果如下,问3种人的载脂蛋白有无差别? 问题:1、分析问题,选择合适的统计方法 2、如何整理资料、输入计算机,列举存在的变异及意义,全部的30个实验数据之间大小不等,存在变异,总变异。 各个组间存在变异:反映处理因素之间的作用,以及随机误差。 各个组内个体间数据不同:反映了观察值的随机误差。 各种变异的表示方法,各种变异的表示方法,SS总 总 MS总,SS组内 组内 MS组内,SS组间 组间 MS组间,三者之间的关系: SS总= SS组内+ SS组间 总= 组内+ 组间,统计量F 的计算及其意义,F=MS组间/MS组内 自由度: 组间=组数-1 组内=N-组数 通过这个

8、公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。,各种符号的意义,xij第i 个组的第j 个观察值 i=1,2,k j=1,2,ni ni第i 个处理组的例数 ni=N xi = x =,(x)2,(1)建立假设和确定检验水准 H0: 三种人载脂蛋白的总体均数相等, 1=2=3 H1: 三组总体均数不相等或不全等 =0.05 (2)计算 C=(x) 2/N=(3309.5) 2/30=365093 SS总=x2-C=372974.87-365093=7881.87,SS组内=SS总-SS组间=7881.87-2384.026=5497.84 总=N-1=29, 组间

9、=k-1=2, 组内=N-k=30-3=27 MS组间=SS组间/组间 =1192.01 MS组内=SSE/组内 =203.62 F=MS组间/MS组内=5.8540,(3)查方差分析F界值表8确定P值: F 0.05(2,30) =3.32 ; F 0.01(2,30) =5.39,(4) 作出推断结论 按=0.05水平拒绝H0,接受H1,认为三种人载脂蛋白的总体均数不同。,组间,组内,完整书写方差分析的过程,建立假设,确定显著性水平: H0 :3种载脂蛋白的总体均数相等 1 = 2 = 3 H1 :3种载脂蛋白的总体均数不相等或不全相等 H1与H0相反,如果H0被否决,则H1成立。 常取0

10、.05,区分大小概率事件的标准。 计算统计量F:根据资料的性质选择不同的统计方法。注意都是在H0成立的条件下进行计算。 计算概率值P:P的含义。 做出推论:统计学结论和专业结论。,四组不同摄入方式人的血浆游离吗啡水平,单因素方差分析,完整书写方差分析的过程,建立假设: H0 :4组病人血浆游离吗啡水平1 = 2 = 3= 4 H1 : 4组病人血浆游离吗啡水平的总体均数全不相等或不全相等 确定显著性水平,用 表示。区分大小概率事件的标准,常取0.05。 计算统计量F: F=MS组间/MS组内 根据资料的性质选择不同的统计方法。注意都是在H0成立的条件下进行计算。 计算概率值P:P的含义。 做出

11、推论:统计学结论和专业结论。,单因素方差分析,方差分析表(练习,完成该表。例题,写在黑板上),单因素方差分析,F0.05(3,15)3.29,F与它所对应的P值成反比,结合上题理解:方差分析的基本思想,将全部观察值总的离均差平方和( SS总)及自由度( 总)分解为两个或多个部分 除随机误差外,其余每个部分的变异可由某个因素的作用加以解释 通过比较不同来源变异的均方(MS),借助F分布做出统计推断,从而了解该因素对观察指标有无影响。,存在问题,方差分析结果提供了各组均数间差别的总的信息,但尚未提供各组间差别的具体信息,即尚未指出哪几个组均数间的差别具有或不具有统计学意义。 为了得到这方面的信息,

12、可进行多个样本间的两两比较。,第二节 多个样本均数间的两两比较(又称多重比较),多重比较即多个样本均数间的两两比较,由于涉及的对比组数大于2,若仍用t 检验作每两个对比组比较的结论,会使犯第一类错误的概率增大,即可能把本来无差别的两个总体均数判为有差别。 4个样本均数间的比较,多重比较方法(两两比较),对满足正态性和方差齐性的资料: 多个实验组分别与一个对照组比较常用Dunnet-t法。 每两个均数比较常用最小显著差值法(LSD-t)、SNK(Student-Newman-Keuls,即q检验)法、Tukey(可靠显著差异)法、Bonferroni-t(校正最小显著差异)调整法等。 对不满足正

13、态性和方差齐性的资料:可通过数据变换,使满足方差分析的应用条件。可用非参数检验法,如秩和检验。可采用近似检验,如Tamhanes T2,Dunnetts T3,Games-Howell,Dunnetts C等方法。,检验统计量 q检验界值表见附表10,它有两个自由度,一个是m(k),m指将方差分析中的几组样本均数按从小到大顺序排列后要比较的A、B两组所包含的组数(包含A、B两组本身);另一个是=e。,误差,一、q检验(又称Student-Newman-Keuls法,简称SNK-q检验法),常用于多个样本均数间每两个均数的比较。,例(续例3)对三个人群的载脂蛋白作两两比较。,(1) 建立假设,确

14、定检验水准 H0: 任2个人群的载脂蛋白的总体均数相等,即A=B H1: AB , =0.05。 (2) 样本均数排序 将3组样本均数从小到大(或从大到小)顺序排列,编上组次,并注上组别. 组次 1 2 3 均数 102.39 105.45 122.80 组别 IGT异常 糖尿病患者 正常人,(3)列出两两均数比较的q检验计算表,从p值一栏中可以推断出结论,即IGT异常(1)与正常人(3)的载脂蛋白有差别, 糖尿病患者(2)与正常人(3)的载脂蛋白有差别。,二、LSD- t 检验,由Fisher提出,称为最小显著性差异法。 在H0:ij假设下,t统计量检验i与j是否相同。 ,(dfdfe) (

15、6-9),可查统计附表7确定概率P的大小。,常用于多个样本均数间每两个均数的比较。,三、 Dunnett-t检验,常用于多个实验组与一个对照组均数间的两两比较。,实验组,对照组,可查统计附表9确定概率P的大小。,四、Bonferroni-t检验,Bonferron t= (6-12),假设比较次数为m,则=b/m作为每次比较的水平。,调整检验水准法,例 题,对小白鼠喂以A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表, 问3种不同营养素喂养后所增体重有无差

16、别?,方法:应用分层的思想,事先将全部受试对象按某种或某些特性分为若干个区组,使每个区组内的观察对象与研究对象的水平尽可能相近 目的:减少了个体间差异对结果的影响,比成组设计更容易检验出处理因素间的差别,提高了研究效率。 是配对资料的扩充。,双因素方差分析,第三节 随机区组(配伍组)设计的多个样本均数的比较(双因素方差分析),例 题,对小白鼠喂以A、B、C三种不同的营养素,了解不同营养素的增重效果。以窝别作为区组特征,以消除遗传因素对体重增长的影响。现将同系同体重的24只小白鼠分为8个区组,每组3只。3周后测量增重结果,结果如下表, 问3种不同营养素喂养后所增体重有无差别?,分析变异,总变异 组间变异 误差(组内)变异 配伍间变异,SS总 总,SS误差 误差 MS误差,SS组间 组间 MS组间,变异之间的关系: SS总= SS误差+ SS组间+ SS区间 总= 误差+ 组间+区间,变

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号