《方差分析》ppt课件-2

上传人:tia****nde 文档编号:69567651 上传时间:2019-01-14 格式:PPT 页数:95 大小:5.86MB
返回 下载 相关 举报
《方差分析》ppt课件-2_第1页
第1页 / 共95页
《方差分析》ppt课件-2_第2页
第2页 / 共95页
《方差分析》ppt课件-2_第3页
第3页 / 共95页
《方差分析》ppt课件-2_第4页
第4页 / 共95页
《方差分析》ppt课件-2_第5页
第5页 / 共95页
点击查看更多>>
资源描述

《《方差分析》ppt课件-2》由会员分享,可在线阅读,更多相关《《方差分析》ppt课件-2(95页珍藏版)》请在金锄头文库上搜索。

1、方差分析,analysis of variance,11.意义 前一章介绍了2个样本均数比较的假设检验方法,但对于3个、4个、5个均数或更多个的比较,t检验或u检验就无能为力了,或许有人会想起将几个均数两两比较分别得到结论,再将结论综合,其实这种做法是错误的。试想假设检验时通常检验水平取0.05,亦即弃真概率控制在0.05以内,但将3个均数作两两比较,要作三次比较,可靠度成为 (1-0.05)3=0.857,一方差分析的基本思想,四均数比较作6次 (1-0.05)6=0.735 五均数比较作10次 (1-0.05)10=0.599 六均数比较作15次 (1-0.05)15=0.463 鉴于以上

2、的原因,对多组均数的比较问题我们采用方差分析(analysis of variance),简称ANOVA。 方差分析采用F检验统计量,也称F检验。,关于记号 xij表示第 I 组第 j 个样本观察值,,2基本思想,表示第i组的均数(= ), 表示总平均=,例1 某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同? 患者x1:0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 健康人x2:0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.

3、34 1.35 1.48 1.56 1.87,24名患者与健康人的血磷值大小不等,称这种变异为总变异。可以用总离均差平方和及N来反映 SST= 总自由度 T=N-1。,2组样本均数不等,这种变异称为组间变异,反映了克山病对血磷值的影响和随机误差,2个组各组内部血磷值也不等,这种变异称为组内变异,其大小可用2组组内离均差平方和及各组例数ni来反映. 自由度E=N-k(k是组数),它反映了随机误差。,SST=SSA+SSE T=A+E,3三者关系,4直观意义,检验统计量 F统计量具2个自由度: 1, 2 F(, 1, 2 ),分析思路,如果两组样本来自同一总体,即克山病患者与健康人血磷值相同,则理

4、论上F应等于1,因为两种变异都只反映随机误差。由于抽样误差的影响,F值未必是1,但应在1附近。 若F较小,我们断定2组均数相同,或者说来自同一总体; 若F较大,推断不是来自同一总体。 评判标准以界值为准, 不受比较的组数限制。 可同时分析多个因素的作用。 可分析因素间的交互作用。,5优点, 各样本是相互独立的随机样本 各样本来自正态总体 各组总体方差相等,即方差齐,6应用条件,例 某社区随机抽取了30名糖尿病患者、IGT异常和正常人进行载脂蛋白(mg/dL)测定,结果如下,问三种人的载脂蛋白有无差别?,二完全随机化设计(成组设计)的多个样本均数比较,n1=11 n2=9 n3=10 N=30,

5、所有人的载脂蛋白的变异可分解为两部分: 组内变异(SSE),反映载脂蛋白测定值的随机误差和个体差异; 组间变异(SSA),反映随机误差和不同的生理病理状态对载脂蛋白的影响。,(1)建立假设和确定检验水平 H0: 三种人载脂蛋白的总体均数相等, 1=2=3 H1: 三组总体均数不相等 =0.05 (2)计算 C=(x) 2/N=(3309.5) 2/30=365093 SST=x2-C=372974.87-365093=7881.87,SSE=SST-SSA=7881.87-2384.026=5497.84 T=N-1=29 A=k-1=2 E=N-k=30-3=27 MSA=SSA/A =11

6、92.01 MSE=SSE/E =203.62 F=MSA/MSE=5.8540,(3) 作出推断结论 查F表:F(0.05, 2,27)=3.35, F(0.01, 2,27)=5.49 按=0.01水平,拒绝H0,接受H1,认为三种人载脂蛋白的总体均数不同(差异极显著)。,得到方差分析表,查表确定P值:,SST,SSA,SSE,随机区组设计又称配伍组设计(Random Block Design)。 在农业中如要比较3种化肥的效果,即要比较施用不同化肥对农作物产量的影响,可以抽取若干块试验田,分成3组,每组施用一种肥料,但是地有贫瘠之分,如果某组分得的地都是瘦地,即使所施化肥效果好,但从农作

7、物产量上也反映不出来,此时应将地的肥沃程度考虑进去,以消除田地的影响,这种因素称作区组因素。,三随机区组设计的方差分析,例3 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果,采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。 现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)如下,问小白鼠经三种不同营养素喂养后所增体重有无差别?,本例的总变异中除了不同营养素的变异(处理差异)、随机误差外,还存在着区组之间的变异,是由小白鼠的遗传特征不同所致。 xij表示第i个处理组第j个区组样本观察值, 表示第i个处理

8、组的均数(= ), 表示第j个区组的均数(= ), 表示总平均=,SS总=SS处理+SS区组+SS误差,=,总=处理+区组+误差 (T=A+B+E) 总=T=N-1=bk-1 处理=A=k-1 区组=B = b-1 误差=E =(k-1)(b-1),(1) 建立假设和确定检验水准 H0: 1=2=3 H1: 三组总体均数不相等 =0.05 (2) 计算检验统计量 C=(x)2/N=(1335.9)2/24=74359.53 SST=xij 2-C=2681.84 T=N-1=23,3个处理,8个区组,查F表:F(0.05, 2,14)=3.74, F(0.01, 2,14)=6.51 F(0.

9、05, 7,14)=2.76, F(0.01, 7,14)=4.28,1) 按=0.05水平不拒绝H0,认为小白鼠经三种不同营养素喂养后所增体重无差别。(不同处理组间) 2) 按=0.01水平不拒绝H0,认为不同窝别的小白鼠的增重不全相等。 (不同区组间) 注:作方差分析时同样可以检验区组效应,本例区组效应显著,即不同窝别的小白鼠的增重不全相等。,(3)查表确定p值和作出推断结论,例 某湖水不同季节的氯化物含量测定值如下,问在不同季节该湖水中氯化物含量有无差别?,要区别完全随机化设计和随机区组设计,某湖水中不同季节氯化物含量测定值(mg/L),完全随机设计,某湖水中不同季节氯化物含量测定值(m

10、g/L),随机区组设计,例 某医师为研究脾切除手术过程中门静脉压力kPa的变化,测得以下数据,试作分析。,方法不当会影响统计结果,脾切除手术中不同时期的门静脉压力kPa,Analysis of Variance Procedure Sum of Mean Source DF Squares Square F Value Pr F GROUP 2 0.4281 0.2141 0.20 0.8198 Error 21 22.4065 1.0670 Corrected Total 23 22.8346,结论:,完全随机设计,随机区组设计,1多个样本均数间每两个均数的比较 适用于:在研究设计阶段未预先

11、考虑或未预料到,经数据结果的提示后,才决定的多个均数间的两两比较,常见于探索性研究。 采用的检验方法称为最小显著极差法(LSR法) 常用方法: (1)q检验(又称Student-Newman-Keuls法,简称SNK法) (2)新复极差检验(SSR法, Duncan法),四.多个样本均数间的两两比较(又称多重比较),检验统计量 q检验界值表, 它有两个自由度,一个是=E,另一个是a,a指将方差分析中的几组样本均数按从小到大顺序排列后要比较的A、B两组所包含的组数(包含A、B两组本身)。,q检验,H0: 任2个人群的载脂蛋白的总体均数相等,即A=B H1: AB 将3组样本均数从小到大(或从大到

12、小)顺序排列,并编上组次 组次 1 2 3 均数 102.39 105.45 122.80 组别 IGT异常 糖尿病患者 正常人,例(续例3)对三个人群的载脂蛋白作两两比较。,三组均数比较的q检验,从p值一栏中可以推断出结论,即IGT异常与正常人的载脂蛋白有差别, 糖尿病患者与正常人的载脂蛋白有差别。,=E,有时并不需要将几组均数都一一作比较,而只须将对照组与几个实验组作比较。常用的方法有: 最小显著差数法(LSD法),实质为两个均数比较的t检验法(查t表).,2多个实验组与一个对照组均数间的两两比较,=E,IGT异常与糖尿病患者的比较 H0:1=2 H1: 12 =0.05 p0.05, 认

13、为二者无差别,例(续例2),IGT异常与正常人的比较 H0:2=3 H1: 23 =0.05 =27 查t表 t(0. 05,27)=2.052 t(0. 01,27)=2.771 0.002p0.005, 认为二者有差别,当处理组k=2时,LSD法和q检验方法尺度相同; 当处理组k3时,LSD法和q检验方法尺度不同; LSD法较低,而q检验方法较高. 在实际工作中,要求精度高的用q检验,实验组与对照相比用LSD法.,多重比较方法的比较,标记字母法,多重比较的表示方法,梯形法,多重比较的表示方法,求出变异平方和与自由度; 列出方差分析表,进行F检验; 若F检验差异显著,进行多重比较.,方差分析

14、的基本步骤,五多个方差的齐性检验,方差分析中要求各总体的方差相等,所以在作方差分析前,应作多个方差的齐性检验,通常用Bartlett法,检验统计量为:,ni为各组样本例数,k为组数 N=ni si2 为各组方差, sc2为合并方差。,基本思想:假设各总体方差相等,均等于合并方差(各组方差的加权平均),则各si2与sc2相差不会很大,出现大的x2值的概率P小, 若P,拒绝方差相等的假设, P值可查 P208的x2界值表。 方差不齐时不宜作方差分析,解决方法有:(1)变量变换,使方差齐 (2) 秩和检验 (3) 近似F检验,方差分析和t检验要求:方差齐性、正态分布。 有时并不能满足,上节已介绍了3

15、种不同的方法。通过变量变换来改变原数据分布形式,使之满足上述条件,经过变换,虽然分布形式已改变,但数据之间的相对关系仍保留,可以用变换后的数据作统计分析。,六变量变换,1 平方根变换 y=,适用于各组方差与其均数之间有某种比例关系的资料,尤其适用于总体呈Poisson分布的资料,如放射性物质在单位时间内的放射次数等表现为稀有现象的计数资料。,适用于各组标准差与其均数之间有某种比例关系的资料,如研究动物的体重等资料,尤其是关于生长率的资料。 当数据中有0或较小值时,也可y=lg(x+1),2.对数变换 y=lg x,A 1:160 1:160 1:320 1:320 1:640 1:640 1:640 1:640 1:640 1:1280 B 1:80 1:160 1:160 1:160 1:160 1:320 1:320 1:320 1:320 1:640 C 1:40 1:80 1:80 1:80 1:160 1:160 1:160 1:160 1:320 1:320,某实验室用三种不同抗原对恶性虐原虫阳性患者间接荧光抗体的测定结果如下,问三种抗原测定结果之间的差别有

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号