研究生统计学讲义第3讲第4章正态性检验和方差齐性检验

上传人:人*** 文档编号:578459806 上传时间:2024-08-24 格式:PPT 页数:28 大小:256KB
返回 下载 相关 举报
研究生统计学讲义第3讲第4章正态性检验和方差齐性检验_第1页
第1页 / 共28页
研究生统计学讲义第3讲第4章正态性检验和方差齐性检验_第2页
第2页 / 共28页
研究生统计学讲义第3讲第4章正态性检验和方差齐性检验_第3页
第3页 / 共28页
研究生统计学讲义第3讲第4章正态性检验和方差齐性检验_第4页
第4页 / 共28页
研究生统计学讲义第3讲第4章正态性检验和方差齐性检验_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《研究生统计学讲义第3讲第4章正态性检验和方差齐性检验》由会员分享,可在线阅读,更多相关《研究生统计学讲义第3讲第4章正态性检验和方差齐性检验(28页珍藏版)》请在金锄头文库上搜索。

1、第五章第五章正态性、方差齐性检验、变量变换、正态性、方差齐性检验、变量变换、t检验检验一、一、正态性检验(正态性检验(P58页)页)正态性检验正态性检验(testofnormality)的目的是检验资料是否的目的是检验资料是否服从正态分布,确定样本是否来自正态分布的总体。服从正态分布,确定样本是否来自正态分布的总体。例例4.1判断例判断例3.1资料的数据文件血糖的正态性。资料的数据文件血糖的正态性。H0:总体服从正态分布,总体服从正态分布,H1:总体不服从正态分布。总体不服从正态分布。使用使用SPSS统计软件打开数据文件统计软件打开数据文件L1101.sav以后,如用以后,如用1-Sample

2、K-STest法(柯尔莫哥诺夫法(柯尔莫哥诺夫-斯米尔诺夫检验)斯米尔诺夫检验):用统计软件不方便时,否定正态性的方法最简单的是用统计软件不方便时,否定正态性的方法最简单的是将均数与中位数及标准差进行比较,均数与中位数两将均数与中位数及标准差进行比较,均数与中位数两者不等且相差较大时,分布不对称;标准差大于均数者不等且相差较大时,分布不对称;标准差大于均数时,表示数据分散,曲线时,表示数据分散,曲线“矮、胖矮、胖”,峰平阔,与正,峰平阔,与正态峰度不同。这类资料,可以判定不符合正态分布态峰度不同。这类资料,可以判定不符合正态分布。非偏态资料不一定具有正态峰,均数近于中位数或非偏态资料不一定具有

3、正态峰,均数近于中位数或标准差小于均数的资料也不一定都符合正态分布。标准差小于均数的资料也不一定都符合正态分布。但对但对t 检验或方差分析法来说,当变量值检验或方差分析法来说,当变量值x 有正有负有正有负时,一般可用时,一般可用3S+3S 范围内是否包括了该批数范围内是否包括了该批数据的最小值与最大值作出判断,当最小值与最大值均在据的最小值与最大值作出判断,当最小值与最大值均在此范围之间时,可用此范围之间时,可用S描述分布特征,可用描述分布特征,可用t 检验或检验或方差分析法作统计推断。当方差分析法作统计推断。当xi 符号相同,符号相同,n=1020时,时,若若2S,可用可用S描述分布特征,可

4、用描述分布特征,可用t 检验或方差检验或方差分析法作统计推断;若分析法作统计推断;若2S略大于略大于,一般地说,仍可,一般地说,仍可用用t 检验或方差分析法作统计推断;若检验或方差分析法作统计推断;若2s则不可按则不可按正态分布处理,不宜用正态分布处理,不宜用S描述分布特征描述分布特征,不用不用t 检验检验或方差分析法作统计推断。或方差分析法作统计推断。 二、二、 方差齐性检验方差齐性检验 总体方差相等(即差异无统计学意义),称为方差总体方差相等(即差异无统计学意义),称为方差齐性(齐性(homogeneityofvariance).方差齐性检验(方差齐性检验(testforhomogenei

5、tyofvariance)是是利用理论上来自正态分布的总体的各样本信息,来推断利用理论上来自正态分布的总体的各样本信息,来推断它们的总体方差是否相等。它们的总体方差是否相等。方差齐性检验主要用于:方差齐性检验主要用于:两组或多组间变异度的两组或多组间变异度的比较;比较;两个或多个样本均数间比较时,须先进行方两个或多个样本均数间比较时,须先进行方差齐性检验,若方差齐,可用差齐性检验,若方差齐,可用t 检验或方差分析,否检验或方差分析,否则可用变量变换的方法,使之方差齐后再用则可用变量变换的方法,使之方差齐后再用t 检验或检验或方差分析,或用对方差没有特别要求的方差分析,或用对方差没有特别要求的t

6、检验或其他检验或其他非参数的统计方法。非参数的统计方法。1、两样本或样本方差的齐性检验、两样本或样本方差的齐性检验SPSS统计软件采用的方差齐性检验方法是统计软件采用的方差齐性检验方法是Levene检验法,它可以用于两个以上方差,也可以用于两方检验法,它可以用于两个以上方差,也可以用于两方差的齐性检验,统计量为差的齐性检验,统计量为F 值。值。如果如果F0.05,在在=0.05水平上不拒绝水平上不拒绝H0,认为方差齐性。认为方差齐性。如果如果F0.05FF0.01,则则0.013时,一时,一般不满足方差齐性。般不满足方差齐性。三、三、 变量变换(变量变换(P40P40页)页) 变量变换即将原始

7、数据转换成某种函数值,目的是变量变换即将原始数据转换成某种函数值,目的是使变换后的数据达到统计分析要求。例如运用方差分使变换后的数据达到统计分析要求。例如运用方差分析作多个均数间的比较时,要求各样本数据具有正态析作多个均数间的比较时,要求各样本数据具有正态性、方差齐性和处理效应可加性。样本数据稍微偏离性、方差齐性和处理效应可加性。样本数据稍微偏离上述性质还是允许的。如果严重的偏离上述三个条件,上述性质还是允许的。如果严重的偏离上述三个条件,则不能直接用方差分析。解决问题的办法之一是进行则不能直接用方差分析。解决问题的办法之一是进行变量变换,往往经过某种变换改变三个条件其中之一变量变换,往往经过

8、某种变换改变三个条件其中之一时,可使其余两者都有所改善,因而可利用变换值进时,可使其余两者都有所改善,因而可利用变换值进行方差分析及组间两两比较和可信区间的计算行方差分析及组间两两比较和可信区间的计算医药统计中变量变换的方法很多,如:对数变换、医药统计中变量变换的方法很多,如:对数变换、平方根变换、倒数变换、反正弦变换、平方根变换、倒数变换、反正弦变换、logit变换、概率变换、概率单位变换等。注意:要根据变换的目的和原数据的性单位变换等。注意:要根据变换的目的和原数据的性质、分布特征、特别是变换后的效果选择变量变换的质、分布特征、特别是变换后的效果选择变量变换的方法。方法。1对数变换对数变换

9、:以原始数据的对数值作为统计分析的以原始数据的对数值作为统计分析的变量值,称为对数变换。变量值,称为对数变换。2平方根变换平方根变换:以原数据的平方根作为统计分析的以原数据的平方根作为统计分析的变量值,称平方根变换变量值,称平方根变换3倒数变换倒数变换 4平方根反正弦变换平方根反正弦变换第四节第四节t 检验检验二、样本均数与总体均数的比较二、样本均数与总体均数的比较样本均数与已知总体均数样本均数与已知总体均数(一般为理论值、标准值或一般为理论值、标准值或经过大量观察所得的稳定值等经过大量观察所得的稳定值等)比较的目的,是推断样比较的目的,是推断样本均数与已知总体均数的差别有无统计学意义,即推断

10、本均数与已知总体均数的差别有无统计学意义,即推断样本所代表的未知总体均数样本所代表的未知总体均数( )与已知总体均数与已知总体均数( 0)是否相等。针对资料的不同情况,方法如下:是否相等。针对资料的不同情况,方法如下:(1)未知时的小样本正态分布资料,可用未知时的小样本正态分布资料,可用t 检验,检验,检验统计量的计算公式为:检验统计量的计算公式为:自由度自由度df=n1(5.11)(2)正态分布的资料,大样本或样本虽小但总体标准正态分布的资料,大样本或样本虽小但总体标准差差已知时,可用已知时,可用u 检验:检验:(5.12)(3)不服从正态分布或分布类型未知的资料,可用非参不服从正态分布或分

11、布类型未知的资料,可用非参数检验,也先可作变量变换,转换为正态分布资料处数检验,也先可作变量变换,转换为正态分布资料处理。理。例例4.7已知野生人参中已知野生人参中M物质的含量服从正态分布,物质的含量服从正态分布,=63.5g。今今9次测得一起人工培植人参中次测得一起人工培植人参中M物质的含物质的含量量(g)为为40.0,41.0,41.5,41.8,42.4,43.1,43.5,43.8,44.2。这起人工培植人参中。这起人工培植人参中M物质的含量与野物质的含量与野生人参是否相同?生人参是否相同?(1)H0:=63.5 g,即人工培植人参中即人工培植人参中M物质的含物质的含量与野生人参相同;

12、量与野生人参相同;H1:63.5 g,即人工培植人即人工培植人参中参中M物质的含量与野生人参不同。物质的含量与野生人参不同。=0.05(2)计算检验统计量计算检验统计量t 值:值:df=91=8(3)确定确定P 值和作为推断结论:查值和作为推断结论:查t 界值表(附表界值表(附表3),),得得t0.05(8)=2.306,t0.01(8)=3.355,现现tt0.018),P0.01,拒绝拒绝H0,可认为人工培植人参中可认为人工培植人参中M物质的含量与野物质的含量与野生人参不同。生人参不同。如使用如使用SPSS11.5统计软件,在数据编辑窗的变量窗统计软件,在数据编辑窗的变量窗口以口以x为变量

13、名,在其为变量名,在其Label(变量标签)中标签变量标签)中标签M物物质的含量,在数据窗口输入质的含量,在数据窗口输入M物质的含量的数据,建物质的含量的数据,建立数据文件立数据文件L5.4.sav格式与格式与L3.3.sav相同。采用相同。采用One-SampleTTest(单样本单样本t检验)过程进行统计分析。检验)过程进行统计分析。操作过程:操作过程:AnalyzeCompareMeansOne-SampleTTest,将将M物质的含量物质的含量x选入选入Testvariables(检验变量检验变量)框中,在)框中,在TestValue(检验值检验值)对话框)对话框中改原系统默认值中改原

14、系统默认值0为检验值为检验值63.5(如图(如图5-5),),OK。输出结果:输出结果:One-SampleStatistics NMeanStd. DeviationStd. Error MeanM物质含量942.36671.40446.46815如图如图5-6,n=9,差别的均数差别的均数=42.3667,标准差,标准差S=1.40446,标准误标准误=s/=0.46815;One-SampleTestTestValue=63.5tdfSig.(2-tailed)MeanDifference95%ConfidenceIntervaloftheDifferenceLowerUpperX-45

15、.1428.000-21.1333-22.2129-20.0538 t 检验统计量检验统计量=45.142,自由度,自由度df=8,双侧双侧P=0.0000.05,可认为人工培植人参中可认为人工培植人参中M物质的含量与物质的含量与野生人参不同。同时,由野生人参不同。同时,由95%ConfidenceIntervaloftheDifference(差别的差别的95%可信区间可信区间)为为(-22.2129,-20.0538),不包含,不包含63.5,也可以认为人工培植人参中物,也可以认为人工培植人参中物质的含量与野生人参不同。质的含量与野生人参不同。三、三、配对设计的均数比较配对设计的均数比较(

16、配对配对t 检验检验)配对设计实验的均数比较,满足正态性时,可用配对设计实验的均数比较,满足正态性时,可用配对配对t 检验;不满足正态性时,可用非参数检验,检验;不满足正态性时,可用非参数检验,也可以作变量转换使达到正态性后,用也可以作变量转换使达到正态性后,用t 检验。本检验。本节介绍配对节介绍配对t 检验法。假设配对差值检验法。假设配对差值d 的总体均数的总体均数d为为0,推断配对差值的样本均数与,推断配对差值的样本均数与0之间的差异有之间的差异有无显著性而作出判断。检验统计量为:无显著性而作出判断。检验统计量为:自由度自由度df=n1P64例例4.8为研究三棱莪术液的抑瘤效果,将为研究三

17、棱莪术液的抑瘤效果,将20只小白只小白鼠配成鼠配成10对,然后将每对中的两只小白鼠随机分到实对,然后将每对中的两只小白鼠随机分到实验组和对照组中,两组动物都接种肿瘤,实验组在验组和对照组中,两组动物都接种肿瘤,实验组在对对子子号号对照对照组组x实验实验组组yd=xy123456789103.64.54.24.43.75.67.04.15.04.53.02.32.41.14.03.72.71.92.61.30.62.21.83.3-0.31.94.32.22.43.2合合计计n=10,d=21.6(1) 建立假设和确定检验水准建立假设和确定检验水准H0:d =0,H1:d0.=0.05(2)计算

18、检验统计量计算检验统计量t值:值:(3)确定确定P 值和作出结论:值和作出结论:据自由度据自由度df=n1=9查查t 界值界值表(附表表(附表5),双侧),双侧t0.001(9)=4.78,tt0.001(9),P 0.001,拒绝拒绝H0,接受接受H1。可认为三棱莪术液有抑瘤效可认为三棱莪术液有抑瘤效果。果。如使用统计软件,在如使用统计软件,在数据编辑窗的变量窗口数据编辑窗的变量窗口分别以实验组和对照组分别以实验组和对照组为变量名,在数据窗口为变量名,在数据窗口键入实验组和对照组数键入实验组和对照组数据,建立数据文件据,建立数据文件L4.5.sav如图,采用如图,采用Paired-Sampl

19、eTTest(配对样本配对样本t检验)过程,检验)过程,操作过程:操作过程:输出结果:如图,差值输出结果:如图,差值=2.1600,标准差,标准差S1.321,标准误标准误=0.41772,统计量,统计量t =5.171,自由度自由度df=9,双双侧侧P=0.001,拒绝拒绝H0,接受接受H1。四、四、完全随机设计资料的两均数比较(成组完全随机设计资料的两均数比较(成组t检验)检验)(一)、正态分布资料的两小样本均数比较(一)、正态分布资料的两小样本均数比较 1.H0:12=0;H1:120,=0.05t (n1+n22)当两样本含量相等当两样本含量相等n1=n2=n时,上式可化简为:时,上式

20、可化简为:其中其中2.方差不齐的两小样本均数比较,可采用方差不齐的两小样本均数比较,可采用t检验,检验检验,检验统计量为统计量为t值:值:校正校正t值不服从自由度值不服从自由度df=n-1的的t分布,自由度分布,自由度df为:为:例例4.9某医师研究转铁蛋白测定对病毒性肝炎诊断的临某医师研究转铁蛋白测定对病毒性肝炎诊断的临床意义,测得床意义,测得12名正常人和名正常人和15名病毒性肝炎患者血清名病毒性肝炎患者血清转铁蛋白含量的结果如下,已检验两组方差相等,问转铁蛋白含量的结果如下,已检验两组方差相等,问患者和健康人转铁蛋白含量是否有差异。患者和健康人转铁蛋白含量是否有差异。正常人正常人(x1,

21、n1=12):265.4,271.5,284.6,291.3,254.8,275.9,281.7,268.6,264.1,273.2,270.8,260.5病毒性肝炎患者病毒性肝炎患者(x2,n2=15):256.9,235.9,215.4,251.8,224.7,228.3,231.1,253.0,221.7,218.8,233.8,230.9,240.7,260.7,224.4H0:1=2,即正常人与病毒性肝炎患者的转铁蛋白即正常人与病毒性肝炎患者的转铁蛋白含量相等;含量相等;H1:12,=0.05据自由度据自由度dfn1n221215225查查t界值表界值表(附附表表5),得,得t0.0

22、01(125)=3.725,P 0.001,按所取按所取=0.05水准水准拒绝拒绝H0,可认为病毒性肝炎患者的转铁蛋白量较低。可认为病毒性肝炎患者的转铁蛋白量较低。如使用如使用SPSS11.5统计软件,在数据编辑窗口中,分统计软件,在数据编辑窗口中,分别以观察对象和别以观察对象和x 为变量名,在观察对象的为变量名,在观察对象的Value(值标签)中标签值标签)中标签1为正常人,为正常人,2为病毒性肝炎患者;为病毒性肝炎患者;在在x的的Label(变量标签)标签变量标签)标签x 为转铁蛋白量,键为转铁蛋白量,键入相应的转铁蛋白量入相应的转铁蛋白量x数据,建立如如图数据,建立如如图5-11的数据的

23、数据文件文件L5.6.sav以后,采用以后,采用Two-SampleTTest(两样本两样本t检验)过程分析,操作过程分两步:检验)过程分析,操作过程分两步:1.先做探索性分析,检验正态先做探索性分析,检验正态性和方差齐性。性和方差齐性。 TestsofNormality转铁蛋白含量正常正常人人.11612.200(*).98612.998 观察观察对象对象Kolmogorov-Smirnov(a)Shapiro-Wilk StatisticdfSig.StatisticdfSig. 患者患者.14715.200(*).92715.245正态性检验结果,因样本含量正态性检验结果,因样本含量50

24、,宜看正常人的,宜看正常人的Shapiro-Wilk统计量统计量=0.986,P值值=0.998;患者;患者的的Shapiro-Wilk统计量统计量=0.927,P值值=0.245,均满足正态性。,均满足正态性。转铁蛋白转铁蛋白含量含量BasedonMean1.877125.183BasedonMedian1.127125.299BasedonMedianandwithadjusteddf1.127122.304.300LeveneStatisticdf1df2Sig.Basedontrimmedmean1.798125.192TestofHomogeneityofVariance四种方差齐性

25、检验结果四种方差齐性检验结果P值都大于值都大于0.05,可认为满足,可认为满足方差齐性。方差齐性。2.再做成组再做成组t检验,采用检验,采用Independent-SampleTTest过过程,操作过程:程,操作过程:(二)、非正态分布的两均数比较(二)、非正态分布的两均数比较 当资料与正态分布偏倚较大时,可用采用非参数检当资料与正态分布偏倚较大时,可用采用非参数检验验(见第见第9章章),也可用适当的变量变换,使不满足正态,也可用适当的变量变换,使不满足正态性的资料,达到参数检验的要求,再用性的资料,达到参数检验的要求,再用t 检验。检验。例例4.10为了研究补益法对预防注射的效果有无增强作为

26、了研究补益法对预防注射的效果有无增强作用,将观察值对象分两组,甲组用,将观察值对象分两组,甲组24人,用补益法加预人,用补益法加预防注射;乙组防注射;乙组22人,只用预防注射。免疫后采血,分人,只用预防注射。免疫后采血,分别测定抗体滴度,结果用滴度倒数表示如下,问两组别测定抗体滴度,结果用滴度倒数表示如下,问两组免疫效果有无差别?免疫效果有无差别?抗体滴度倒数抗体滴度倒数x: 48163264128256甲组人数甲组人数f1:4428132乙组人数乙组人数f2:3437221本例变量本例变量x的观察值呈倍数关系,不满足正态性,可的观察值呈倍数关系,不满足正态性,可用对数变换,使使达到正态性的要

27、求,再用用对数变换,使使达到正态性的要求,再用t 检验。检验。正态性检验输出结果:在正态性检验输出结果:在TestsofNormality中,输中,输出了甲组抗体滴度倒数的出了甲组抗体滴度倒数的Shapiro-Wilk统计量统计量=0.670,P=0.000;乙组乙组Shapiro-Wilk=0.650,P值值=0.000,均不满足正态性。因不满足正态性,考虑本例变量值均不满足正态性。因不满足正态性,考虑本例变量值x为等比数列的数据,所以,先将原变量作对数变换,为等比数列的数据,所以,先将原变量作对数变换,使服从正态分布。使服从正态分布。将数据文件将数据文件L5.7.sav中变量中变量x作对数变换的操作过程:作对数变换的操作过程:2.再用变换后的新变量做成组再用变换后的新变量做成组t检验检验操作过程同例操作过程同例5.6。输出结果:。输出结果:统计量统计量F=0.306,单侧单侧P =0.583。故不能认为两组的故不能认为两组的总体方差不齐;检验统计量总体方差不齐;检验统计量t=0.151,双侧双侧P=0.881;双双侧检验不拒绝侧检验不拒绝H0,不能认为两组免疫效果有差别。不能认为两组免疫效果有差别。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号