Title text should go hereEven if on two lines (but not three),,Click to edit Master text styles,,Second level,,Third level,,,第五节,,t,检验,学习目标,1.,掌握单个样本、配对样本、两个独,,立样本,t,检验的应用条件,,2.,掌握,u,检验的应用条件,,3.,假设检验的注意事项,,4.,假设检验中两类错误的区别和联系,主要内容,一、样本均数与总体均数的比较,四、正态性检验与方差齐性检验,,三、,,两样本均数的比较,五、,t,′,检验,二、配对设计均数的比较,六、,假设检验的注意事项,七、,假设检验中的两类错误,t,检验和,z,检验,t,检验的应用条件:,,z,检验应用条件:,,⑴,总体标准差,未知;,,⑵,样本含量,n,,较小(,n,≤50,),,,⑶ 样本来自,正态总体,,⑷ 两样本均数比较时方差齐,,,即,样本含量,n,较大,(,n,>,50,),,(2),n,虽小但总体标准差,,已知,,(,不常见,)应用类型:,样本均数与总体均数的比较,配对,t,检验,成组设计两样本均数的比较,一、样本均数与总体均数的比较,( One-sample test ),目的:,推断样本均数代表的未知总体均数,µ,,,,与已知总体均数,µ,0,(一般为,理论值,、,,,标准值,或经大量观察所得的,稳定值,等),,有无差别,条件:,理论上要求资料来自正态分布总体,,在,H,0,成立的前提条件下,检验统计量计算公式:,①,σ,已知或,σ,未知但,n,足够大,:,②,σ,未知且,n,较小:,例,5-1,根据大量调查得知,某地,20,岁健康成年男子平均身高为,170cm,,标准差为,8.0,cm,。
今随机抽查了该地,25,名健康成年男子,求得其身高均数为,172,cm,,标准差为,8.6,cm,,能否据此认为该地现在,20,岁成年男子平均身高与以往不同?,[,分析,],根据题意,实际是观察,25,名样本是否来自于,170cm,的总体,即比较分析,25,名样本来自该总体的可能性的大小因作者仅考虑现在男子身高是否与过去不同,故做双侧检验⑴ 建立检验假设,确定检验水准,,,H,0,:,µ,=,µ,0,=170cm,,即现在该地,20,岁男子平均,,身高与以往男子平均身高相等,,,H,1,:,µ,≠,µ,0,=170cm,,即,即现在该地,20,岁男子平均,,身高与以往男子平均身高不等,,α,= 0.05,,双侧检验,,已知,:,μ,0,= 170cm,,,,σ,= 8.0,cm,,,,,x,= 172,cm,,,n,= 25,⑵ 选定检验方法,计算检验统计量,根据题目资料类型,可见,该资料是样本与总体之间的比较,且,σ,已知可用样本,-,总体的,Z,检验依公式计算检验统计量:,⑶ 确定,P,值,作出推断结论,Z,=1.25,<,1.96,,P,>,0.05,,不拒绝,H,0,,,差异无统计学意义,可认为,现在该地,20,岁男子平均身高与以往相同,。
t,=1.163,<,t,,0.05/2(24),=2.064,,P,>0.05,,按,α,=0.05,,检验水准,,,不拒绝,H,0,,,差异无统计学意义,即尚不能,,认为该地现在,20,岁成年男子平均身高与以往不同若,σ,未知,但已知,s,=8.6,cm,可用样本,-,总体,,的,t,,检验,依公式计算检验统计量:,[,案例,5-2],,通过以往大量研究显示汉族足月正常产,,男性新生儿临产前双顶径(,BPD,)均数为,9.3cm,某,,医生记录了某山区,12,名汉族足月正常产男性新生儿,,临产前双顶径(,BPD,)资料如下:,9.95,、,9.33,、,,9.49,、,9.50,、,10.09,、,9.15,、,9.52,、,9.33,、,9.16,、,,9.37,、,9.60,、,9.27,试问该地区男性新生儿临产前,,双顶径(,BPD,)是否大于一般新生儿?,(,1,)建立假设,确定检验水准,H,0,:,该地区男性新生儿临产前双顶径(,BPD,)与,,一般新生儿无差别,即,,H,1,,:,该地区男性新生儿临产前双顶径(,BPD,)大,,于一般新生儿,即,,(单测),(,2,)计算检验统计量,t,,值,已知,n =12,,,(,3,)确定,P,值,作出统计推断,以 查,t,界值表,得单测,t,0.05,11,= 1.796,,,,本案例的统计量,t,= 2.15,>,1.796,,因此,P,<,0.05,,,按 水准,拒绝,H,0,,接受,H,1,,差别有统计学,,意义,即根据现有资料可认为该地区男性新生儿临产前双顶径(,BPD,)大于一般新生儿。
例,5-3,为了解医学生的心理健康问题,,,随机抽取了某医科大学在校学生,208,名,,,用,SCL-90,量表进行测定,,,经统计得因子总分的均数为,144.9,,标准差为,35.82,现已知全国因子总分的均数,(,常模,),为,130,,问该医科大学在校生的总分是否与全国水平不同?,⑴ 建立检验假设,确定检验水准,,,H,0,:,µ,=,µ,0,=130,,即该医科大学在校生的总分,,与全国水平相同,,,H,1,:,µ,≠,µ,0,=130,,即该医科大学在校生的总分,,与全国水平不同,,α,= 0.05,,双侧检验,,已知,:,μ,0,= 130,x,= 144.9,,,n,= 208,>,5,0,,,为大样本,⑵ 选定检验方法,计算检验统计量,根据题目资料类型,可见,该资料是样本与总体之间的比较,且为大样本,,,可用样本,-,总体的,Z,检验依公式计算检验统计量:,⑶ 确定,P,值,作出推断结论,Z,=5.999,>,1.96,,P,<,0,.,001,,,拒绝,H,0,,,接受,H,1,,差异有统计学意义,可认为,该医科大学在校生的总分与全国水平不同,,二、配对,t,检验,(,paried,t-test ),配对设计:,两组观察对象除了研究因素不,,同外,其它的可能影响研究结,,果的因素相同或相似。
配对设计主要有以下四种情况:,⑴,两个同质受试对象分别接受两种不同的处理,,⑵,同一受试对象分别接受两种不同的处理,,⑶,同一受试对象接受某种处理的前后数据,,⑷,同一受试对象的两个不同部位的数据,,基本原理,:,假设两种处理的效应相同,,,,,即,μ,1,=μ,2,,,则,μ,1,- μ,2,=0,,,(,即,已知总体均数,μ,d,,= 0,),,检验,,,差数的样本均数,d,,与所代表的未知,,总体均数,μ,d,,与,0,的比较,应用条件:,差值,d,服从正态分布,,,,,,,,,上式中,d,,表示差值,,ν=n-1,,(,n,,为对子数),目的 :,推断两种处理的效果有无差别或,,推断某种处理有无作用,公式:,例,5-6,,某医生用,A,、,B,两种血红蛋白测定,,仪器检测了,16,名健康男子的血红蛋白含,,量,(g/L),检验结果见下表,问两种血红,,蛋白测量仪器检测结果是否有差别?,,表,8-3,,两种仪器检测,16,名男青年血红蛋白含量,(g/L),结果,被检测者号 仪器,A,仪器,B,d,,d,2,,,(1) (2) (3) (4)=(2)-(3) (5),,1 113 140 27 725,,2 125 150 25 625,,3 126 138 12 144,,4 130 120 - 10 100,,5 150 140 -10 100,,6 145,145,0 0,,7 135,135,0 0,,8 105 115 10 100,,9 128 135 7 49,,10 135 130 -5 25,,11 100 120 20 400,,12 130 133 3 9,,13 110 147 37 1369,,14 115 125 10 100,,15 120 114 -6 36,,16 155 165 10 100,,合计,Σd,=130,Σd,2,=3882,[,分析,],由于每个男子均用两种方法检测血红蛋白即采用配对的方式进行设计,假设两检测方法无差别的话,则两方法检测值的差应为,0,,然而,由于抽样误差的影响,可导致两方法检测值差值不为,0,。
因此,可以以差值为观察对象,检验差值样本是否来自零总体,(,μ,d,=0 ),,,如来自零总体,则两方法检测值相同,如不是来自零总体,则表明两方法检测值的不一致,不是由抽样误差引起,而是来自不同的总体⑴ 建立检验假设,确定检验水准,,,H,0,:,µ,d,=0,,,即两方法检测结果相同,,,H,1,:,µ,d,≠0,,,即两方法检测结果不同,α,= 0.05 ,,双侧检验,⑵ 选定检验方法,计算检验统计量,根据题目资料类型,可见,该资料,差值构成样本,与总体之间的比较,可用样本,-,总体的,t,检验依公式计算检验统计量:,⑶ 确定,P,值,作出推断结论,以,υ,=15,,,t,=2.367,,查,t,值表,,t,,0.05/2(15),=2.131,,t,>,t,,0.05/2(15),,则,P,<,0.05,拒绝,H,0,,接受,H,1,,差异有统计学意义可认为两种方法检查结果不同例,5-5,某医生在研究肾动脉成形术后血流动力血的改变中,,,观察了,10,名患者手术前后舒张压的变化,,,见下表,问手术前后舒张压有无变化?,表,8-2,手术前后舒张压变化情况,(,Kpa,),患者号 舒张压,,治疗前后之差,,手术前 手术后,d d,2,,,(1) (2) (3) (4)=(2)-(3) (5),,1 16.0 12.0 4.0 16.00,,2 12.0 13.3,-,1.3 1.69,,3 14.6 10.6 4.0 16.00,,4 13.3 12.0 1.3 1.69,,5 12.0,12.0,0.0 0.00,,6 12.0 10.6 1.4 1.96,,7 14.6 10.6 4.0 16.00,,8 14.6,14.6,0.0 0.00,,9 12.0 12.7,-,0.7 0.49,,10 12.3 13.3 0.00,0.00,,合 计,Σd,,=12.7,Σd,2,=53.83,⑴ 建立检验假设,确定检验水准,,,H,0,:,µ,d,=0,,,即手术前后舒张压无变化,,,H,1,:,µ,d,≠0,,,即手术前后舒张压有变化,α,= 0.05 ,,双侧检验,⑵ 选定检验方法,计算检验统计量,根据题目资料类型,可见,该资料,差值构成样本,与总体之间的比较,可用样本,-,总体的,t,检验。
依公式计算检验统计量:,⑶ 确定,P,值,作出推断结论,以,υ,=9,,,t,=1.96,,查,t,值表,,t,,0.05/2(9),=2.262,,t,<,t,,0.05/2(15),,则,P,>,0.05,不拒绝,H,0,,差异无统计学意义可认为手术前后舒张压无变化三、成组设计两样本均数的比较,,成组设计,:,亦称为,完全随机设计,,即两个,,样本均为随机抽样得到的样本,,或采用随机分组得到的样本two-sample test),(一),t,检验,适用条件,:,,随机抽样的小样本( 未知),,两样本来自正态总体,,两样本的总体方差齐同(,),(,t,-test),目的:,推断两样本均数分别代表的总体,,均数,μ,1,与,μ,2,,有无差别,注:,可认为两样本总体方差不等,,否则可认为两总体方差相等,可怀疑两样本总体方差不等,,正态分布的经验判断方法,,可怀疑该资料呈偏态分布,,可认为资料呈偏态分布,,,否则可认为近似正态,,方差齐性的经验判断方法,或,若,若,两样本,t,检验的统计量在,,H,0,: μ,1,= μ,2,,,,的条件下为,:,合并标准误的计算为:,两组的共同方差,—,合并方差,s,c,2,计算为,:,,⑴ 建立检验假设,确定检验水准,,,H,0,:,µ,1,=,µ,2,,,即男女的,GSH-PX,含量两总体均数相同,,,H,1,:,µ,1,≠,µ,2,,,即男女的,GSH-PX,含量两总体均数不同,,,α,= 0.05 ,,双侧检验,例,5-7 :,,表,8-4,,男女大学生的血清谷胱甘肽过氧化酶,(GSH-PX),,,性别 例 数 均 数 标准差,,男,48 96.53 7.66,,,女,46 93.73 8.23,,⑵ 选定检验方法,计算检验统计量,由于两组样本量,<5,0,且方差齐,故选用,t,检验。
已知,:,⑶ 确定,P,值,作出推断结论,以,υ,= 48 +46 - 2 = 92,查,t,界值表,,,,t,=1.708,<,,t,,0.05/2(92),= 2.000,,P,,>,,0.05,,,,按,α,=0.05,水准,不拒绝,H,0,,,即差异无统计,,学意义可认为,男女的,GSH-PX,含量相同,二、,z,检验,,,z,检验是,t,检验的特例,,其检验方法与,,,t,,检验方法比较,有以下区别:,① 由于,z,检验是大样本资料的检验,故其样本,,量可以看作无穷大,这时,其样本均数的分,,布已由,t,分布转为正态分布依此,,确定,P,值,,时,理论上,t,0.05/2,,,v,(或,t,0.01/2,,,v,),可以用,,,1.96,( 或,2.58,)来代替应用条件:,,n,较大,(,n,>50),; 总体标准差 已知,②在大样本的情况下,两样本均数比较的合并,,标准误,可以简化为,即为:,,例,5-8:,,某地抽查了,25,~,29,岁正常人群的红细胞数,测得其结果如下表,问该人群男、女红细胞数是否不同?,组别,n,x,s,男,156,4.65,0.55,女,74,4.22,0.44,,某地,240,名正常人群红细胞数(,×,10,12,/L,),① 建立检验假设,确定检验水准,,,H,0,:,µ,1,=,µ,2,,即该地,男、女红细胞数相同,,,H,1,:,µ,1,≠,µ,2,,,即,该地男、女红细胞数,不同,α,=0.05,,双侧检验,,② 选定检验方法,计算检验统计量,由于两样本样本量均,>5,0,故符合,z,检验的条件,计算,z,值,③ 确定,P,值,作出推断结论,z,= 6.37,>,,1.96,,故,P,<,,0.05,,拒绝,H,0,,接受,H,1,,差异有统计学意义。
即可认为该人群男、女红细胞数不同三)成组设计两样本几何均数的比较,医学上有些资料(如抗体滴度的资料)宜用几何均数表示其平均水平此时这些资料不服从正态分布,而服从对数正态分布,不能用算术均数描述其平均水平,两样本所代表的总体方差往往也可能不齐此时,应进行变量变换,若将这些观察值,X,用,lgX,来,代替,则,lgX,往往服从正态分布,此时相应两总体的方差往往也齐性因数据变换并未改变两组数据间的关系,故可用上述总体方差相等的,两样本,t,检验,对,lgX,,进行判断这时的,t,检验称为两样本几何均数的,t,检验两法测定病人血清效价结果,病人编号 气雾法,(X,1,),lgX,1,,鼻腔喷雾,(,X,2,) lg,X,2,,,1 40 1.602 50 1.699,,2 20 1.301 40 1.602,,3 30 1.447 30 1.447,,4 25 1.398 35 1.544,,5 10 1.000 60 1.778,,6 15 1.176 70 1.845,,7 25 1.398 30 1.447,,8 30 1.447 20 1.301,,9 40 1.602 25 1.398,,10,10,1.000 70 1.845,,11 15 1.176 35 1.544,,12 30 1.447 25 1.398,,,合计,,Σ,lgX,1,=16.0846,Σ,lgX,2,=18.9087,① 建立检验假设,确定检验水准,,,H,0,:,µ,1,=,µ,2,,,即两法免疫效果相同,,,H,1,:,µ,1,≠,µ,2,,,即两法免疫效果不同,,,α,=0.05,,双侧检验,将,原始数据,X,进行对数变换后求得,:,,② 选定检验方法,计算检验统计量,由于两组样本量均,<50,,且方差齐,故用,lgx,,作,,两小样本,t,检验。
③ 确定,P,值,作出推断结论,以,υ,= 12 +12 - 2 = 22,查,t,界值表,得,,t,,0.05(22),= 2.074,,而,t,=2.93,>,,2.074,,P,< 0.05,,,,按,α,=0.05,水准,拒绝,H,0,,,接受,H,1,,,即差异有统计,,学意义可认为两法免疫效果不同,,,鼻腔喷雾法高于,,气雾法两总体均数比较,方差齐性检验,方差齐,方差不齐,t,检验、,u,检验,前提:来自正态总体,四、方差不齐时两小样本比较,一、两样本方差的齐性检验,正态分布可以表示为,N,(,µ,,,σ,2,),,要比较两个正态总体是否一致,需分别比较,µ,,,σ,2,,,通过,t,检验,我们可以对分布的位置进行比较,但对分布的形态进行比较则需进行方差齐性检验,这是我们进行,t,检验和方差分析的基础1.,基本思想,2.,适用条件,两,样本均数均来自正态分布的总体,方差齐性检验的计算公式为:,若,两,样本是来自同一个正态总体,则它们的方差,,不应相差过大,其,F,≥→1,由于抽样误差的存在,,,其,F,可能会偏离于,1,,当其偏离过大,超出了抽样,,误差所能引起的范围,则表明方差不齐。
方差齐性检验的,注意要点:,不知,s,1,大还是,s,2,大,故齐性检验应为双侧检验在样本含量较小时,方差齐性检验不敏感;而,,在样本含量较大时,方差齐性检验过于敏感样本含量较大时(,n,>50),,可不做齐性检验例,5-7 :,,表,8-4,,男女大学生的血清谷胱甘肽过氧化酶,(GSH-PX),,,性别 例 数 均 数 标准差,,男,48 96.53 7.66,,,女,46 93.73 8.23,请检验两组的总体方差是否齐同⑴ 建立检验假设,确定检验水准,,,,H,0,:,σ,1,2,=,σ,2,2,,,即两组总体方差相等,,,H,1,:,σ,1,2,≠,σ,2,2,,,,即两组总体方差不等,α,= 0.05,,双侧检验,⑵ 选定检验方法,计算检验统计量,⑶ 确定,P,值,作出推断结论,以,υ,1,=45,,,υ,2,=47,,,F,=1.152,查附表,6,,,,F,界值表,有,1.152<1.63=,F,0.05,(45,47),,,故,,P,>0.05,按,α,= 0.05,水准,不拒绝,H,0,,,差异,,无统计学意义。
故不能认为两组总体方差,,不齐故该资料可用方差相等的两样本的,,t,,检验,),例,5-11 :,,,两组大鼠血糖含量测定结果,(,mmol,/L),,,组别 例 数 均 数 标准差,,硫酸氧钒,12 6.5 1.34,,,空白对照,8 13.7 4.21,⑴ 建立检验假设,确定检验水准,,,,H,0,:,σ,1,2,=,σ,2,2,,,即两组大鼠血糖含量总体方差相等,,,H,1,:,σ,1,2,≠,σ,2,2,,即两组大鼠血糖含量总体方差不等,α,= 0.05,,双侧检验,⑵ 选定检验方法,计算检验统计量,⑶ 确定,P,值,作出推断结论,以,υ,1,=7,,,υ,2,=11,,,F,=9.87,查附表,6,,,,F,界值表,有,9.87 >3.01=,F,0.05,(7,11),,,故,,P,<0.05,按,α,= 0.05,水准,拒绝,H,0,,,接受,H,1,,差异有统计学意义故可认为两组大鼠血糖,,含量总体方差不齐故该资料不可直接用方,,差相等的两样本的,t,,检验,),,二、,t,′,检验,—,,近似,t,检验,t,′,的分析思想,:,在方差不齐的情况下比较,,,其样本均数的分布曲线由,t,分布转化为,t′,分,,布,因,t,′,分布比较复杂,故用,t,分布的临界,,值计算,t,′,分布的临界值,,即对临界值校正,,然后依,t,检验进行分析。
t,′,检验方法,(,近似,t,,检验,),:,,Cochran &,cox,,法:,对临界值校正,,,Satterthwaite,法,,,welch,,法,对,自由度校正,,Cochran &,cox,,法,计算公式:,,t,′,值与,P,值的关系同,t,值与,P,值的一样,只不过在同理论界值比较时是采用,t,α,′,对,例,5-11,,,请检验两组大鼠血糖含量是否相同,?,硫酸氧钒组,:,⑴ 建立检验假设,确定检验水准,,,H,0,:,µ,1,=,µ,2,,,即两总体的血糖值相同,,,H,1,:,µ,1,≠,µ,2,,,即,两总体的血糖值,不同,α,= 0.05,,双侧检验,空白对照组:,⑵ 选定检验方法,计算检验统计量,⑶ 确定,P,值,作出推断结论,以 ,得,P,<0.05,按,α,=0.05,水平,拒绝,H,0,,,接受,H,1,,,有统计学,,意义即可认为两组大鼠血糖含量不同Satterthwaite,法,,该法则是,对自由度进行校正,,其,t,值的计算与,t′,计算方法一致自由度校正的计算公式为:,对,例,5-11,,,请检验两组大鼠血糖含量是否相同,?,硫酸氧钒组,:,⑴ 建立检验假设,确定检验水准,,,H,0,:,µ,1,=,µ,2,,,即两总体的血糖值相同,,,H,1,:,µ,1,≠,µ,2,,,即,两总体的血糖值,不同,α,= 0.05,,双侧检验,空白对照组:,⑵ 选定检验方法,计算检验统计量,⑶ 确定,P,值,作出推断结论,以 ,得,P,<0.05,。
按,α,=0.05,水平,拒绝,H,0,,,接受,H,1,,差异有统计学意义即可认为两组大鼠血糖含量不同五、正态检验性,,医学研究许多统计方法要求资料服从正态分布,或样本来自正态总体,如,小样本,t,检验,等正态分布的判断方法:,,利用频数表或频数图进行判断,,根据专业知识判断:,一般疾病的潜伏期、住院天数、临,,床生化指标等多为偏态分布,,经 验 判 断:,若 ,可认为资料呈偏态分布,,(,应用,X,、,S,),,,则有理由怀疑资料呈偏态分布,,,正态性检验,(为标准),正态性,检验常用方法,1.,图示法,:,方格坐标纸图、正态概率纸图、,P-P,图等,2.,统计检验方法,,W,检验,:,适用于样本量为,3≤N≤50,,D,检验,:,适用于样本量为,50≤N≤1000,两法均,需要通过专用的计算表来确定临界值,医学统计学分析流程简介,数值变量,统计描述,ANOVA,(≥,2,组,),相关与回归,集中趋势(,x,、,M,、,G,),相关回归分析(,1,对,1,),假设检验,频数表,离散趋势,(,s,、,CV,),t,-,检验(,2,组),秩和检验,(,非正态、方 差不齐),多元线性回归(,1,对多),对,一,正态总体,随机抽取一组样本,样本的均值落在,x,±,t,0.05/2(v),s,x,外的可能性为,5%,。
一)图示法,,,通过图示帮助了解观察资料是否服从正态分布图示法简单易行,但所反映的信息比较粗糙,,,Q-Q plots,:,横轴为样本的分位数(,P,x,),,,纵轴为按正态,,分布计算的相应分位数,,,P-P plots,:,横轴为样本的累计频率(百分比),纵轴,,为按正态分布计算的相应累计频率(即期望,,的累计频率),,,数据呈正态分布时的,P-P,图,期望累积概率,观察累计频率,●,●,●,A,B,第六节 假设检验的注意事项,,一、要有严密的研究设计,,,,这是假设检验的前提要求样本具有代表性和均衡可比性,,,即除比较的主要因素外,,,其他影响结果的有关因素都应尽可能一致,或能在资料处理时消除其影响样本的获得必须遵循随机化的原则,避免主观、随意选择二、应根据资料的特点和分析目的,,,选用适当的假设检验方法资料的性质不同、设计类型不同、样本含量的多少,,,均可影响所选用的假设检验的方法三、正确理解假设检验的结论(概率性),,,,假设检验利用小概率反证法的思想,,,根据样本统计量作出的推断结论具有概率性,,,所以其正确性不是绝对的,,,1,、当,P,<,α,,,拒绝,H,0,,,接受,H,1,;,按接受,H,1,下结论,但是,H,0,不是绝对不成立,,,所以可能犯错误;,,,2,、,当,P,>,α,,,不能拒绝,H,0,,,不能接受,H,1,;,按不能接受,H,1,下结论,,,但是,H,0,不是绝对成立,,,也可能犯错误。
3,、假设检验的结果并不是指差异的大小,,,只能反映两者是否相同或不同1,),当,P,≤,α,,,则结论为按所取检验水准,α,,,拒绝,H,0,,,接受,H,1,,,有统计学意义,(,统计结论,),可认为,......,不同或不等,(,专业结论,),,(,2,),当,P,>,α,,,则结论为按所取检验水准,,,不拒绝,H,0,,,无统计学意义,(,统计结论,),还不能认为,......,不同或不等,(,专业结论,),3,),①,不拒绝,H,0,不等于接受,H,0,,,因为此时拒绝,H,0,的证据不足②下结论时,,,对,H,0,只能说,:,拒绝或不拒绝,H,0,;,,而对,H,1,只能说接受,H,1,四、假设检验的结论不能绝对化,,所有的统计结论均具有概率性质,,,在做推断时,,,可能会犯错误,;,因此不宜用“肯定”、“一定”、“证明”等类似的词当计算出的检验统计量其相应的,P,值接近,α,时,,,下结论应尤其慎重1),因取同一检验水准,,,就现有样本的信息尚不拒绝,H,0,,,但增加样本含量后,,,由于抽样误差的减少可能拒绝,;,,,(2),检验水准,α,是根据分析要求确定的,,,具有一定的灵活性。
五、单侧检验与双侧检验的选择,,,(1),对同一资料进行检验,,,有可能双侧检验无统计学意义,,,单侧检验有统计学意义因此,,,在进行假设检验时,,,应事先根据专业知识和问题的要求在设计时确定,;,,(2),如果已具备了单侧检验的条件而放弃单侧检验,,,则会丧失部分信息六、正确理解实际意义与统计学意义的区别,,,假设检验的结果并不表示专业上的实际意义,,,只能反映两者是否相同1),差别有统计学意义,,,不应理解为差异很大或有显著的价值,;,,(2),差异大小的实际意义只能根据专业知识确定,,,(3),P,值的大小不能表示实际差异水平的高低实际意义与统计学意义两者间的关系,:,,,,1.,统计结论与专业结论一致,,,最终结论与两者一致,;,,2.,统计结论与专业结论不一致,,,最终结论需根据实际情况加以考虑,;,,3.,统计结论有意义,,,专业结论无意义,,,则可能由于,,样本含量过大或设计存在缺陷,,,则最终结论无意义,;,,4.,统计结论无意义,,,专业结论有意义,,,应当检查设计是否合理、统计方法是否选用得当、样本含量是否足够等方面,,,并进一步进行分析验证如,:,有研究者调查我国城市女婴的出生体重,,,北方,5385,人,,,均数为,3.08kg,,标准差为,0.53kg,,南方,4896,人,,,均数,3.10kg,,标准差,0.34kg,。
u,=2.30,,P,<,0.05,七、结果报告,,格式,:,检验统计量 单侧检验应说明 检验水准,,,P,值的比较确切的范围,,统计推断结果结合专业知识对所研究的事物做出比较全面的分析第七节 假设检验中的两类错误,客观实际,假设检验结论,,,拒绝,H,0,不拒绝,H,0,H,0,成立,Ⅰ,型错误,(,α,),推断正确,(1,-,α,),H,0,不成立,推断正确,(1,-,β),Ⅱ,型错误,(β),,Ⅰ,型错误:,拒绝了实际成立的,H,0,,即“弃真”,其概率大小为,α,假设检验时,研究者可根据不同研究目的确定,α,的大小,,,如,规定,α,=0.05,,当拒绝,H,0,,时,理论上,100,次检验中平均有,5,次发生这样的错误,;,,,Ⅱ,型错误:,没有,拒绝实际不成立的,H,0,,即 “存伪”,其概率大小为,β,,其大小一般不能确切的知道,,,需要根据两总体差值、检验水准,α,,、样本含量,n,计算得到,,,(,1,-,β,),称为检验效能,,它的意义是当两总体确有差异,按照规定的检验水准,α,所能发现该差异的能力,,如,两总体确有差别,若,1,-,β=0.90,,则理论上在,100,次这样的检验中,能够得出,90,次有统计学差异的结论,H,0,:,μ,,=,μ,0,α,H,1,:,μ,,>,,μ,0,μ,0,μ,1-β,β,拒绝,H,0,只可能犯,Ⅰ,类错误,,,不可能犯,Ⅱ,类错误,;,不拒绝,H,0,只可能犯,Ⅱ,类错误,,,不可能犯,Ⅰ,类错误。
α,越小,,,β,越大,;,α,越,大,,β,越,小,;,欲同时减小两类错误,,,唯有增加样本含量思考题,1.,假设检验时,一般当,P,<,0.05,时,则拒绝,H,0,,,理论依据是什么?,,2.,怎样正确选用单侧检验和双侧检验?,。