医 学 统 计 学第六章 参数估计与假设检验公共卫生系流行病与卫生统计学教研室 祝晓明t检验——问题提出假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;医疗卫生实践中最常见的是计量资料两组比较的问题;t检验 (t test, student t test)和u检验(u test)是用于计量资料两组比较的最常用的假设检验方法如两种疗法治疗糖尿病的疗效比较25例糖尿病患者随机分成两组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,二个月后测空腹血糖(mmol/L) 问两种疗法治疗后患者血糖值是否相同? 药物治疗 1药物治疗合并饮食疗法 2=10.85 n2=13 乙组总体样本 ?=推 断n1=12 =15.21 甲组•根据研究设计t检验可由三种形式:•单个样本的t检验•配对样本均数t检验(非独立两样本均数t检验)•两个独立样本均数t检验•t 检验是以t 分布为基础的t 检验——问题提出t分布 特征• 不服从标准正态分布,小样本时服从自由度ν=n-1的t分布 • t分布曲线是以0为中心的对称分布•自由度较小时,曲线峰的高度低于标准正态曲线,且曲线峰的宽度也较标准正态分布曲线峰狭,尾部面积大于标准正态曲线尾部面积,而且自由度越小,t分布的这种特征越明显 (翘尾低狭峰)t分布 特征•自由度ν越大,t分布越接近于正态分布;当自由度ν逼近∞时,t 分布趋向于标准正态分布。
•自由度ν不同,曲线形态不同, t分布是一簇曲线 概率、自由度与t值关系 ——t界值•标准正态分布中u值大小与尾部面积(概率 )有关,以 Z (单侧)和 Z /2(双侧)表示;•在t分布中,当自由度一定时 越小,|t|越大;•在 一定时,自由度越小,|t|越大,大于u值•在t分布中,t值与 、 的大小有关;•在单侧时(尾部面积取单侧)t 界值表示为t , , 双侧时表示为t /2, ,其意义为 概率、自由度与t值关系 ——t界值•一定自由度 和概率 下的 t值t , , t /2, 可通过查t界值表——附表2获得;•例如 =9,单侧 =0.05 ,查附表2得单侧 t0.05,9•自由度n-1 35-1 34 ,查附表2,得t0.05/2,34=2.032 第一节 单个样本t检验•又称单样本均数t检验(one sample t test),适用于样本均数与已知总体均数μ0的比较,其比较目的是检验样本均数所代表的总体均数μ是否与已知总体均数μ0有差别。
•已知总体均数μ0一般为标准值、理论值或经大量观察得到的较稳定的指标值•单样t检验的应用条件是总体标准 未知的小样本资料( 如n<50),且服从正态分布 单个样本 t 检验原理已知总体0未知总体样本在 H0 : = 0的假定下,可以认为样本是从已知总体中抽取的,根据t分布的原理,单个样本t检验的公式为:自由度 =n-1例7.1 以往通过大规模调查已知某地新生儿出生体重为3.30kg.从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.40kg,问该地难产儿出生体重是否与一般新生儿体重不同?本例已知总体均数 0,但总体标准差 未知,n=35为小样本,,,故选用单样本t检验单个样本t 检验——检验步骤1. 建立检验假设,确定检验水准H0: 0,该地难产儿与一般新生儿平均出生体重相同;H1: 0,该地难产儿与一般新生儿平均出生体重不同; 2. 计算检验统计量在μ=μ0成立的前提条件下,计算统计量为:3. 确定P值,做出推断结论本例自由度n-1 35-1 34,查附表2,得。
因为t t0.05/2,34,故P ,表明差异无统计学意义,按 水准不拒绝H0,根据现有样本信息,尚不能认为该地难产儿与一般新生儿平均出生体重不同第二节 配对样本均数t检验•配对样本均数t检验简称配对t检验(paired t test),又称非独立两样本均数t检验,适用于配对设计计量资料均数的比较,其比较目的是检验两相关样本均数所代表的未知总体均数是否有差别 •配对设计(paired design)是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理 配对设计概述•应用配对设计可以减少实验的误差和控制非处理因素,提高统计处理的效率 •配对设计处理分配方式主要有三种情况:•①①异源配对:两个同质受试对象分别接受两种处理,如把同窝、同性别和体重相近的动物配成一对,或把同性别和年龄相近的相同病情病人配成一对;•②②同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;•③③自身对比:即将同一受试对象处理(实验或治疗)前后的结果进行比较,如对高血压患者治疗前后、运动员体育运动前后的某一生理指标进行比较 配对样本均数t 检验原理•配对设计的资料具有对子内数据一一对应的特征,研究者应关心是对子的效应差值而不是各自的效应值。
•进行配对t检验时,首选应计算各对数据间的差值d,将d作为变量计算均数•配对样本t检验的基本原理是假设两种处理的效应相同,理论上差值d的总体均数μd 为0,现有的不等于0差值样本均数可以来自μd = 0的总体,也可以来μd ≠ 0的总体配对样本均数t检验原理可将该检验理解为差值样本均数与已知总体均数μd(μd = 0)比较的单样本t检验.其检验统计量为: 式中d为每对数据的差值,为差值样本的均数,Sd为差值样本的标准差, 为差值样本均数的标准差,即差值样本的标准误,n为配对样本的对子数 • 例7-2 某项研究评估咖啡因对运动者的心肌血流量的影响,先后测定了12名男性志愿者饮用咖啡前后运动状态下的心肌血流量(ml/min/g),数据如表7-1所示,问饮用咖啡前后运动者的心肌血流量有无差异3.检验步骤 (1)建立检验假设,确定检验水准 H0:: d=0,饮用咖啡前后运动者的平均心肌血流量差异为零; H1: d 0,饮用咖啡前后运动者的平均心肌血流量差异不为零; (2)计算检验统计量本例: 计算差值均数: 计算差值标准差: 计算差值的标准误: 计算t 值得: (3)根据P 值值,作出推断,作出推断结论结论 查附表2,t,11,t > t,11,P ,差别有统计学意义,拒绝H0,接受H1,可以认为饮用咖啡前后运动者的心肌血流量存在差异。
• 例 有12名接种卡介苗的儿童,8周后用两批不同的结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径(mm)如表5-1所示,问两种结核菌素的反应性有无差别配对样本均数t检验——检验步骤•1.建立检验假设,确定检验水准•H0: d=0,两种结核菌素的皮肤浸润反应总体平均直径差异为0;•H1: d 0,两种结核菌素的皮肤浸润反应总体平均直径差异不为0;• •2.计算检验统计量•先计算差值d及d2如上表第四、五列所示,本例 d = 39, d 2 195•先计算差数的标准差 •计算差值的标准误•按公式计算,得:•3.确定 P 值,作出推断结论•自由度计算为 ν=n-1=n-1=12-1=11,•查附表2,得t0.05(11), t0.01(11),本例t > t0.01(11), P ,差别有统计学意义,拒绝H0,接受H1,•可认为两种方法皮肤浸润反应结果的差别有统计学意义三、两独立样本t 检验•两独立样本t检验(two-sample t-test),又称成组 t 检验适用于完全随机设计的两样本均数的比较,其目的是检验两样本所来自总体的均数是否相等。
•完全随机设计是将受试对象随机分配到两组中,每组患者分别接受不同的处理,分析比较处理的效应 基本原理•两独立样本t检验的检验假设是两总体均数相等,即H0:μ1=μ2,也可表述为μ1-μ2=0,这里可将两样本均数的差值看成一个变量样本, 在H0条件下两独立样本均数t检验可视为样本与已知总体均数μ1-μ2=0的单样本t 检验, 统计量计算公式为 其中•Sc2称称为为合并方差合并方差(combined/pooled variance),上述公式可用于已知两上述公式可用于已知两样样本本观观察察值值原始原始资资料料时计时计算算,当两当两样样本本标标准差准差S1和和S2已知已知时时,合并方差合并方差Sc2为为:•例7-3 某项研究评估低氧环境(模拟高原环境)对运动者的心肌血流量的影响,将17名男性志愿者随机分成两组,分别在正常含氧环境(正常组)和低氧环境(低氧组)中测定运动后的心肌血流量(ml/min/g),数据如表7-2所示,问两种环境中运动者的心肌血流量有无差异检验步骤 1.建立检验假设,确定检验水准•H0:: 1= 2,两种环境中运动者的心肌血流量的总体均数相同;•H1: 1 2,两种环境中运动者的心肌血流量的总体均数不同;•。
2.计算检验统计量 由原始数据得: 代入公式得: 得出统计量t 值: 查t界值表,t0.05/2,15=2.131, t t0.05/2,(15),P ,按 的水准拒绝H0,接受H1,差异具有统计学意义故可认为两种环境中运动者的心肌血流量的总体均数不同 几何均数资料 t 检验,服从对数正态分布,先作对数变换,再作 t 检验t 检验应检验应用条件用条件•随机:随机:样样本本对总对总体有体有较较好代表性,好代表性,对对比比组间组间有有较较好好组间组间均衡性均衡性——随机抽随机抽样样和随机分和随机分组组•正正态态::样样本来自正本来自正态态分布分布总总体,配体,配对对t检验检验要求差要求差值值服从正服从正态态分布,分布,实际应实际应用用时单时单峰峰对对称分布也可以称分布也可以 •方差方差齐齐::两独立两独立样样本均数本均数t检验检验要求方差要求方差齐齐性性——两两组总组总体方差相等大体方差相等大样样本本时时,用,用z 检验检验不要求正不要求正态态和和方差方差齐齐性 第二节 方差不齐时两样本均数检验一、两样本方差齐性检验•在正态分布情况下,检验统计量F值按下列公式计算 • 为较大的样本方差, 为较小的样本方差; 若样本方差的不同仅为抽样误差的影响,F值一般不会偏离1太远。
查附表3(方差齐性检验用的F界值表)可得P值 ν1=n1-1, ν2= n2-1 •例7-4 两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量(g)如表7-3所示,问两组动物体重增加量的均数是否相等? H0: 12== 22,即高蛋白与低蛋白,即高蛋白与低蛋白饲饲料喂养后料喂养后小白鼠体重增加量的小白鼠体重增加量的总总体方差相同体方差相同;H1: 12≠ 22,即高蛋白与低蛋白,即高蛋白与低蛋白饲饲料喂养后料喂养后小白鼠体重增加量的小白鼠体重增加量的总总体方差不同体方差不同; == 计计算算检验统计检验统计量,量,对对表的数据表的数据计计算可得算可得: 按公式计算 确定P值,作出统计推论查附表3的F界值表, F0.05(11,12) = 3.34 ,F > F0.05(11,12) ,P ,认为两组体重增加量的总体方差不等二、t’ 检验 •当两总体方差不等(方差不齐)时,两独立样本均数的比较,可采用 t’ 检验,主要有主要有Satterthwaite法近似法近似t检验检验、、Welch法近似法近似t检验检验和和Cochran & Cox法近似法近似t检验检验。
其中其中Cochran & Cox法是法是对临对临界界值值校正校正 ;;而而Satterthwaite法法和和Welch法是法是对对自由度自由度进进行校正•t’检验的统计量的计算公式为 Cochran & Cox法校正临界值 的公式为 式中•Satterthwaite法是法是统计软统计软件中普遍使用的方法,其件中普遍使用的方法,其自由度校正公式自由度校正公式为为 根据自由度根据自由度查查t界界值值表表,作出推断作出推断结论结论•对例7-4资料进行检验•H0:: 1 2,即两种饲料小白鼠增重总体均数相同;•H1: 1 2,即两种饲料小白鼠增重总体均数不相同;• •两总体方差不同,应选用t’ 检验确定P值,作出推断结论 •按Satterthwaite法计算校正自由度,得 查t界值表得t0.05,12=2.179, t> t0.05,12, P < 0.05 ,差异有统计学意义,可认为两种饲料饲养后小白鼠增重的均数不同•按Cochran & Cox法计算校正界值,先查t界值表 得t0.05,11=,t0.05,12=,再按公式计算 t’ > t’ , P ,结论同前。
第三节 t 检验中的注意事项 1. 假设检验结论正确的前提——代表性、均衡性 2. 检验方法的选用及其适用条件——样本量、正态+方差齐 3. 双侧检验与单侧检验的选择——研究目的和专业知识 4. 假设检验的结论不能绝对化——概率 5. 正确理解P值的统计意义——统计学差异、实际差异 6. 假设检验和可信区间的关系——假设检验判断有无差别 可信区间说明差别有多大 第四节 假设检验中两类错误•假设检验是针对H0,利用小概率事件的原理对总体参数做出统计推论无论拒绝H0还是接受H0,都可能犯错误 •检验效能(power of a test),也称把握度,表示当两总体确实有差别时,按规定的检验水准能发现其差别的能力给定的检验水准值越小,出现ⅡⅡ类错误的概率越大,反之亦然若要同时减小α和β,可以通过增加样本量的方法实现 小 结 1. t 检验是计量资料两均数比较的一种假设检验方法,包括单样本均数的t 检验、配对样本均数的t 检验、两独立样本均数的t 检验。
2. t 检验要求资料服从正态分布,且两总体方差相等若两总体方差不等,可采用数据变换或t’ 检验,也可以采用第十章的秩转换的非参数检验方法 3.由两样本方差推断两总体方差是否相同的检验方法可用F 检验 4.假设检验能够说明组间是否具有差别,而可信区间则能够说明差别有多大,帮助判断结果是否具有实际意义两者可以结合使用 5.检验效能是一个重要的概念,表示当两总体确实有差别时,按规定的检验水准能发现其差别的能力,增加样本量可以提高检验效能。