样本含量的估计与检验效能样本含量的估计与检验效能 第一节第一节 概述概述 样本含量(样本含量(sample size)) 为了保证研究结论的可靠性,确定的为了保证研究结论的可靠性,确定的实验研究或实验研究或调调查研究所需要的查研究所需要的最低最低观察对象的数量观察对象的数量 样本含量少,研究结论不可靠样本含量少,研究结论不可靠 样本含量过多,造成人财物的不必要浪费样本含量过多,造成人财物的不必要浪费 检验效能(检验效能(power)) 也叫把握度,即也叫把握度,即1-1- (第二类错误的(第二类错误的概率)如果两总体参数实际有差异(概率)如果两总体参数实际有差异(H H1 1成立),按成立),按 水准,假设检验能发现这种水准,假设检验能发现这种差异的能力(真阳性)通常要求达到差异的能力(真阳性)通常要求达到80%80%或或90%90%(即(即 =0.2 =0.2 或或 =0.1 =0.1 ),不得低),不得低于于75%75%样本含量与检验效能样本含量与检验效能 样本含量估计与检验效能分析是研样本含量估计与检验效能分析是研究设计必须考虑的问题。
究设计必须考虑的问题 这两者之间关系密切,样本含量越这两者之间关系密切,样本含量越大,检验效能越高;样本含量越小,检大,检验效能越高;样本含量越小,检验效能就越低验效能就越低样本均数与总体均数比较的样本含量样本均数与总体均数比较的样本含量x0zaa、b 与 za、zbx0zbab一、样本含量的影响因素一、样本含量的影响因素1. 检验水准检验水准 : ,则,则n 2. 检验效能检验效能1-β: ((1- )) ,则,则n ,, ((1- ))> 0.75,通常取,通常取0.8或或0.93. 客客观观差差异异δ (delta),即即比比较较总总体体参参数数间间的的差差值值(如如m m1 1- -m m2 2, , p p1 1- -p p2 2) δ ,则,则n 4.总总体体标标准准差差σ、、总总体体平平均均数数μ((或或总总体体率率π)),,这这里里主主要指离散程度指标要指离散程度指标5. s s ,则,则n 二、检验效能的影响因素二、检验效能的影响因素1. 个体间标准差越小或样本含量个体间标准差越小或样本含量越大,检验效能越大越大,检验效能越大 s s小或小或n大大 → → 均数对应的概率密均数对应的概率密度曲线(度曲线(m m,,s s 2/n)瘦高)瘦高 → →检验效检验效能能大大1. 个体间标准差越小或样本含量个体间标准差越小或样本含量越大,检验效能越大越大,检验效能越大 2. 第一类错误的概率第一类错误的概率α越大,检验效越大,检验效能越大能越大 2. 第一类错误的概率第一类错误的概率α越大,检验效越大,检验效能越大能越大 3. 客观差异客观差异δ越大,检验效能越大越大,检验效能越大 3. 客观差异客观差异δ越大,检验效能越大越大,检验效能越大 第二节第二节 样本含量的估计样本含量的估计 一、抽样调查 二、样本均数与总体均数比较二、样本均数与总体均数比较 【例【例6.9】】 用某药治疗矽肺患者可增加尿矽的排出用某药治疗矽肺患者可增加尿矽的排出量,标准差为量,标准差为89.0mmol/L,取取α=0.05,,β=0.10,能,能辨别出尿矽排出量平均增加辨别出尿矽排出量平均增加35.6mmol/L,需观察,需观察多少例矽肺患者?多少例矽肺患者? 已知:已知:s=89.0,,δ=35.6,单侧,单侧α=0.05,, 单侧单侧z0.05=1.645,,β=0.10,, 单侧单侧z 0.10=1.282即需观察即需观察54例矽肺患者。
例矽肺患者 如果采用双侧,则需观察如果采用双侧,则需观察66例矽肺患者例矽肺患者 三、两样本均数比较三、两样本均数比较 【例【例6.8】为研究某地正常成年男、女末稍血液的红细】为研究某地正常成年男、女末稍血液的红细胞的差别,据文献报道,男性红细胞均数为胞的差别,据文献报道,男性红细胞均数为465万万/mm3 ,女性红细胞均数为,女性红细胞均数为422万万/mm3,标准差为,标准差为52万万/mm3,,取双侧取双侧α=0.05,把握度,把握度(1-β)=0.9,问要抽查多少人才能,问要抽查多少人才能发现男女间红细胞的差别?发现男女间红细胞的差别? 已知:已知: 1=465,, 2=422,, δ=| 1- 2|=|465-422|=43,,σ=52 双侧双侧α=0.05α=0.05,,Z Z0.05/20.05/2=1.96, =1.96, β=0.1,Z β=0.1,Z0.10.1=1.282=1.282即成年男女性各需抽查即成年男女性各需抽查31人才能发现其红细胞人才能发现其红细胞间的差别间的差别 如果采用单侧,则男女各需观察如果采用单侧,则男女各需观察25人。
人 四、配对计量资料比较四、配对计量资料比较 σd:每对观察对象差值的标准差:每对观察对象差值的标准差 n:: 所求的观察对子数所求的观察对子数 【例【例5】研究碳酸铝对白细胞减少症的治疗效果研究碳酸铝对白细胞减少症的治疗效果已知治疗后比治疗前平均增加已知治疗后比治疗前平均增加1×109/L,标准差为,标准差为1.2×109/L,取双侧,取双侧α=0.05,把握度(,把握度(1-β))=0.9,,求样本含量求样本含量 已知:已知:δ=1,,σd=1.2,,Z0.05/2=1.96, Z0.1=1.282 即需即需15例患者参加试验例患者参加试验 如果采用单侧,则需观察如果采用单侧,则需观察12人 五、两样本率比较五、两样本率比较π1和和π2:分别表示两组的总体率:分别表示两组的总体率πc :两组的合并率:两组的合并率 【【例例6】】用用旧旧药药治治疗疗慢慢性性肾肾炎炎的的近近控控率率为为30%,,现现试试验验新新药药疗疗效效,,新新药药的的近近控控率率必必须须达达到到50%才才认认为有推广价值,问每组各需要多少例患者?为有推广价值,问每组各需要多少例患者?已知:已知:π1=0.5,,π2=0.3,,πc=((0.5+0.3))/2=0.4 单侧单侧α=0.05,,Z0.05=1.645,β=0.1,Z0.1=1.282即试验组和对照组各应观察即试验组和对照组各应观察103人。
人 六、配对计数资料比较六、配对计数资料比较 配对资料分析形式配对资料分析形式 乙乙 法法合合 计计 + - 甲甲 法法 + a ba+b- c d c+d 合计合计 a+c b+dn甲乙两法比较甲乙两法比较π+-=b/(a+b), π-+=c/(a+c),,πc=(π+-+π-+) /2 【例【例7】某菌种接种于甲、乙两种培养基的结果如下:】某菌种接种于甲、乙两种培养基的结果如下:π+-=0.04,,π-+=0.24,取双侧,取双侧α=0.05,,β=0.1,,现要研究一种与该菌种相似的新菌种,问需观察多现要研究一种与该菌种相似的新菌种,问需观察多少对子数?少对子数? πc=(0.04+0.24) /2=0.14即需观察即需观察57对样本 七、根据相对危险度进行估计七、根据相对危险度进行估计 八、相关分析八、相关分析第三节第三节 检验效能及其计算检验效能及其计算 检验效能(检验效能(Power))又称又称把握度把握度即两总体确实有差别,按即两总体确实有差别,按 水准能发现它们有差水准能发现它们有差别的能力,用(别的能力,用(1-β)表示。
表示 ((1-β))=0.9 β为第二类错误的概率为第二类错误的概率 Zβ 查查z值表值表 β ((1-β)) 出现出现“阴性阴性”结果有两种可能:结果有两种可能: ((1)()(1-β)较大,被比较的指标间总体参数很)较大,被比较的指标间总体参数很可能无差别可能无差别2)()(1-β)较小,所比较的指标间总体参数很)较小,所比较的指标间总体参数很可能有差别,但由于样本含量不足可能有差别,但由于样本含量不足 而未能发现而未能发现 P>α:在:在α水平下,不拒绝水平下,不拒绝H0,即认为,即认为差别无统计学意义,又称作差别无统计学意义,又称作“阴性阴性”结果Z Zββ的计算的计算 一、两一、两样本均数比本均数比较::((δ未知时)未知时) 【例【例8】用】用β阻滞剂降低心肌梗塞患者血压的阻滞剂降低心肌梗塞患者血压的随机双盲对照试验,结果见下表检验结随机双盲对照试验,结果见下表检验结果为果为t=1.54,,P>0.05,无统计学意义,认为无统计学意义,认为该药无降压效果问该结论是否可靠?要该药无降压效果。
问该结论是否可靠?要求:求:δ=0.67kPa,α=0.05,Z0.05=1.96分组分组NS试验试验1514.41.6对照对照1515.31.6两组心肌梗塞患者治疗后的收缩压(两组心肌梗塞患者治疗后的收缩压(kPa)) 已知:已知:δ=0.67kPa,α=0.05, Z0.05=1.96,,S=1.6,, n1=n2=15查附表查附表1P(Z -0.81)=1- P(Z -0.81)=1-0.2090=0.7910即即β=0.79,则,则 Power=1-β=1-0.79=0.21 说明检验效能太低,该结论假阴性的可能性大,说明检验效能太低,该结论假阴性的可能性大, 需增加样本含量进一步试验需增加样本含量进一步试验 【【例例9】】用用同同一一种种降降压压药药分分别别治治疗疗两两组组高高血血压压患患者者,,服服用用4周周后后比比较较两两组组患患者者收收缩缩压压的的下下降降值值(mmHg),,测测得得结结果果::n1=14, ,,S1=6.32;;n2=16, ,S2=2.16检检验验结结果果::t=2.34, P>0.05。
问该研究的检验效能如何?问该研究的检验效能如何?查表,查表,P(Z 0.28)= P(Z -0.28)=0.3936则则β=0.39,,Power=1-β=1-0.39=0.61 即该研究的检验效能偏低,结论不可靠即该研究的检验效能偏低,结论不可靠 二、配对计量资料比较二、配对计量资料比较 N为对子数,为对子数, 为差值均数,为差值均数,Sd为差值标准差为差值标准差 【【例例10】】经经连连续续非非卧卧床床腹腹膜膜透透析析((cAPD))治治疗疗晚晚期期糖糖尿尿肾肾病病6例例,,测测得得生生化化指指标标之之一一Na的的结结果果(( X±S)) :: 治治 疗疗 前前 138.33±2.28,, 治治 疗疗 后后139.67±1.41,, 差差 值值 1.33±2.76 检检 验验 结结 果果 ::t=0.482,P>0.05该结论是否可靠?该结论是否可靠?已知已知N=6N=6,, =1.33 =1.33,,S Sd d=2.76=2.76 查表,查表,P(Z -0.78)=1- P(Z -0.78)=1-0.2177=0.7823即即β=0.78,,Power=1-0.78=0.22说明检验效能太低,结论不可靠。
说明检验效能太低,结论不可靠三、两样本率比较三、两样本率比较四、配对计数资料四、配对计数资料 五、直线相关五、直线相关 。