中山大学中山大学SPSS学习指导学习指导 2 样本含量估算的统计学方法样本含量估算的统计学方法 张张 晋晋 昕昕 中山大学公共卫生学院中山大学公共卫生学院 医学统计与流行病学系医学统计与流行病学系 第第15章章 样本含量估计样本含量估计 p.283 3 1. 确定样本含量的意义确定样本含量的意义 ①① 样本含量被样本含量被高估高估,必定导致课题组投入更多的,必定导致课题组投入更多的 资金、人力和物力,质量控制难度增加资金、人力和物力,质量控制难度增加 ②② 样本含量被样本含量被低估低估,抽样误差大,观察指标稳定,抽样误差大,观察指标稳定 性差,检验效能低得到阴性结论(不拒绝性差,检验效能低得到阴性结论(不拒绝H0)) 时,难以分辨阴性结论是检验效能过低导致未能检时,难以分辨阴性结论是检验效能过低导致未能检 测出总体间本来存在的差异,还是不同药物的治疗测出总体间本来存在的差异,还是不同药物的治疗 效果无差别效果无差别 抽自总体:抽自总体: N(4.6602, 0.57462) X n n=5 n=10 n=30 22XX XZXXZ 22XX XZXXZ 在对在对总体均数总体均数 进行进行置信区间置信区间时,时,(1 ) 的情形下具有的情形下具有 22 , XX XZXZ 随机误差随机误差 n Z 2/ 当希望随机误差当希望随机误差 n Z 2/ ,则有,则有 2 2/ Zn 对总体均数进行估计时样本量计算公式对总体均数进行估计时样本量计算公式 2 2/ Zn 2. 假设检验的思想与样本量计算公式假设检验的思想与样本量计算公式 一般地区成年男性的心率为一般地区成年男性的心率为μ0= 72 bpm 研究山区成年男性(研究山区成年男性(n= 25 ),得到),得到 =75.2 bpm ,,s= 6.5 bpm 需在(需在(μ=μ0)与()与(μ≠μ0)之间作出抉择。
之间作出抉择 X nS x t / 0 462. 2 25/5 . 6 0 .722 .75 05. 0P 支持域支持域 拒绝域拒绝域 拒绝域拒绝域 n S t n S t )2/1( n S t n S t 2/ 2 2/ Stt n )( 12 1.1.规定检验水准规定检验水准 事先规定错误的概率事先规定错误的概率 ,通常规定,通常规定 = = 0.050.05 2.2.规定检验功效规定检验功效 事先规定功效,不宜低于事先规定功效,不宜低于 0.750.75 ≤≤ 0.250.25 3.3.总体间参数差异总体间参数差异 从从文献文献或或预预试验试验或或专业专业规定规定 = = 总体间差异总体间差异 4.4.总体中个体变异总体中个体变异 从文献或预试验获得从文献或预试验获得 = = 总体标准差总体标准差 3. 确定样本量时应具备的条件确定样本量时应具备的条件 14 单侧检验(单侧检验(t t )) 2 )( Stt n ((1515- -1 1)) 双侧检验(双侧检验(t t /2 /2)) 2 2/ Stt n )( ((1515- -2 2)) 4. 单组与配对设计的定量资料单组与配对设计的定量资料 15 例例 15-1 用某药治疗矽肺患者后确能使尿矽排除量增加,平均约增加用某药治疗矽肺患者后确能使尿矽排除量增加,平均约增加 15mg/L,, 其标准差约为其标准差约为 25mg/L。
若取若取0.05 (单侧) ,(单侧) ,0.10 ,问需观察多少患者才,问需观察多少患者才 能得出服药前后尿矽排除量差别有统计学意义的结论?(这里能得出服药前后尿矽排除量差别有统计学意义的结论?(这里25 d S、、 = 15)) 解解 本例为配对设计, 因要求疗后尿矽排除量增加, 故宜选单侧检验 令本例为配对设计, 因要求疗后尿矽排除量增加, 故宜选单侧检验 令 d SS ,, 并将并将15 ,,25 d S,,6 4 51 050 . )(.)( tt ,,2 8 21 100 . )(.)( tt ,代入式(,代入式(15-1)) 24798.23 15 25)282. 1645. 1 ( )( 2 2 1 stt n 16 将将15 ,,25 d S,,7141 2305023 . )(.)( tt ,,3191 2310023 . )(.)( tt 代入(代入(15-1)) 26553.25 15 25)319. 1714. 1 ( )( 2 2 2 Stt n 按按 t 界值得进一步结果界值得进一步结果 将将15 ,,25 d S,,7081 2505025 . )(.)( tt ,,3161 2510025 . )(.)( tt 代入(代入(15-1)) 26402.25 15 25)316. 1708. 1 ( )( 2 2 3 Stt n 按按 t 界值得进一步结果界值得进一步结果 上述上述迭代计算迭代计算,第,第 3 次迭代修正值已小于次迭代修正值已小于 1,迭代结束,即,迭代结束,即 26 n可满足要求。
可满足要求 17 作单侧检验时,作单侧检验时, 2 221 2 1 1 ))(( Stt N ((15-3)) 作双侧检验时,作双侧检验时, 2 22 2/ 1 2 1 1 ))(( Stt N ((15-4)) 当两组样本含量相等时,当两组样本含量相等时,5 . 0 21 ,,4) 5 . 0 () 5 . 0 ( 11 ,两公式分别简化为:,两公式分别简化为: 作单侧检验时,作单侧检验时, 2 22 )(4 stt N ((15-5)) 作双侧检验时,作双侧检验时, 2 22 2/ )(4 stt N ((15-6)) 5. 成组设计的定量资料成组设计的定量资料 18 例例 15-2 某研究者某研究者打算分析多毛症患者与正常人血清睾酮含量打算分析多毛症患者与正常人血清睾酮含量 ((ng%)的差别,假定两总体均数之差值)的差别,假定两总体均数之差值 =10,取,取0.05 ,, 0.10 。
从前人的研究资料中估计血清睾酮含量的标准差为从前人的研究资料中估计血清睾酮含量的标准差为 13.33,若多毛症病人较少,打算以,若多毛症病人较少,打算以 1:4 的比例调查患者与健康的比例调查患者与健康 人,问需调查患者与健康人各多少?人,问需调查患者与健康人各多少? 解答解答 3313. c S51411 1 /)/( q,,541 12 / 又=10,,050. ,, 100. ,则,则9601 20502 . )(/.)(/ tt ,,2821 100 . )(.)( tt 得:得: 2 2211 2 22 2 1 2 1 11 10 3313282196015451).()]()/()/[( ))(( /)( Stt N 1177 .116 因而,因而,2442311751 1 1 1 1 .)/( )()( Nqn,,962444 1 1 1 2 )()( nn 19 再以自由度为再以自由度为118296242 1 2 1 1 )()( nndf从从 t 界值表界值表中查得中查得 9801 1182050 . )(/. t,,2891 118100 . )(. t,并代入公式(,并代入公式(15-4) ,得:) ,得: 2 2211 2 22 2 1 2 1 12 10 3313289198015451).()]()/()/[( ))(( /)( Stt N1197 .118 因而,因而, )()()( .)/( 1 1 2 1 2 1 2482311951nNqn ,, )()()(1 2 2 1 2 2 962444nnn 。
所以,取所以,取24 1 n,,96 2 n,,1209624 N,即若以,即若以 1:4 的样本含量作调查,的样本含量作调查, 应调查患者应调查患者 24 人,正常人人,正常人 96 人 20 例例 15-3 在动物镇咳实验中,比较中药复方在动物镇咳实验中,比较中药复方ⅠⅠ与复方与复方ⅡⅡ使小鼠使小鼠 推迟发生咳嗽的时间,复方推迟发生咳嗽的时间,复方ⅠⅠ与复方与复方ⅡⅡ的平均数分别为的平均数分别为 31.67s 和和 44.00s(即(即44.0031.6712.33 s) 设两组标准差相等,且为) 设两组标准差相等,且为 25s,,0.05 (双侧) ,(双侧) ,0.10 ,要得出两组差别有统计学意义的,要得出两组差别有统计学意义的 结论,问需要用多少只小鼠?结论,问需要用多少只小鼠? 解解 将将3312. ,,25 S,,9601 20502 . )(/.)(/ tt ,,2 8 21 100 . )(.)( tt 代入代入 式(式(15-6) ,得:) ,得: 1748 .172 )33.12( 25)282. 1960. 1(4)(4 2 22 2 22 2/)1( Stt N 再 以 自 由 度 为再 以 自 由 度 为17221742 1 )( Ndf,,3312. ,,25 S,, 9601 17220502 . )(/.)(/ tt ,,2821 172100 . )(.)( tt 代入式(代入式( 15-6) ,可得) ,可得 174 12 )()( NN,所以取,所以取174N,每组,每组 87 只。
只 21 也可以通过查表获得所需的样本含量也可以通过查表获得所需的样本含量。