8样本量估算的统计学方法-LC骆课件

上传人:工**** 文档编号:568734158 上传时间:2024-07-26 格式:PPT 页数:49 大小:1.06MB
返回 下载 相关 举报
8样本量估算的统计学方法-LC骆课件_第1页
第1页 / 共49页
8样本量估算的统计学方法-LC骆课件_第2页
第2页 / 共49页
8样本量估算的统计学方法-LC骆课件_第3页
第3页 / 共49页
8样本量估算的统计学方法-LC骆课件_第4页
第4页 / 共49页
8样本量估算的统计学方法-LC骆课件_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《8样本量估算的统计学方法-LC骆课件》由会员分享,可在线阅读,更多相关《8样本量估算的统计学方法-LC骆课件(49页珍藏版)》请在金锄头文库上搜索。

1、 8、样本量估算的统计学方法骆福添骆福添骆福添骆福添 公共卫生学院公共卫生学院公共卫生学院公共卫生学院参考教材:生物医学研究的统计方法参考教材:生物医学研究的统计方法参考教材:生物医学研究的统计方法参考教材:生物医学研究的统计方法主编:方积乾,主编:方积乾,主编:方积乾,主编:方积乾,2007200720072007,高等教育出版社,高等教育出版社,高等教育出版社,高等教育出版社一、临床研究为什么需要估计样本含量复习1:统计学三大任务与三大规则任务:任务:描述描述样本特征、样本特征、估计估计总体参数、总体参数、检验总体差别检验总体差别规则:(必须考虑)规则:(必须考虑) 数据数据类型、类型、分

2、布分布类型、类型、对比对比类型类型1. 统计描述任务例:某样本个体分布的例:某样本个体分布的集中集中趋势与趋势与离散离散趋势怎趋势怎样样 ?(1V1V点,点,2V2V线,线,3 3面面. .影子影子_ _线)线)数据数据:计数(:计数(% %),定量(平均数),等级),定量(平均数),等级(平均(平均RiditRidit值)值) 分布分布:正态:正态(Mean(Mean,SDSD,95%CR95%CR) ),对数正态,对数正态(G)(G),偏态,偏态(M, Q/R(M, Q/R,P P2.52.5P P97.597.5) ) (双(双/ /多变多变量量- -相关回归)相关回归)对比对比:变量:

3、变量= =两组观察值(各组均数与标准两组观察值(各组均数与标准差),变量差),变量= =差值(差值的均数与标准差)差值(差值的均数与标准差)2. 置信区间任务例:某总体指标在哪一区间例:某总体指标在哪一区间 ?(借鉴反推)(借鉴反推)数据数据:计数(直接法:计数(直接法/ /正态近似),计量(正正态近似),计量(正态法),等级(正态近似)态法),等级(正态近似)分布分布:正态(正态法),对数正态:正态(正态法),对数正态(lg(lg值置值置信区间信区间) ),偏态(百分位数法),偏态(百分位数法) 对比对比:变量参数置信区间,差值参数置信:变量参数置信区间,差值参数置信区间(临床试验)区间(临

4、床试验)3. 假设检验任务例:某例:某2 2个总体指标相同个总体指标相同 ? (直接应用概率分布直接应用概率分布)数据数据:计数(正态近似法:计数(正态近似法u u, ,卡方),计量卡方),计量(均数检验),等级(秩和检验)(均数检验),等级(秩和检验)分布分布:正态(:正态(u u,t,t),对数正态(),对数正态(lglg值值t t检验)检验),偏态(秩和检验),偏态(秩和检验)对比对比:组间比较(:组间比较(u u, , t t, , H H),与总体比较),与总体比较(u u, , t t, , H H)统计推断中的误差估计最基本公式:最基本公式:误差误差= =个体变异程度个体变异程度

5、/ /n n的平方根的平方根均数误差均数误差 = = 标准差标准差/sqrt(/sqrt(n n) )率的误差率的误差 = sqrt = sqrtp p(1-(1-p p)/ )/ n nn大小举例1 1、n n=3=3,三个克隆,三个克隆2 2、女大学生、女大学生33%33%自动退学?自动退学? n n= =?3 3、n n1 1=20=20,n n2 2=100=100,n n= =?4 4、19871987年某产科医师为研究胎次与儿童智年某产科医师为研究胎次与儿童智力的关系,收集病案资料(考上大学人数):力的关系,收集病案资料(考上大学人数):第一胎第一胎1919人、第二胎人、第二胎18

6、18人、第三胎人、第三胎1010人、第人、第四胎四胎7 7人、第五胎人、第五胎4 4人。由此得出结论:智力人。由此得出结论:智力与胎次有关,胎次愈多智力愈差,第一胎智与胎次有关,胎次愈多智力愈差,第一胎智力最好。力最好。 n n= =?可重复原则样本含量(样本含量(SampleSample)的估计是临床研)的估计是临床研究科学设计的重要内容。究科学设计的重要内容。可重复性,是指任何科学研究必须遵可重复性,是指任何科学研究必须遵守的原则,其目的是要排除偶然因素守的原则,其目的是要排除偶然因素的影响,得出科学的、真实的、规律的影响,得出科学的、真实的、规律性的结论。性的结论。样本含量的大小在临床研

7、究中,样本含量越小,其抽在临床研究中,样本含量越小,其抽样误差越大。样误差越大。若样本含量不足,可重复性差,检验若样本含量不足,可重复性差,检验效能低,不能排除偶然因素的影响,效能低,不能排除偶然因素的影响,其结论缺乏科学性、真实性。其结论缺乏科学性、真实性。若样本含量过大,试验条件难以严格若样本含量过大,试验条件难以严格控制,容易造成人力、物力和时间上控制,容易造成人力、物力和时间上的浪费。的浪费。估计样本含量的目的在保证某个临床试验在保证某个临床试验/ /临床研究的结论临床研究的结论具有一定科学性、真实性和可靠性前具有一定科学性、真实性和可靠性前提下,确定某研究所需的提下,确定某研究所需的

8、最小观察例最小观察例数数。二、估计样本含量的方法两大类方法1 1、公式法,可满足多种设计的要求,公式法,可满足多种设计的要求,目前应用广泛。目前应用广泛。2 2、查表法,简单、方便,但受条件限查表法,简单、方便,但受条件限制,有时不一定完全适应。制,有时不一定完全适应。三、估计样本含量的步骤1、确定设计方法任何临床试验,其设计方案是首先需任何临床试验,其设计方案是首先需要确定的,而样本含量的估计也是在要确定的,而样本含量的估计也是在设计方案基础上的。不同的临床科研设计方案基础上的。不同的临床科研设计方法,其样本含量的估计方法不设计方法,其样本含量的估计方法不相同相同2、确定资料类型当临床试验的

9、设计方案确定后,需要当临床试验的设计方案确定后,需要确定临床试验所得数据的类型,例如,确定临床试验所得数据的类型,例如,计量计量(数值)、(数值)、计数计数(无序分类)、(无序分类)、等级等级(有序分类),因为样本含量估(有序分类),因为样本含量估计方法与数据类型有关计方法与数据类型有关3、考虑统计方法样本含量的估计还要与以后将要使用样本含量的估计还要与以后将要使用的统计方法的条件相结合。如的统计方法的条件相结合。如单因素单因素分析分析、相关与回归相关与回归、多因素分析多因素分析等。等。目前样本含量估计的公式计算主要针目前样本含量估计的公式计算主要针对单因素分析,而多因素分析的例数对单因素分析

10、,而多因素分析的例数估计请参考有关书籍估计请参考有关书籍4、确定基本参数 在各种临床科研设计方法的样本含量估计中,在各种临床科研设计方法的样本含量估计中,需要研究者事先确定的条件有:需要研究者事先确定的条件有:第一类错误的概率第一类错误的概率,第二类错误概率,第二类错误概率,容许误差容许误差。若终点指标为数值变量时,还需要研究者确若终点指标为数值变量时,还需要研究者确定总体标准差定总体标准差。若终点指标为分类变量时,有时需要研究者若终点指标为分类变量时,有时需要研究者确定总体率确定总体率。(1)确定第一类误差的概率所有样本含量估计公式中,都需要所有样本含量估计公式中,都需要u u的的值,研究者

11、确定检验水准(值,研究者确定检验水准()的大小)的大小后,查表得后,查表得u u值。值。有有单侧单侧与与双侧双侧之分,单侧之分,单侧的的u u小于双小于双侧侧u u值,所以按单侧计算的样本含量小值,所以按单侧计算的样本含量小于双侧。于双侧。越小所需样本含量越大,反之越小,一越小所需样本含量越大,反之越小,一般取般取 0.050.05样本含量计算中,需要样本含量计算中,需要u u的值,即研究者确的值,即研究者确定定大小后,查表的大小后,查表的u u值。值。确定确定大小,主要是要确定检验效能大小,主要是要确定检验效能(PowerPower),用),用1-1-表示其概率的大小,检表示其概率的大小,检

12、验效能是指总体间确有差别时,假设检验能验效能是指总体间确有差别时,假设检验能发现这种差别的能力大小。发现这种差别的能力大小。为第二类误差的概率,为第二类误差的概率,值越小,检验效值越小,检验效率越高,所需样本量也就越大,通常率越高,所需样本量也就越大,通常=0.1=0.1或或=0.2=0.2。一般认为检验效率不能小于。一般认为检验效率不能小于0.70.7。(2)确定第二类误差的概率(3)确定容许限或插座 即有临床意义或研究意义的即有临床意义或研究意义的最小差值最小差值。若为数值变量时,若为数值变量时,可为有临床意义的均数可为有临床意义的均数差值、实验前后之差等。差值、实验前后之差等。若为分类资

13、料,若为分类资料, 可为有临床意义的有效可为有临床意义的有效率、患病率等率之差。率、患病率等率之差。(4)确定总体标准差总体率若研究的终点指标为数值变量时,总体标若研究的终点指标为数值变量时,总体标准差准差为估计样本含量所必须的条件。为估计样本含量所必须的条件。若研究的终点指标为分类变量时,有时,若研究的终点指标为分类变量时,有时,总体率总体率为估计样本含量条件。为估计样本含量条件。若总体标准差若总体标准差和总体率和总体率,常常通过文,常常通过文献检索、预试验或对研究作出合理的假设献检索、预试验或对研究作出合理的假设来获得。来获得。5、计算样本含量用按设计方案、资料类型及可能涉及用按设计方案、

14、资料类型及可能涉及的统计分析方法来选择样本含量的计的统计分析方法来选择样本含量的计算方法(算方法(查书查书),也可以利用统计软),也可以利用统计软件帮助完成样本含量的计算。件帮助完成样本含量的计算。6、校正样本含量由于估算的样本含量是最少需要量,由于估算的样本含量是最少需要量,考虑到受试者可能有不合作者、中途考虑到受试者可能有不合作者、中途失访、意外死亡等情况出现,而减少失访、意外死亡等情况出现,而减少有效观察对象的例数(有效观察对象的例数(失访失访),因此,),因此,应该在估算的样本含量增加若干样本应该在估算的样本含量增加若干样本例数。例数。通常,失访人数不得大于通常,失访人数不得大于20%

15、20%。 四四、样本含量估计的注意事项1.组间例数相等成组设计的例数,应尽可能采用例数相等成组设计的例数,应尽可能采用例数相等的设计,尤其是多组设计时,一般要求各的设计,尤其是多组设计时,一般要求各组间的样本含量相等,只有在某些特殊情组间的样本含量相等,只有在某些特殊情况下才考虑各组的样本含量不相等。况下才考虑各组的样本含量不相等。2.多指标估算若某研究有多个效应指标,其样本含量估计应若某研究有多个效应指标,其样本含量估计应对每个效应指标进行样本量的估计,然后取样对每个效应指标进行样本量的估计,然后取样本数量最大者为其研究的样本量。本数量最大者为其研究的样本量。若某研究能区分主要指标和次要指标

16、时,也可若某研究能区分主要指标和次要指标时,也可以只对主要指标进行样本含量估计,然后取量以只对主要指标进行样本含量估计,然后取量大者为其研究的样本含量。大者为其研究的样本含量。3.多种估计条件尽可能将多尽可能将多样本含量估本含量估计方法方法联合使用,并合使用,并且在使用且在使用计算法估算算法估算时,可多做几种估算方,可多做几种估算方案,以便案,以便选择。如:不同的如:不同的、等条件等条件组合下,估合下,估计其其样本含量。本含量。4.与研究目的结合根据研究目的,严格选择估算样本含量的根据研究目的,严格选择估算样本含量的方法,如单、双侧不同,估计参数与假设方法,如单、双侧不同,估计参数与假设检验不

17、同,一般假设检验与等价检验不同,检验不同,一般假设检验与等价检验不同,样本率超过与位于()范围不同,样本率超过与位于()范围不同,t t检验检验与与u u检验不同等。检验不同等。5.估计的适用条件目前,国内有关书籍提供的样本含量计目前,国内有关书籍提供的样本含量计算公式,主要适用于临床试验,而并非算公式,主要适用于临床试验,而并非适用于其他医学实验,如动物实验。适用于其他医学实验,如动物实验。动物实验的样本含量可以参考临床试验动物实验的样本含量可以参考临床试验的样本含量,并在此基础上适当减少其的样本含量,并在此基础上适当减少其数量。数量。五、数值变量的样本含量估计简介两均数比较的估算实例分析(

18、例数相等)欲研究某新药降低高血脂患者的胆固醇疗效,欲研究某新药降低高血脂患者的胆固醇疗效,研究者认为试验组与安慰剂组比较,其血清胆研究者认为试验组与安慰剂组比较,其血清胆固醇值平均下降固醇值平均下降0.5mmol/L0.5mmol/L才有临床意义,查才有临床意义,查阅文献得血清胆固醇值的标准差为阅文献得血清胆固醇值的标准差为0.8mmol/L,0.8mmol/L,且规定两组例数相等,且且规定两组例数相等,且=0.05=0.05, =0.10=0.10(power=0.90power=0.90),),该研究所需的研究所需的样本本含量含量为多少?多少?计算结果例数不相等实例分析(例数不等)某医院研

19、究吲螨酰胺治疗原发性高血压的疗效,经某医院研究吲螨酰胺治疗原发性高血压的疗效,经预试验得治疗前后舒张压差值(预试验得治疗前后舒张压差值(kPakPa)资料如下,)资料如下,若若=0.05=0.05, =0.10=0.10时需治需治疗多少例?多少例?均数均数标准差标准差吲螨酰胺吲螨酰胺2.281.09安慰剂安慰剂1.320.40计算结果六、分类变量的样本含量估计简介两个率比较的估算实例分析(例数相等)用旧的治疗方案治疗慢性肾炎的控制率为用旧的治疗方案治疗慢性肾炎的控制率为30%,现用新的治疗方案治疗慢性肾炎,其,现用新的治疗方案治疗慢性肾炎,其控制率应大于控制率应大于50%才有临床意义,若取两组

20、才有临床意义,若取两组例数相等,且例数相等,且=0.050.05、 =0.10=0.10(power=0.9power=0.9),),问每每组需多少例需多少例数?数?计算结果例数不等实例分析(例数不等)某医师研究某药对产后宫缩痛、外阴创某医师研究某药对产后宫缩痛、外阴创伤痛效果,预试验旧药镇痛率为伤痛效果,预试验旧药镇痛率为55%,新,新药镇痛率为药镇痛率为75%,当,当=0.05, =0.10时需需观察多少例能察多少例能说明新明新药镇痛效果痛效果优于于旧旧药?计算结果样本含量与统计分析特例1 1、分子、细胞、组织水平的研究:专业判、分子、细胞、组织水平的研究:专业判定样本含量,不计算、不必假设检验。定样本含量,不计算、不必假设检验。2 2、药物临床试验:就高不就低。、药物临床试验:就高不就低。3 3、特小样本:报告绝对数,如治疗、特小样本:报告绝对数,如治疗5 5人,治人,治愈愈4 4人人4 4、特大样本:专业上判定,不作假设检验、特大样本:专业上判定,不作假设检验(不适用)。(不适用)。5 5、检验效能:要用调和均数、检验效能:要用调和均数

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号