样本量估算的统计学方法研究

资源描述

《样本量估算的统计学方法研究》由会员分享，可在线阅读，更多相关《样本量估算的统计学方法研究（49页珍藏版）》请在金锄头文库上搜索。

1、样本量估算的统计学方法研究一临床研究为什么需要估计样本含量复习1 统计学三大任务与三大规则任务描述样本特征估计总体参数检验总体差别规则必须考虑数据类型分布类型对比类型 1 统计描述任务例某样本个体分布的集中趋势与离散趋势怎样 1V点 2V线 3 面影子线数据计数定量平均数等级平均Ridit值分布正态 Mean SD 95 CR 对数正态 G 偏态 M Q R P2 5 P97 5 双多变量相关回归对比变量两组观察值各组均数与标准差变量差值差值的均数与标准差 2 置信区间任务例某总体指标在哪一区间借鉴反推数据计数直接法

2、正态近似计量正态法等级正态近似分布正态正态法对数正态 lg值置信区间偏态百分位数法对比变量参数置信区间差值参数置信区间临床试验 3 假设检验任务例某2个总体指标相同直接应用概率分布数据计数正态近似法u 卡方计量均数检验等级秩和检验分布正态 u t 对数正态 lg值t检验偏态秩和检验对比组间比较 u t H 与总体比较 u t H 统计推断中的误差估计最基本公式误差个体变异程度 n的平方根均数误差标准差 sqrt n 率的误差 sqrt p 1 p n n大小举例 1 n 3 三个克隆2 女大学生33 自动退学 n 3 n1 2

3、0 n2 100 n 4 1987年某产科医师为研究胎次与儿童智力的关系收集病案资料考上大学人数第一胎19人第二胎18人第三胎10人第四胎7人第五胎4人由此得出结论智力与胎次有关胎次愈多智力愈差第一胎智力最好 n 可重复原则样本含量 Sample 的估计是临床研究科学设计的重要内容可重复性是指任何科学研究必须遵守的原则其目的是要排除偶然因素的影响得出科学的真实的规律性的结论样本含量的大小在临床研究中样本含量越小其抽样误差越大若样本含量不足可重复性差检验效能低不能排除偶然因素的影响其结论缺乏科学性真实性若样本含量过大试验条件难以严格控制

4、容易造成人力物力和时间上的浪费估计样本含量的目的在保证某个临床试验临床研究的结论具有一定科学性真实性和可靠性前提下确定某研究所需的最小观察例数二估计样本含量的方法两大类方法 1 公式法可满足多种设计的要求目前应用广泛 2 查表法简单方便但受条件限制有时不一定完全适应三估计样本含量的步骤 1 确定设计方法任何临床试验其设计方案是首先需要确定的而样本含量的估计也是在设计方案基础上的不同的临床科研设计方法其样本含量的估计方法不相同 2 确定资料类型当临床试验的设计方案确定后需要确定临床试验所得数据的类型例如计量数值计数无序分类等级有序分

5、类因为样本含量估计方法与数据类型有关 3 考虑统计方法样本含量的估计还要与以后将要使用的统计方法的条件相结合如单因素分析相关与回归多因素分析等目前样本含量估计的公式计算主要针对单因素分析而多因素分析的例数估计请参考有关书籍 4 确定基本参数在各种临床科研设计方法的样本含量估计中需要研究者事先确定的条件有第一类错误的概率第二类错误概率容许误差若终点指标为数值变量时还需要研究者确定总体标准差若终点指标为分类变量时有时需要研究者确定总体率 1 确定第一类误差的概率所有样本含量估计公式中都需要u 的值研究者确定检验水准的大小后查表得u 值有单侧与双侧之分单

6、侧的u 小于双侧u 值所以按单侧计算的样本含量小于双侧越小所需样本含量越大反之越小一般取 0 05 2 确定第二类误差的概率样本含量计算中需要u 的值即研究者确定大小后查表的u 值确定大小主要是要确定检验效能 Power 用1 表示其概率的大小检验效能是指总体间确有差别时假设检验能发现这种差别的能力大小为第二类误差的概率值越小检验效率越高所需样本量也就越大通常 0 1或 0 2 一般认为检验效率不能小于0 7 3 确定容许限或插座即有临床意义或研究意义的最小差值若为数值变量时可为有临床意义的均数差值实验前后之差等若为分类资料可为有临床意义的有

7、效率患病率等率之差 4 确定总体标准差总体率若研究的终点指标为数值变量时总体标准差为估计样本含量所必须的条件若研究的终点指标为分类变量时有时总体率为估计样本含量条件若总体标准差和总体率常常通过文献检索预试验或对研究作出合理的假设来获得 5 计算样本含量用按设计方案资料类型及可能涉及的统计分析方法来选择样本含量的计算方法查书也可以利用统计软件帮助完成样本含量的计算 6 校正样本含量由于估算的样本含量是最少需要量考虑到受试者可能有不合作者中途失访意外死亡等情况出现而减少有效观察对象的例数失访因此应该在估算的样本含量增加若干样本例数通常失访人数不

8、得大于20 四样本含量估计的注意事项 1 组间例数相等成组设计的例数应尽可能采用例数相等的设计尤其是多组设计时一般要求各组间的样本含量相等只有在某些特殊情况下才考虑各组的样本含量不相等 2 多指标估算若某研究有多个效应指标其样本含量估计应对每个效应指标进行样本量的估计然后取样本数量最大者为其研究的样本量若某研究能区分主要指标和次要指标时也可以只对主要指标进行样本含量估计然后取量大者为其研究的样本含量 3 多种估计条件尽可能将多样本含量估计方法联合使用并且在使用计算法估算时可多做几种估算方案以便选择如不同的等条件组合下估计其样本含量 4 与研究目的结合根

9、据研究目的严格选择估算样本含量的方法如单双侧不同估计参数与假设检验不同一般假设检验与等价检验不同样本率超过与位于0 3 0 7 0 2 0 8 范围不同 t检验与u检验不同等 5 估计的适用条件目前国内有关书籍提供的样本含量计算公式主要适用于临床试验而并非适用于其他医学实验如动物实验动物实验的样本含量可以参考临床试验的样本含量并在此基础上适当减少其数量五数值变量的样本含量估计简介两均数比较的估算实例分析例数相等欲研究某新药降低高血脂患者的胆固醇疗效研究者认为试验组与安慰剂组比较其血清胆固醇值平均下降0 5mmol L才有临床意义查阅文献得血清胆固醇值

10、的标准差为0 8mmol L 且规定两组例数相等且 0 05 0 10 power 0 90 该研究所需的样本含量为多少计算结果例数不相等实例分析例数不等某医院研究吲螨酰胺治疗原发性高血压的疗效经预试验得治疗前后舒张压差值 kPa 资料如下若 0 05 0 10时需治疗多少例计算结果六分类变量的样本含量估计简介两个率比较的估算实例分析例数相等用旧的治疗方案治疗慢性肾炎的控制率为30 现用新的治疗方案治疗慢性肾炎其控制率应大于50 才有临床意义若取两组例数相等且 0 05 0 10 power 0 9 问每组需多少例数计算结果例数不等实例分析例数不等某医师研究某药对产后宫缩痛外阴创伤痛效果预试验旧药镇痛率为55 新药镇痛率为75 当 0 05 0 10时需观察多少例能说明新药镇痛效果优于旧药计算结果样本含量与统计分析特例 1 分子细胞组织水平的研究专业判定样本含量不计算不必假设检验 2 药物临床试验就高不就低 3 特小样本报告绝对数如治疗5人治愈4人4 特大样本专业上判定不作假设检验不适用 5 检验效能要用调和均数

展开阅读全文

样本量估算的统计学方法研究

最新文档