临床试验样本量的估算?????样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知 的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料) 或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资 料和文献获得,不过很多时候很难得到或者可靠性较差因此样本量估计有 些时候不是想做就能做的SFDA的规定主要是从安全性的角度出发,保证 能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把 握能做出显着来但是中国的国情?有多少厂家愿意多做?建议方案里这么写:??????从安全性角度出发,按照 SFDAXX规定,完成100对有效病例,再 考虑到脱落原因,再扩大20%,即120对,240例或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰 剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别 为65.0%和42.9% ,则每个治疗组中能接受评价的病人样本数必须达到 114例(总共228例),这样才能在单侧显着性水平为5%、检验功效为90%的 情况下证明试验组疗效优于对照组假设因调整意向性治疗人群而丢失病 例达10%,则需要纳入病人的总样本例数为 250例。
非劣性试验(a =0.05, (3 =0.2)时:计数资料:平均有效率(P) 等效标准(S)N=公式:N=12.365X P(1-P)/ 8 2计量资料:共同标准差(S)等效标准(8)N=公式:N=12.365X (S/8 )2等效性试验(a =0.05,B =0.2)时:计数资料:平均有效率(P)等效标准(8)N=公式:N=17.127X P(1-P)/ 8 2计量资料:共同标准差(S)等效标准(8)N=公式:N=17.127X (S/8 )2上述公式的说明:1) 该公式源于郑青山教授发表的文献2) N是每组的估算例数N仁N2 ,N1和N2分别为试验药和参比药的例 数;3) P是平均有效率,4) S是估计的共同标准差,5) 8是等效标准6) 通常都规定a =0.05 (3 =0.2(把握度80%)上述计算的例数若少于国家规定的例数,按规定为准;多于国家规定的则以 计算值为准具体规定的最小样本量如下:II期,试验组100例;III期,试验组300例;随机对照临床验证(如 3类 化药)试验组100例IV期,2000例疫苗和避孕药与上述要求不同例1:某新药拟进行II期临床试验,与阳性药按1:1的比例安排例数,考 察新药临床治愈率不差于阳性药。
根据以往的疗效和统计学的一般要求,取a =0.05 3 =0.2等效标准8 =0.15平均有效率P=0.80 ,每组需要多少病 例?由公式计算得,N=12.365X 0.8(1-0.8)/0.152=88( 例)以上88例低于我国最低例数(100例)的规定,故新药至少取100例进 行试验如上例作等效性分析,则得,N=17.127X 0.8(1-0.8)/0.152=122(例)例2 :某利尿新药拟进行II期临床试验,与阳性药按1:1的比例安排例数, 考察24h新药利尿量不差于阳性药根据以往的疗效和统计学的一般要求,取a =0.05, 3 =0.2,等效标准8 =60 ml,已知两组共同标准差 S=180 ml , 每组需要多少病例?由公式得,N=12.365X (180/60)2=111 例故本次试验新药和阳性药的例数均不少于 111例如上例作等效性分析,则得,N=17.127X(180/60)2=154(例)[s:11]临床试验研究中,无论是实验组还是对照组都需要有一定数量的受试对象这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明 不了什么问题。
必须通过一定数量的重复观测才能把研究总体真实的客观规 律性显示出来,并且可以对抽样误差做出客观地估计一般说来重复观测次 数越多,抽样误差越小,观测结果的可信度越高一定数量的重复还可起到 部分抵消混杂因素影响的作用,增强组间的可比性但重复观测次数越多(即 样本含量越大)试验所要消耗的人力、物力、财力和时间越多,可能会使试 验研究成为不可能而且,样本含量过大还会增加控制试验观测条件的难度, 有可能引入非随机误差,给观测结果带来偏性(bias)所以在实验设计中落 实重复原则的一个重要问题就是如何科学合理确定样本含量 由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量 相等来估计但在个别情况下,也可能要求各组样本含量按一定比例来估计1与样本含量估计有关的几个统计学参数在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估 计1.1规定有专业意义的差值3,即所比较的两总体参数值相差多大以上 才有专业意义3是根据试验目的人为规定的,但必须有一定专业依据习 惯上把3称为分辨力或区分度3值越小表示对二个总体参数差别的区分 度越强,因而所需样本含量也越大1.2确定作统计推断时允许犯I类错误(“弃真”的错误)的概率a,即 当对比的双方总体参数值没有差到 3。
但根据抽样观测结果错误地得出二者 有差别的推断结论的可能性,a确定的越小,所需样本含量越大在确定 a 时还要注意明确是单侧检验的a,还是双侧检验的a在同样大小的a条件 下;双侧检验要比单侧检验需要更大的样本含量1.3提出所期望的检验效能power,用1- B表示B为允许犯H类错误(“取伪”的错误)的概率检验效能就是推断结论不犯H类错误的概率 1-B称把握度即当对比双方总体参数值间差值确实达到 3以上时,根据抽样 观测结果在规定的a水准上能正确地作出有差别的推断结论的可能性在科 研设计中常把1- (3定为0.90或0.80一般来说1- (3不宜低于0.75,否则 可能出现非真实的阴性推断结论1.4给出总体标准差或总体率n的估计值它们分别反映计量数据和 计数数据的变异程度一般是根据前人经验或文献报道作出估计如果没有 前人经验或文献报道作为依据,可通过预实验取得样本的标准差 s或样本率 P分别作为和n的估计值的估计值越大,n的估计值越接近0.5,所 需样本含量越大亦对以上统计学参数作出规定或估计的前提下,就可以根据不同的推断内 容选用相应的公式计算出所需样本含量 由于在同样的要求和条件下完全随机设计(成组设计)所需样本含量最大,故一般都要按完全随机设计作出样本 含量的估计。
2常用的估计样本含量的方法2.1两样本均数比较时样本含量估计方法(1)两样本例数要求相等时可按下列公式估算每组需观察的例数 nn= 2*[( a +3 )(T/ S ]A2 (公式 1)式中3为要求的区分度,c为总体标准差或其估计值S , a、3分别是对应于a和B的U值,可由t界值表,自由度u -行查出来,a有单侧、双侧之分,B只取单侧值例1,某医师研究一种降低高血脂患者胆固醇药物的临床疗效,以安慰剂作对照事前规定试验组与对照组相比,平均多降低 0.5 mmol/L以上,才有推广应用价值而且由有关文献中查到高血脂患者胆固醇值的标准差为0.8 mmol/L,若要求犯I类错误的的概率不超过 5%犯H类错误的概率不超过10%且要两组例数相等则每组各需观察多少例 ?本例 8 = 0.5 mmol/L , (T = 0.8 mmol/L, a = 0.05 , [3 = 0.10 , 1- [3 = 0.90,查t界值表自由度为乂一行得单侧 t0.05 = 1.645 , t0.1 = 1.282,代 入公式(1)n= 2*[(1.645+1.282) X 0.8/0.5]A2 = 44故要达到上述要求,两组至少各需观察 44例。
2)两样本例数要求呈一定比例(n2/n1 = c)时,可按下列公式求出n1, 再按比例求出n2= c*n 1n1 = [( a + 3 )(T / 8 ]A2*(1+C)/C ( 公式 2)例2对例1资料如一切要求都维持不变,但要求试验组与对照组的例数呈2 : 1比例(即C= 2),问两组各需观察多少例?n1 = [(1.645+1.282) X 0.8/0.5]八2 X (1+2)/2 = 33(例)(对照组所需例数)n2 = 2X 33= 66(例)(试验组所需例数)两组共需观察99例多于两组例数相等时达到同样要求时两组所需观察 的总例数2X44= 882.2配对设计计量资料样本含量(对子数)估计方法配对设计包括异体配对、自身配对、自身前后配对及交叉设计的自身对照,均可按下列公式进行样本含量估计n= [( a + B) (T d/ S ]A2 (公式 3)式中S、a、B的含义同前,t d为每对差值的总体标准差或其估计值sd例3某医院采用自身前后配对设计方案研究某治疗矽肺药物能否有效地增加矽肺患者的尿矽排出量事前规定服药后尿矽排出量平均增加 35.6mmol/L以上方能认为有效,根据预试验得到矽肺患者服药后尿矽排出量增加 值的标准差sd = 89.0 mmol/L,现在要求推断时犯I类错误的概率控制在 0.05以下(单侧),犯H类错误的概率控制在0.1以下,问需观察多少例矽肺 病人?本例 S = 35.6 mmol/L , sd = 89.0 mmol/L ! a = 0.05 , [3 = 0.10。
1- 3 = 0.90,单侧 t0.05 = 1.645 , t0.1 = 1.282,代入公式 ⑶ 得到n = [(1.645+1.282) X 89/35.6]八2 = 54(例)故可认为如该药确实能达到平均增加尿矽排出量在 35.6 mmol/L以上, 则只需观察54例病人就能有90%勺把握,按照a = 0.05的检验水准得出该 药有增加矽肺病人尿矽作用的正确结论2.3样本均数与总体均数比较时样本含量估计方法可按下式估算所需样本含量nn= [( a +3 ) T/ S ]A2 (公式 4)例4已知血吸虫病人血红蛋白平均含量为 90g/L ,标准差为25g/L,现欲观察咲喃丙胺治疗后能否使血红蛋白增加,事先规定血红蛋白增加 10g/L以上才能认为有效,推断结论犯I类错误的概率a (双侧)不得超过0.05 ,犯 H类错误的概率B不得超过0.10,问需观察多少例病人?本例 3= 10g/L , (T = 25g/L, 0.05 = 1.96(双侧),0.10 = 1.282 代入公 式⑷得:n= [(1.960+1.282) X 25/10]A2 = 66(例)故如果咲喃丙胺确实能使血吸虫病人血红蛋白平均含量增加 10g/L以上,则只需观察66例就可以有90%勺把握在a =0.05检验水准上得出有增加 血吸虫病人血红蛋白平均含量的结论。