Log rank 检验所需样本量的测定:迭代非中心法

上传人:油条 文档编号:1235703 上传时间:2017-06-04 格式:DOC 页数:13 大小:38.50KB
返回 下载 相关 举报
Log rank 检验所需样本量的测定:迭代非中心法_第1页
第1页 / 共13页
Log rank 检验所需样本量的测定:迭代非中心法_第2页
第2页 / 共13页
Log rank 检验所需样本量的测定:迭代非中心法_第3页
第3页 / 共13页
Log rank 检验所需样本量的测定:迭代非中心法_第4页
第4页 / 共13页
Log rank 检验所需样本量的测定:迭代非中心法_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《Log rank 检验所需样本量的测定:迭代非中心法》由会员分享,可在线阅读,更多相关《Log rank 检验所需样本量的测定:迭代非中心法(13页珍藏版)》请在金锄头文库上搜索。

1、1Log rank 检验所需样本量的测定:迭代非中心法【摘要 】 目的: 提出一种迭代非中心法, 用于 Log rank 检验所需样本量的测定,并同 LachinFoukes 法进行了比较。方法:预置样本量重复抽样,计算 Log rank 检验统计量及其平均值。调整预置样本量重复操作,当该平均值充分逼近预定非中心参数时,最后预置样本量被看成是所需样本量。结果:该法所得样本量因生存分布而异,可满足 Log rank 检验预定功效。相比之下,LachinFoukes 法所得样本量偏小,用于 Log rank 检验功效不足。结论:迭代非中心法优于 LachinFoukes 法,可用于慢性病和癌症生存

2、研究的设计。 【关键词】 终检Log rank 检验;Monte Carlo 方法非中心法 样本量The Sample Size Determination in Log Rank Test: the Iterative NonCentral ProcedureAbstract Objective:This paper proposes an iterative noncentral procedure for the sample size determination in log rank test and compares it with the LachinFoulkes 2proce

3、dure. Methods: Samplings are performed with a prescribed size. The statistics of log rank test and their average are calculated. Such a course is repeated with adjusted sample sizes. When the average is converged to the interested value of noncentral parameter, the last adjusted sample size is regar

4、ded as the required one. Results: The sample sizes determined by this procedure vary from distribution to distribution and are met with the prescribed power of log rank test. By contrast, the sample sizes from LachinFoulkes procedure are biased to small and unable to meet with the power. Conclusion:

5、 The iterative noncentral procedure is superior to the LachinFoulles procedure and can be applied in planning survival studies on chronic diseases and cancer.Key words censorship; Log rank test; monte carlo method; noncentral procedure sample size众所周知,生存研究所需样本量的测定应以 Log rank 检验1为基础,该检验是生存数据组间比较的标准方法

6、。多年来,人们针对这一目标进行了不懈努力,然而始终未能实现,这是由于该检验是一种非参数检验,没有解析功效函数。3已有的测定方法多基于假定的指数分布28 ,这与 Log rank 检验没有匹配关系。 Lachin (1981)9指出,这是不得已的,又是他 (1986)7 指出,这是不精确的。由于无视生存分布的变异和所得样本量偏小,故不能满足 Log rank 检验的预定功效10 。另一方面,近年出现的基于生存率比较的方法又相对保守11,12 。本研究首先按临床数据实际分析过程说明设计参数赋值依据和生存研究所需样本量测定原则,然后提出迭代非中心法,即借助重复抽样估计其非中心参数,测定所需样本量,并

7、同基于指数分布的方法进行比较。1 原理各组 t “年”生存率点估计与 t “年”生存率检验相匹配,各组各时点条件死亡概率估计与 Log rank 检验相匹配。前一匹配临床乐于接受,但检验功效较低; 后一匹配功效较高, 但估计不够直观。在作临床数据分析时,通常并不在乎匹配关系,比如先作 t “年”生存率点估计,再用 Log rank 检验作组间比较。这致使估计与检验失去匹配,然而有直观高效等优点,不但被认可,且已约定成俗。顺应这一约定,在生存研究设计中,应以各组 t“年”生存率为主4设计参数,针对 Log rank 检验进行样本量的测定。r2 列联表卡方检验所需总样本量 N 取决于非中心参数表达

8、式13:(r-1,)=N (1 )其中, 是非中心参数,r 是组数,r-1 是自由度, 是 I 型错误概率, 是 II 型错误概率。 是非中心卡方,取决于比例(率)i,i=1,r 。给定 r,i 以及组样本分数 qi,经式(1)可测定 N。再按 qi 分配,得各组样本量。若将 i 代之以估计值 i,式(1) 转换为 r2 列联表卡方检验:2(r-1)=N(2)这就是说,E2(r-1)=(r-1,)。Log rank 检验情况特殊:每一个观测时间点被看作一层,该点处于危险数被看作该层样本量。总样本量 N 不能从等号右端分离出来,即不能写成式(2)的形式,故无对应非中心参数表达式。然而,可由 N

9、和所得 2(r-1)反推=2(r-1)/N 。由式(1)可以看出,给定 i,qi, 固定,这时 与 N 呈线性关系。利用多次抽样使的平均值渐近 。当次数足够多时,与 之差可减小到给定误差内,2(r-1)平均值与 (r-1,)之差亦然。因此,以代替 可得总样本量近似值。随抽样次数增加,误差减小,所得样本量成为可接受的。52 方法这里以两组等样本设计为例来说明测定方法。给定 , ,由Haynam 表14查出 (1,)。例如,(1,0.05,0.1)=10.507,(1,0.01,0.05)=17.814。取对照组 t“年”生存率为2,治疗 对照差为 =1-2 ,试验组 t “年” 生存率为1=+2

10、 。取终检比例为 b1=b2=b 。为取得具有给定 t “年”生存率和给定终检比例的总体,比较方便的办法是设置总体分布。死亡时间采用 Weibull 分布:Fi(t)=1-exp(-it),i=1,2 。这种分布通过形状参数产生迥然不同的生存曲线,应用极广。由 i=exp(-it)取 t=1 得 i=-lni 。取=2/3,1,3/2,分别代表下降、恒定、上升危险。终检时间采用指数分布:Ei(t)=1-exp(-it) ,这里,i=ib/(1-b)。设样本量为 n1=n2=n,由此抽取病人(ij,j=1,n) 的死亡和终检时间分别是:Xij=(-i-1lnUij)1/ 和 Yij=(-i-1l

11、nVij)这里, Uij,Vij 是 (0,1) 区间伪随机数。如 XijYij,观测的生存时间为 Tij=Xij,ij=1;如 XijYij,观测的终检时间为Tij=Yij,ij=0。经排序为 Ti1 终检比例估计为 i=1-jij/n 。 t “年”生存率按KaplanMeier 法估计为 i(t) 。第 i 组,i=1,2 ,第 j 阶处于危险数6为:nij=ni-j+1。将两组生存时间混合排序为 Tk,k=1,2n,T1 如此重复 M 次,计算平均终检比例 i、平均生存率 i 以及平均统计量。预定功效 1- 95% 的置信限为(1-)1.96(1-)/M 。这样,每预置一次 n 值,可

12、得对应值。当|-(1,)|(1,)/(2n)时,最后预置的 n 值被认为是每组所需样本量。为方便起见,这里以 LachinFoulkes 法7测定的样本量为初值 n(0),并将本法最终确定的 n 值与此进行比较。3 结果设计参数取值为 =0.05(双侧) ,=0.1,2=0.5 ,b=0,0.1,0.2,0.3 时,两组 Log rank 检验按等样本设计每组所需样本量列入表 2。在该表中,=0.15,0.2,0.25,0.3,即治疗 对照差跨寿命表上半部。预定功效1- 95%的置信限为 0.91.960.90.1/1000=(0.881,0.919)。左栏是 LachinFoulkes 法产

13、生的每组所需样本量,以及由该样本量产生的 Log rank 检验观测功效。中栏是迭代非中心法产生的。表 1 按迭代非中心法在 Weibull 生存分布下测定的两样本 Log rank 检验在寿命表上半部每组所需样本量及其观测功效(略)注:7=0.05(双侧) ,=0.1,2=对照组生存率, =治疗 对照差,试验组生存率 1=2+,b1=b2=b=终检比例,n(0)=LachinFoulkes 法产生的每组所需样本量,n=迭代非中心法产生的每组所需样本量,nc=观测功效校正样本量,1-*=观测功效, n,nc,1-*栏下前一数据来自形状参数 =2/3 各试验集。LachinFoulkes 法产生

14、的样本量随 值的增大而减小,随终检比例的增大而增大。在无终检各试验集,不管下降、恒定或上升危险,其观测功效不变。在有终检时,在下降危险观测功效较低,上升危险观测功效较高。不管下降、恒定或上升危险,观测功效随终检比例升高而下降。它们均低于预定功效 95%的置信限下限。在无终检时,不管下降、恒定或上升危险,由迭代非中心法产生的样本量相同。在有终检时,在下降危险所得样本量较大,上升危险所得样本量较小,均大于由 LachinFoulke 法产生的对应样本量。其观测功效在多数试验集略高于预定功效 95%的置信限上限。将观测功效调低到预定水平得校正样本量,如右栏所示。其数值多比由迭代非中心法产生的样本量略

15、小,随终检比例升高,差别增大。设计参数取值为 =-0.15,-0.2,-0.25,-0.3 时,两组 Log rank 检验按等样本设计每组所需样本量列入表 3。在该表中,治疗 对照差跨寿命表下半部。在多数试验集,由迭代非中心法产生的样本量大8于由 LachinFoulke 法产生的对应样本量。其观测功效在无终检和低终检水平在预定功效 95% 的置信限内,只是在高终检水平高于其 95%的置信限上限。表 3 按迭代非中心法在 Weibull 生存分布下测定的两样本 Log rank 检验在寿命表下半部每组所需样本量及其观测功效(略)注释同表 2。4 讨论Log rank 检验的来历可追溯到 Cochran 检验 (1954)15 。这用于分层资料两比例(率) 的综合比较,表达为自由度为 1 的卡方量。从它的表达式可分解出总样本量 N。以两比例 (率)为设计参数,由统计量可转换出非中心参数表达式 (1,)=N,从而可测定所需总样本量 N=(1,)/。各层样本量为 QiN,Qi 是层样本分数,i=1,R。第 i 层每组样本量为 QiqjN ,qj 是组样本分数,j=1,2。Mantel 和 Haenszel(1959)16将 Cochran 统计量分母中的层样本量 QiN 代之以 QiN-1,在分子中用校正项-1/2。总样本量 N 不

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 大学论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号