非劣效性试验

上传人:大米 文档编号:456154033 上传时间:2023-10-03 格式:DOCX 页数:11 大小:18.68KB
返回 下载 相关 举报
非劣效性试验_第1页
第1页 / 共11页
非劣效性试验_第2页
第2页 / 共11页
非劣效性试验_第3页
第3页 / 共11页
非劣效性试验_第4页
第4页 / 共11页
非劣效性试验_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《非劣效性试验》由会员分享,可在线阅读,更多相关《非劣效性试验(11页珍藏版)》请在金锄头文库上搜索。

1、资料范本本资料为word版本,可以直接编辑和打印,感谢您的下载非劣效性试验地点:时间:说明:本资料适用于约定双方经过谈判,协商而共同承认,共同遵守的责任与 义务,仅供参考,文档可直接下载或修改,不需要的部分可直接删除,使用时 请详细阅读内容临床非劣效性与等效性评价的统计学方法临床非劣效性与等效性评价的统计学方法以安慰剂作为对照的随机双盲临床试验一直被视为药物开发中的金标准, 它在确认新的试验药物的疗效优于安慰剂方面发挥着重要的作用。然而,如果 有现成的疗效肯定的药物,仍用安慰剂对照做临床试验,会面临伦理上的困 难。随着愈来愈多可供应用的有效药物的出现,疗效有突破的新药愈来愈少, 因而药物临床研

2、究的目的发生了转变。在阳性对照试验中,更多的情形是探求 新药与标准的有效药物相比其疗效是否不差或疗效相等(严格地说,疗效相等应 该是既不比标准药差,也不比标准药好),而并不一定要知道新药是否优于标准 药,由此而提出了非劣效性/等效性试验(noninfer_iority/equivalencetrials)。非劣效性/等效性试验与通常意义下的优效性试验(superioritytrials) 在设计和统计分析上是有区别的。近年来,尽管对设计和分析该类试验已给予 强调,但遗憾的是,许多非劣效性/等效性临床试验的评价缺少针对性,仍仿照 安慰剂对照试验的方式进行,因而导致了非劣效性/等效性试验的样本含量

3、估 计、无效假设和备选假设确定、统计学分析和结论推断等方面的不够合理,难 以达到设想的目的。本文拟主要介绍有关非劣效性/等效性试验中涉及的统计学分析方面的一些 具体问题,至于在设计时还必须考虑的有关对照的选定等问题可参考文献及 ICH文件E10:“临床试验对照的选择”。1非劣效性/等效性界值从临床上讲,一种新药的药效不比标准对照药差,到底临床上可接受的最 大允许的范围是多少呢?或者说,新药比对照药最低到多大程度才能算“非劣 效(noninferiority)”呢?类似地,新药和对照药的疗效相比,最低不能低 于多少以及最高不能超过多少才可认为是等效(equivalence) ”呢?这就涉 及到临

4、床非劣效性/等效性界值(nonferiority/equivalencemargin)的问题。 为叙述方便,我们统一用5表示界值,并以-6表示劣侧界值,以5表示优 侧界值。显然,非劣效性试验仅用-6 一个界值,而等效性试验要用-6和5 两个界值。6是一个有临床意义的值,该值的选定至关重要。若6选大了,将把药 效达不到要求的药物判断为非劣效或等效而推向市场;若6选小了,则可能会 埋没一些本可推广使用的药物。这一数值不应大于安慰剂对照的优效性试验确 认有效的效应差值。一般来说,6的决定应该由临床学家和统计学家商讨联 合做出,而不是单独地依赖统计学家。注意,选定6时一定要从临床药效角 度,结合以往的

5、试验结果,必要时进行成本效益分析等诸多方面反复论证。6 界值必须在试验的设计阶段决定并在试验方案中阐明,一旦确定,事后不得随 意更改。除非发现新的6界值比原先选定的6界值更合理,在揭盲之前可作 更正,并在修订方案中陈述理由。一旦揭盲,不得更改。根据既往的经验,对有些临床定量指标的等效界值,有学者提供了可供参 考的建议标准,例如血压可取为0.67kPa (5mmHg),胆固醇可取为 0.52mmol.L-1 (20mg.dl-1),白细胞可取为 0.5X109.L-1 (500 个/mm3);当 难以确定时,可酌取1/51/2个标准差或参比组均数的1/101/5。对两组率 而言,有人建议6最大不

6、应超过对照组样本率的1/5。有作者指出,6不能过 小,否则,所需的样本含量可能会不切实际。尽管6值的选定并不容易,但若试验的目的就是为了确认非劣效性/等效 性,人们也不得不面对这些困难并解决之。药理试验设计与统计例1:为了显示一种新药血管紧张素II拮抗剂(Allantagonist)治疗轻中 度原发性高血压的降压效果是否不差于标准药血管紧张素转换酶抑制剂 (ACEinhibitor),请按照非劣效性试验的要求制定非劣效界值6。该试验以药物ACE作为阳性对照,试验的主要终点指标取仰卧舒张压 (SDBP,单位为mmHg)。既往的许多ACE与安慰剂的对照试验显示,两组SDBP 与基线相比平均舒张压下

7、降值的差值至少达到10mmHg才能认可药物的疗效,即 最小的药物效应差值=10mmHg。基于临床和统计学的综合考虑,经讨论认为用 6=3mmHg(约为的30%)作为非劣效性试验的界值是合理的。2判定非劣效性/等效性的假设检验方法假设检验(hypothesestesting)是基于一定的检验假设进行推断的一类方 法。我们平时所做的绝大多数检验假设为两组相等的零假设,其统计推断往往 仅限于两者的差别有无统计学意义,若Pa,意味着统计上“不能拒绝零假 设”,但并非说明零假设成立,更没有理由说两组相等,因为检验的效能(poweroftest)未知;如PWa,虽然可拒绝零假设,但也只能推断两者 在统计上

8、有差别,而不能评价差别的大小。这难以满足临床实际中需要评价疗 效差别的要求。为了能对非劣效性/等效性进行推断,需要建立有别于传统的检 验假设。为方便叙述,统一用如下符号作为组别或参数:T二试验治疗组,也泛指相应组效应的参数(均数或率)S二标准治疗组,即阳性对照组,也泛指相应组效应的参数(均数或率)5=非劣效/等效界值。非劣效性试验用-6,等效性试验用-6和52.1检验假设的构建和检验用统计量无效假设(nullhypotheses)和备选 假设(alternativehypotheses)分别用H0和Ha表示。以a作为总的检验水 准。表1列举了几种不同情形下的检验假设和检验统计量计算的通用公式。

9、表1不同试验类型的检验假设本表所示的检验统计量假设数据来自大样本,数据分布正常。其中d为T 组样本效应值减去S组样本效应值的差值,即d=T-S,sd为d的标准误。z为 检验统计量,服从标准正态分布。2.2结论的推断2.2.1非劣效性试验由于只进行一次单侧检验(one_sidedtest),若 PWa,则H0被拒绝,可推论丁非劣效于S;若Pa,则还不能下非劣效的结 论。这里的a含义是,当T比S疗效差,其效应差值实际上超过5时,错误 地下T非劣效于S结论的概率。2.2.2等效性试验由于需要在两个方向上同时进行两次单侧检验 (twoone_sidedtests),故亦需分别推断。若P1Wa/2和P2

10、Wa/2同时成立 (注意每次检验的水准只用总的检验水准a的一半),则两个无效假设均被拒 绝,前者推论T不比S差,后者推论T不比S好,因此综合的推断是T和S具 有等效性;若P1和P2中的任何一个大于a/2,则不可下等效的结论。这里的 a含义是,当T与S的疗效差值实际超过6(包括差-6以下或好5以上两 种情况)时,错误地下T和S等效结论的概率。2.2.3优效性试验有两种不同的情形。一种是严格意义上的,从统计学的 角度考虑的优效性,这时所用的假设为通常的零假设,为单侧检验。目前临床 试验中一般用此概念。如果能拒绝无效假设,可下统计学意义上优效的结论。 当然这种优效性较弱,有时可看作是边缘优效性。另一

11、种是从临床意义上提出的优出一定量的优效性,姑且也用5表示该 量。此时若拒绝无效假设,可下临床优效性的结论。3判定非劣效性/等效性的可信区间方法可信区间方法亦可用于非劣效性/等效性的判定,该方法通过构建有关参数 差别的可信区间(confidenceinterval,缩写为CI)作为评价的决策准则。CI 方法在ICH的指导原则中曾予以推荐,指出:对非劣效性或等效性试验安全性 与耐受性的评价,应用可信区间比用假设检验更佳。一些具体的方法,可参见 文献。假定总的可信度取100(1-a)%,以CL表示可信区间的下限,以CU表示 可信区间的上限。3.1非劣效性试验按单侧100(1-a)%可信度,计算出T-

12、S可信区间的下限 CL,若CL,8)完全在-5,8)范围内,或者CL-5,可下非劣效性的结论。3.2等效性试验按双侧100(1-a)%可信度,计算出T-S可信区间的下限 CL和上限CU,若完全在-5,5范围内,或者-5CLCU5,可下临床优效性的结论。例2:继续上例。假使:5=3mmHg,两组合并标准差s=8mmHg,两组样本含 量均为120,取单侧a=0.05,方案规定可用两步法(见后)。主要指标结果: SDBP与基线相比平均下降值,T=14mmHg,S=12mmHg。经计算:d=14- 12=2mmHg,sd=8(1/120+1/120) 1/2=1.033mmHg。第一步:非劣效性评价单

13、侧假设检验:z=(2 + 3)/1.033=4.841.645(z0.95), P-3两种方法均显示,在抗高血压效果方面新药AII拮抗剂与标准药ACE抑制 剂相比具有非劣效性。第二步:优效性评价单侧假设检验:z=2/1.033=1.9361.645, P0结果表明,新药AII拮抗剂比标准药 ACE抑制剂的抗高血压效果具有统计学意义优效性。ICHE9指导原则中的建议更保守些,若按a取0.025的标准判断,非劣效 性评价的z=4.841.96(z0.975),P0.025,可下非劣效性结论。但是,因优 效性评价的z=1.9360.025,尚不能认为具有统计学优效性,更达不 到临床意义上的优效性。有

14、一种情况值得注意,即求得的可信区间的下限大于-6,但上限却比0 小,管理当局比如美国的FDA可能仍然把试验药看作和标准药不等效,甚至比 标准药还差,尽管非劣效性的标准已经达到了。这一额外增加的标准之严格, 似乎并不是从统计学意义上考虑的。事实上,这对很高效地完成试验而出现了 窄小的CI可能是不公正的。4非劣效性/等效性试验样本含量估计及检验效能对服从正态分布的数据(定量指标)和服从二项分布的数据(率指标)分 别介绍。4.1定量指标4.1.1非劣效性试验按照单侧的检验水准a,要求允许的二类误差概率不 超过B,在T=S的条件下,非劣效性试验每组需要的样本含量为:n=2(Z1-a+z1-B)(s/6

15、)2检验效能为:1-3=6(2s2/n)-1/2-z1-a式中s为两组的合并标准差。n为每组的样本含量。代表标准正态分布 下x左侧的概率Pr。例3:上例继续。若按非劣效性设计试验,假定,a=0.05,B=0.10,将 有关量:z0.95=1.645, z0.90=1.282, s= 8mmHg,5=3mmHg 代入公式则可求得 每组的样本含量为:n=2(1.645 + 1.282)(8/3)2=121.8e1224.1.2等效性试验按照双侧的检验水准a (等同于按单侧的a/2),要求 允许的二类误差概率不超过B,在T=S的条件下,等效性试验每组需要的样本 含量为:n=2(Z1_a/2 + z1_3)(s/8)2检验效能为:1-3=2 6(2s2/n)-1/2-z1-a-1例4:上例继续。假定各参数不变,只是按等效性试验来进行设计,则每组 需要样本含量:n=2(1.96+1.282)(8/3)2=149.5e150可见,等效性试验设计的每组的样本含量要比非劣效性试验增加近30例。4.1.3优效性试验优于阳性标准对照组的试验:按照单侧的检验水准

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号