利用Excel对IVD二分类临床试验数据进行统计分析的方法举例中国器审 20200416临床试验资料中常出现人工数据统计错误的问题,现有临床试验数据 通常使用Excel进行数据的汇总及展示,合理利用 Excel工具,可有 效减少该类错误ExceI作为一个表格工具,除了具有数据记录、筛选等常用的功能外, 还有单元格弓|用及公式等用于统计分析的功能可将这些功能在临床 试验数据表格内部直接进行运算,对临床试验结果进行分析统计下 面以二分类指标的临床试验数据为例进行简要介绍一、数据转换本文以申报试剂对临床诊断结果的灵敏度、特异度为例临床试验数 据表通常包括受试者(样本)编号、年龄、性别、样本类型、临床诊 断结果、考核试剂检测结果等数据列A■ D■ EF _1费试音入组号章龄样玄类型临味倉訂2SKIP 00 L60文血清+3EMMP0026711清4-SW00340里Hi洁晞诊T狛男血清EW005tl玄十EMMPOOS45男SEWOOT43玄血涪确诊9SKMP008气予女ms10IW009刃臭血洛11EKMP0103g剪n清4-12enroll21血清+13JHMP01236男血清14IW0I356S打弓夫三验数捱表示空为了利于后期统计分析,首先进行数据的转换。
在 Excel中,数据表中的临床诊断结果、考核试剂检测结果无论以“确诊/排除”或“+/-”的方 式进行表示,均以文本格式进行记录在进行条件判断时需要使用半 角引号,并且无法进行运算,因此推荐将其转换为“ 0/1 ”的数字格式下面以对“临床诊断”数据进行转换为例通过数据筛选可以看出,临床诊断中以“确诊”和“排除”进行表示需将 确诊转换为“ 1 ”,将排除转换为“ 0”3CD匚 11 *'T韩兀兌型*■RF片感辭远!II立本誉远旧卜£图2圧言夫试昼裂捱表中哽用讳坛孑託对敎捱表示卞注*查卷在数据表格右侧加入“临床诊断”转换列,在与数据首行对应的单元格写如下公式:=IF(E2二"确诊",1,0)所引用单元格(E2)可以通过点击的方式自动写入DEQH:本类型□血洁 血清血猜确诊确诊确珍? 诊萨转换羊元榕中填人转换出衣考樓试別, 检测结果〒_: :1理「确诊丿功 丨 - t zi cgi:cl_test. 'valuej^tmel [value if false);按“回车”之后,可以看到数据表格显示的为“ 1 ”,即“确诊”同理我们 将考核试剂检测结果进行“ 0/1”转换通过筛选功能可以看出考核试剂 检测结果以“ +/-”进行表示。
在诊断转换结果列右侧加入“考核试剂检 测结果”转换列,在与数据首行对应的单元格写如公式 “=IF(F2二" + ",1,0) ”,将考核试剂检测结果转换为“ 0/1”表示A BC 1 D E FH覺礼者入组号i±911?本奘到临瞧谗断*愎试刻_IF庸第断F7書彦试刑匚EEXHPQ0I玄十EI1!PD»267ii若44HHP0C3■ID谕+5EIHPUlM30男iti清6匪HPDO56\玄+iKHPOiie8EHIFD匚 丫431C班HPU瞄55诵谗EHHF00930男11邛 Hpnin弭+12HHFOLI21±1猗+TTWHPm 0IjC甲]|%1S图*庄数捱表中竞成数捱转换四格表分别用a、b、c、d表示四种检测结果与临床诊断结果之间的表1.匹格表不空碼诊■ab检测结果d根据四格表的定义我们对上述转换后的临床诊断结果及考核试剂检测 结果进行判定表2•四格表结果的判定规贝判定标准判定结果诊断=1*考核试剂=1a诊断=0*考核试剂=1b诊断=匚考核试剂=0c诊断=(h考核试剂=0d在数据表格右侧加入“四格表”判定列,在与数据首行对应的单元格将上述判定规则用公式表示:=IF(G2=1,IF(H2=1,"a","c"),IF(H2=1,"b","d"))按“回车”后该格子显示为转换后的四格表结果。
首行数据的转换和判定完成后,选中这三个单元格,将鼠标指针放在 最右侧单元格的右下角,鼠标指针变为“ +”号后向下拖拽填充所有有数 据的数据行,完成公式填充并展示相应的结果图6•将转换、判定公式填充至全部数据行三、构建四格表首先,在数据表的空白表格处绘制一个四格表其中G代表临床诊断结果,T代表考核试剂检测结果根据四格表定义,四表格的每个格子分别统计在上述“四格表”统计结果列中相应字母的数量以a格为例,该格子公式应写为:“二COUNTIF(I:I,"a") ”1 JKLM _L3 1G+G--COUNTIRI□+baT-cdc^d总a + cinda+b^c+d CC2CCS 8H榕表中写入相•应说出式同理,根据定义将b、c、d格子修改为统计相应字母数量的公式其 中所统计的数据列(I:I)可以通过点击列名自动填入四个格子统计 完成后将汇总格公式修改为相应格子的求和公式,完成数据汇总 JKLG-G-总T+5076T-131124总6337100要9,左驶匹蓉表寰抠填充四、数据统计四格表最终结果通过灵敏度、特异度、总符合率及这三个率的 95%置 信区间进行表示首先我们在上面已绘制的四格表下绘制展示这些统 计量的表格。
G+T十50T-13总63G-总2676112437100点估计 置信区冋下限 置信区间上限灵敏度特异度 总符含率图10 •绘制统计量计算憲格根据统计量的定义在表格中写入相应的公式进行统计例如,灵敏度是临床诊断为“确诊”的受试者中考核试剂检测结果为“阳性”的比例,那么在灵敏度点估计格子就写入公式:“二K3/K5 ”G十GT-50631总? 1L填人比计董计算心瓦灵敏度 特异度 总符合率点怙计 置= K3/K5同理,将其他点估计公式根据定义写到相应的单元格中图12•完成统廿量点信廿廿算G+总T+r bo2676It-131124总6337100点估计置信区间下限置信区间上限灵敬度0.793650794特异度0.297297297总符合率061置信区间的计算有多种方法,对于二分类数据目前其可信区间按二项分布近似正态计算,在极端情况不够保守,因此推荐按照威尔逊置信区间计算方法进行计算口该公式相对复杂,可在文章末尾所提供的附 件表格中进行查看使用时将单元格内容保持与四格表的行、列相对 位置关系进行粘贴即可展示结果在数据计算完成后,将单元格格式 修改为百分比G +G-T十502G76T-131124总6337100点估计置信区间下限宣信区间上限灵敏度0.793350794B7.S3ft87.52^特异度0 29729723717.49ft45.78^总符合率0.61—51.20%69.98%進单式站 WT * 也至 WE W |货币日期时闫79.37%■d锻位数回!卜百分比百分岀搭族单元略中数詡且100r并比百分数形式显示「恥肖图13.修改单元格格式至此便完成了二分类结果的灵敏度、特异度及总符合率的统计。
注朮烦文二数喘为举使・K具有实际意朮图14•完成统计表貉五、注意事项在使用Excel进行上述统计时,应当特别注意原始数据的处理,应当 用同样的方式表示结果的阴、阳性在将多个中心的数据进行合并时 可以进行手动的替换以保证数据进行“ 0/1”转换时的准确同时,在实际的工作中发现,在原始试验结果单元格中会在结果前有一个或多个不可见的空格,导致影响“ 0/1”结果的转换应当去除本文为一般情形下的二分类临床数据的统计分析的 Excel工具使用举例,具体产品应根据实际情况选择使用,亦可选择其他统计工具参考文献:[1] Wilson E B. Probable inference, the law of succession, and statistical inference[J]. Journal of the American Statistical Association, 1927, 22(158): 209-212.。