能力验证结果的统计处理和能力评价指南(试用)1

资源描述

《能力验证结果的统计处理和能力评价指南(试用)1》由会员分享，可在线阅读，更多相关《能力验证结果的统计处理和能力评价指南(试用)1（14页珍藏版）》请在金锄头文库上搜索。

1、能力验证结果的统计处理和能力评价指南（试用）1前言本指南对CNAL 能力验证的结果统计处理和能力评价提出建议使用的方法。2适用范围本指南适用于CNAL 的能力验证活动以及将结果应用于CNAL 认可的能力验证活动。3参考文件ISO/IEC 导则 43-1 利用实验室间比对的能力验证能力验证计划的建立和运作APLAC PT001 检测实验室间的比对APLAC PT002 校准实验室间的比对NATA 能力验证指南4统计处理4.1 统计设计4.1.1 能力验证的结果可以以很多形式出现，其数据类型多样，并构成多种统计分布。分析数据的统计方法应与数据类型及其统计分布特性相适应。无论使用哪一种方法对参加者的

2、结果进行评价，一般宜包括以下几方面内容：a）确定指定值；b）计算能力统计量；c）评价能力；d）在某些情况下需预先确定被测样品的均匀性和稳定性。4.1.2 在统计设计中应考虑下列事项及其相互影响：a) 所涉及测试的精密性和真实性；b) 在要求的置信水平下检出参加者之间的最小差异；c) 参加者的数量；d) 待检样品的数目和对每一被测样品进行重复检测/测量的次数。在校准能力验证计划中，应考虑比对的周期；e) 估算指定值所使用的程序，及识别离群值所使用的程序；f) 校准能力验证计划中，参考实验室必须能够给出优于参加者的测量不确定度（应尽量选择拥有国家基标准的实验室）。4.1.3 在缺乏 4.1.2 a

3、)的可靠信息时，可能有必要组织一次先导性实验室间比对(协同试验 )，以获得该信息。4.2 指定值及其不确定度的确定4.2.1 确定指定值的方法有多种，下面是最常用的几种。按不确定度增加的顺序（多数情况下如此）排列如下：a）已知值其结果由特定样品配制（如制备、稀释）时确定。b）有证参考值由定义法确定（用于定量检测）。c）参考值与一个可追溯到国家或国际标准的参考标准物质或标准进行分析、测量或比对检测物品所确定的值。d）由各专家实验室获得的公议值。专家实验室在对被测量的测定方面应具有可证实的能力，其使用的方法已经过确认，并且有较高的精密度和准确度，与通常使用的方法具有可比性。在某些情况下，这些实验室

4、可以是参考实验室。e)从参加实验室获得的公议值利用4.2.3 中的统计量，并考虑到极端结果的影响。4.2.2 为公平地评价参加实验室，以及促进实验室之间和方法之间的协调一致，应确定指定值。这一点通过选择共同的比对小组，并尽可能地使用共同的指定值就可以实现。4.2.3 下述统计量适合于使用公议方法来确定指定值：定性值预先确定的多数百分率的调公议值；定量值适当比对组的平均值，如: a)可以是加权或变换（如修剪平均或几何均值）的平均值；b)中位值、众数或其它稳健度量。4.2.4 在适宜条件下，应该运用“测量不确定度表示指南”（由 BIPM、IEC、IFCC 、ISO、IUPAC 和 OIML 等联合

5、制定）中规定的程序确定指定值的不确定度。4.2.5 极端结果a）在使用参加实验室的数据确定指定值时，所用的统计方法应当使极端结果的影响降至最小，这可以通过使用稳健统计方法或在计算之前剔除离群值来实现（详见ISO5725-2 ）。在规模较大或常规方案中，可用符合相应标准（例如ISO5725-2 ）要求的计算机程序自动识别离群值。b）如果参加者的结果作为离群值被剔除，那么该剔除应仅为了计算总计统计量，而在能力验证报告中仍需对这些结果进行评估，并且给出适当的能力评价。4.2.6 其它需考虑的事项a）按理想情况，如果用参考值或参加者的公议值来确定指定值，协调人应有一个程序来确定指定值的真实

6、度以及检查数据的分布；在确定指定值时，应根据所开展项目的特定技术要求，由技术专家组和统计专家组考虑指定值本身的不确定度要求以及数据的分布状况。指定值的不确定度以及数据分布应能满足所开展项目的技术要求。b）协调人必须有根据其不确定度判断指定值是否可接受的准则。指定值的不确定度应小于具体项目应用中所要求的不确定度。小的程度，根据具体项目的应用目的和要求来确定。4.3 能力统计量的计算4.3.1 单个检测项目的能力4.3.1.1 能力验证结果常需变换成一个能力统计量以便于说明和解释和衡量与指定值的偏差。所用方法的难易程度不同，有的无需处理，有的要经过复杂的统计变换。4.3.1.2 检测能力的评

7、价对于能力验证的参加者而言意义重大。因此，检测项目应该和检测的需要相关，并能被很好地理解或符合特定领域里的惯例。4.3.1.3 变动性度量常用于计算能力统计量和能力验证计划的汇总报告中。适用于以组进行比对的常用例子是：-标准偏差（SD）；-变异系数（ CV）或相对标准偏差（RSD）；-百分数，中位值绝对偏差或其它稳健度值。4.3.1.4 定性结果通常不需要经过计算。定量结果常用的统计量如下（按参加者结果评价变换程度增加的顺序排列）：a）偏差 D = x - X ，这里 x 是参加者的结果值，X 为指定值b）偏差百分比率，D / X * 100 c）百分数或秩d）z 比分数这里 S 是变动性

8、的适当的估计/度量值。这种模式既适用于X 和 S 由参加者结果推导出的情形，亦适用于X 和 S 不是由全部参加者结果推导出的情形（例如，指定值和变动性可作出明确规定时。参见（化学）分析实验室能力验证国际协调方案）。利用稳健统计方法处理结果时，Z =( x - X )/0.7413IQR 。式中 IQR 为四分位间距。e）En 值（该统计量通常用于测量比对计划和测量审核活动）。式中的 ULAB 为参加者结果的不确定度；UREF 是指定值的不确定度。4.3.1.5 注意事项a）参加者结果和指定值之间的简单差值可能足以确定能力，且易被参加者所理解。数值（x - X ）在 ISO5725-4 中称为

9、“实验室偏移的估计值”。b）百分率差反映集中程度的变化，参加者较易理解。c）百分数或秩用于高度离散或偏态分布的结果和按序响应，或不同的响应值有限时的情形。不要轻易使用该方法。d）根据检测数据的性质，应优先考虑对结果实行变换。有时这种变换是必要的，比如，稀释的结果以几何尺度变化，因而可以进行对数变换。e）如果使用统计量作为评价标准（如Z 比分数），变动性的估计必须可靠，即基于足够的观察来减少极端值的影响和降低不确定度。4.4 综合能力值4.4.1 在单一能力验证轮回中，可以根据一个以上的结果对实验室能力进行评估。这种情况出现在一个特定测试物或一组相关的测试物有一个以上测试项目时，这样，将能提

10、供更为全面的测试能力的评估方法。绘图法，如（Youden）图或（ Mandel ）h - 值图，都是表示测试能力的有效手段（见ISO5725-2 ）。a）相同被测量的综合值-满意结果的数目-z 比分数的平均值-绝对偏差的平均值（以单位或百分比表示）-绝对偏差（或平方偏差）之和-重新按比例改变后的z 比分数和（ RSZ）-重新按比例改变后的z 比分数平方和（RSSZ）b）不同被测量的综合值-满意结果的数目或百分比-绝对 z 比分数的平均值-与评价极限相关的绝对偏差的平均值。4.4.2 注意事项a）数值可以根据需要进行变换，这样可使他们都服从相同的假定分布（如Z 比分数服从高斯分布，偏差的平方服

11、从2 分布）。b）对严重影响综合值的极端值应进行检查。4.5 能力评价4.5.1 在建立能力的评价标准前，应考虑能力的度量值是否具有下列特点：a）专家公议：在这种情况下，顾问组或其它资深专家直接确定所报告的数据是否符合要求，专家调查是评价定性检测结果的主要途径。b）与目标的符合性：例如，考虑方法性能指标和参加者被承认的操作水平等。c）数值的统计判定：这里的标准应适用于各种结果值。一般将Z 比分数分为：Z 2 满意结果2 1 不满意结果d）参加者的公议：由一定百分比的参加者或由某个参考标准组提供的比分数数值或结果的范围。如：- 中心百分比（80%，90%或 95%）满意，或- 单侧百

12、分比（最低90%）满意。4.5.2 分割样品方案的设计，目的是识别不当的校准或结果中严重的随机影响。在这些情况下，应依据足够数量的数据和较宽浓度范围的进行评估。为识别和描述这些问题，可采用作图法，特别是实验室间差异对应平均值所作的图。结果用适当的参数或非参数技术的回归分析和残差分析进行比较。4.5.3 只要可能，应使用图示法表示能力（如直方图、误差棒图和Z 比分数次序图）这些图示法可用来表示：- 参加者结果的分布；- 多个检测项目数据间的关系；- 不同方法的分布比较。4.5.3 在利用能力验证计划结果对实验室的能力进行判定时，也应考虑到我国的相关方法或标准的规定。例如，某些实验室出具的数

13、据，在能力验证计划中为离群结果，但可能仍在其相关标准中规定的允差范围之内，该情况下，不应要求实验室进行整改，而是建议其进行整改。鉴于此，利用参加能力验证的结果来对实验室的能力进行判定时，不应作出“合格”与否的结论，而是使用“满意/不满意”或“离群”的概念。4.5.4 利用其他的能力验证方式例如利用测量审核对实验室的能力进行判定时，稳健统计方法或许不适用。应依据被测项目的特性，参照相关标准（包括统计技术方面的标准）进行判定。附件 A: 检测实验室间能力验证计划的结果处理方法A.1 引言本文件概括了CNAL 用于处理能力验证计划结果的程序。但仅适用于检测能力验证计划，而不适用于校准能力验证

14、（测量比对）计划，校准能力验证计划的统计将在附录B 中阐述。在检测验证计划中，结果的评价是建立在与给定值的比较之上，给定值通常是从所有参加者的结果中获得即公议值。本文件中所描述的统计程序能够适用于较大范围的检测能力验证计划。只要可行，能力验证计划的结果分析应尽量采用这些程序，但在某些情况下，也可能需要采用其它更适合的统计技术。对于所有的验证计划，统计分析只是评价其结果的一个部分。如果一个结果被认为是离群值，这意味着，从统计上看它明显的不同于本组的其他结果。然而，从所涉及的具体学科（如化学）的观点看，结果可能没有“错”。这就是为什么规定结果的评价应由统计分析和技术专家联合提出的原因。本附

15、录的A.4、 A.5 和 A.6 列出了实际使用的统计分析（包括某些实例）即能力验证计划最终报告中出现的统计、表格和图表。在 A.2 中将探讨一些在验证计划的筹划过程中需考虑的理论背景；在A.3 条中将描述开始统计分析前需进行的结果的收集、输入和检查。A.2 统计设计提供给实验室的检测物品之间的所有差别已降至最小，因此结果的变异性主要有两个来源: 实验室间的变异（包括测量方法间的变动）和一个实验室内部的变异。我们期望在这两种类型的变异上来进行评价和提供反馈。为了评审实验室间和实验室内这两种变异性，实验室必须进行多于一次（如两次）的相同检测。因此，只要可能，验证计划应设计成能够获得成对的相

16、关结果。如不可能,也可以通过使用成对的同类样品或要求对一个样品检测两次的结果来获得。如果使用成对的样品，它们可以是等同的（ “不易识别的复制件” ）或者存在轻微的差别（即在不同的等级上检测其性质）。依次获得的结果对分成两类：均匀对，期望其结果是相同的（即两个样品完全相同或同一样品检测两次）；以及分散对，其结果稍有差异。对均匀对和分散对这两种类型的结果的统计分析是相同的，但在解释上稍有不同（见A.5）。有些验证计划不可能获得结果对即只能获得单一样品的单个结果。在这种情况下，统计分析稍为简单，但不能区分出两种变异类型间的差别。在验证计划筹划过程中，另一个重要的统计考虑是，所用的分析是基于结果是服从正态分布的假设。这是统计分布中最常见的类型（见下图）。正态分布正态分布是一个连续的、对称的“钟形”曲线，并被定义为大约有68%的值处于平均值的一倍标准偏差内，95%的值处于两倍标准偏差内，99%的值处于三倍标准偏差内。因此，计划组织者（特别是技术专家）必须注意从所用样品中获得的结果应近似于正态分布。例如：对于连续的结果，技术专家必须仔细考虑给

展开阅读全文

能力验证结果的统计处理和能力评价指南(试用)1

最新文档