分析测试中的数理统计_.ppt

资源描述

《分析测试中的数理统计_.ppt》由会员分享，可在线阅读，更多相关《分析测试中的数理统计_.ppt（146页珍藏版）》请在金锄头文库上搜索。

1、分析测试中的数理统计臧慕文北京有色金属研究总院分析测试技术研究所国家有色金属及电子材料分析测试中心 1数理统计在分析测试中应用的必要性2数理统计中的一些基本概念3分析测试数据的基本特性4分析测试数据的可靠性检验5分析测试方法的灵敏度检出限定量限6回归分析校正曲线7数值修约规则及数据运算规则 1数理统计在分析测试中应用的必要性1 1分析测试的基本特点抽样检验分析测试是通过实验测量以获取欲测物质的有什么有多少以及更多更全面的信息信息通过数据来表述数据是分析测试的产品 1 分析测试的对象有时是大量的不可能进行整体检测 2 大多数分析手段属于破坏性技术消耗掉样品

2、后才能获得数据逐个检测无意义分析测试的基本方式是抽样检验对于抽检应该解决三个基本问题 1 抽样和取样方法要科学合理使所抽取的样品有足够的代表性并保证必要的抽样数量和最小取样量 2 在整个测试过程中要实施严格的质量控制使测定结果准确可靠 3 要通过科学的推理方法将获得的测试样品的信息以一定的可靠性去推断和估计样品的全体欲很好地解决这三个问题都需要正确运用数理统计理论是数理统计具有的功能本讲座主要讨论数理统计在解决第三个问题方面的应用 1 2分析测试结果总是带有误差人机料法环等因素造成美国旧金山湾污泥分析不同实验室测定结果之间存在很大差异难以判断污染

3、真实情况难以对污染进行有效治理误差客观存在实际分析中不能得到确切无误的真值只能作相对准确的估计任何一种定量分析测试的结果都必然带有不确定度对实验数据进行处理判断最可能的值是多少其可靠性如何数理统计方法就是一种科学方法 1 3分析测试协同试验中大量数据的处理标准物质标准样品研制均匀性检验稳定性检验定值标准方法制定重复性限再现性限实验室间比对能力验证稳健统计量统计方法结果的判别 1 6优化实验条件的实验设计方法建立一个新的或改进已有的分析测试方法通常要做许多条件试验以得到最佳测定步骤合理地安排试验以科学的实验设计指导实验工作优化实验条件以不多的试验次数得

4、到正确满意的试验结论这也是数理统计的一个重要内容实验设计的方法有优选法正交法单纯形法等 1 7利用控制图管理常规分析质量影响分析测试质量的五大因素是人机料法环正常的情况下应该对五方面有良好的管理和控制使测试质量获得重要保证统计分析测试数据的可靠性也是测试质量的重要保证除了精密度准确度的计算并检验保证测试质量的离线的静态的办法外还可以应用统计过程控制 StatisticalProcessControl 即SPC概念 SPC是利用统计技术控制图对生产管理过程中的各个阶段进行全过程的监控科学地区分出生产过程中产品质量的偶然波动与异常波动常规分析

5、质量管理也可采用控制图如均值极差控制图均值标准偏差控制图等数理统计的重要性和必要性在于各种分析测试技术不管是经典的还是现代的都离不开数理统计方法数理统计充分地利用测试数据所提供的信息进行科学分析指导测试研究是整个分析测试过程中不可分割的组成部分是测试过程的延伸和深化 2数理统计中的一些基本概念2 1总体 population 被研究对象的全体构成总体的基本单位为个体对分析测试而言总体是指在指定条件下作无限次测量所得的无限多的数据的集合其中每个数据就是一个个体 2 2样本 sample 从总体所包含的全部个体中随机抽取的一部分对分析测试而言样本是指自

6、总体中随机抽出的一组测量值 2 3误差 error 被测量值与真值之间的差测量值x带有误差测量值x扣除误差后即等于真值 0 亦即误差有正负号测量值大于真值时误差为正值反之为负值真值通常是不知道的因此实际上也不可能求得真实误差误差是一个理想概念误差还可用相对误差R E 表示相对误差是误差在真值中所占的比例即根据误差的来源和性质不同误差分为3类系统误差随机误差过失误差 2 4系统误差 systematicerror 在同一条件下多次测量同一量时误差的绝对值和符号保持恒定或在条件改变时按某一确定的规律变化的误差系统误差也称偏倚系统误差性质在多次测定中重复出

7、现具有单向性即如果测定有系统误差则所有的测定值或者都偏高或者都偏低数值基本是恒定不变的如果误差来源于某一个固定的原因这个误差的数值是恒定的 2 5随机误差 randomerror 在实际测量条件下多次测量同一量时误差的绝对值和符号以不可预定方式变化着的误差旧称偶然误差随机误差性质由随机因素产生其大小与正负号都不定是随机变量单次测定的随机误差没有什么规律但随着测量次数的增加导致其总和有正负相消的机会当测定次数足够多时最后其平均值趋近于零因此多次测量的平均值的随机误差要比单个测量值的随机误差小随机误差可用概率统计的方法来处理如果采用数理统计方法进行处理

8、就会发现随机误差通常遵循正态分布规律随机误差具有几个特性 1单峰性绝对值小的误差出现的概率比绝对值大的误差出现的概率大 2对称性绝对值相等的正误差和负误差其出现的概率相等 3有界性绝对值很大的误差出现的概率近于零亦即误差有一定的实际限度 4抵偿性在实际测量条件下对同一量的测量其误差的算术平均值随着测量次数增加而趋于零由此可以通过增加测定次数减小随机误差 2 6过失误差 mistakeerror 由分析人员工作粗心大意或不按规程操作而造成应该而又能够避免但如果发现只能弃去测定结果 2 7偏差 variance 被测量的单次测量值与多次测量的平均值之间的差值也称离差或

9、变差通常用偏差作为误差的估计量 2 8总体方差 populationvariance 测量值对总体均值的误差平方的统计平均 2 9样本方差 samplevariance 测量值对样本平均值的偏差平方的统计平均方差具有加和性当一个测定结果受到多个因素的影响时测定结果的总的方差等于各个因素产生的方差之和此即方差加和性原理是对测定数据作统计分析时所依据的重要原理之一 2 10差方和 thesumofthesquaresofthedeviatiohs 测量值对平均值的偏差的平方的加和差方和也称离差平方和 2 11总体标准偏差 populationstandarddeviation 总

10、体方差平方根正值 2 12样本标准偏差 samplestandarddeviation 样本方差平方根正值 2 13自由度 degreesoffreedom 方差计算中和的项数减去对和的限制数或差方和中独立项的数目在重复性条件下对被测量作n次独立测量时所得的样本方差为其中 i为残差因此和的项数即为残差的个数n 而是一个约束条件即限制数为1 由此可得自由度 n 1 自由度反映了相应实验标准偏差的可靠程度用贝塞尔公式估计实验标准偏差s时 s的不可靠程度为 n越大 s的可靠程度越大若测量次数为10 则 9 表明估计的s的不可靠程度约为0 24 可靠程度达76 2 14精密度 pr

11、ecision 在相同条件下对被测量进行多次重复测量测得值之间的一致符合程度精密度仅仅依赖于随机误差精密度高不一定准确度高即测得值的随机误差小不一定其系统误差亦小 2 15准确度 accuracy 被测量的测得值与其真值的接近程度准确度所反映的是测得值的系统误差准确度高不一定精密度高即测得值的系统误差小不一定其随机误差亦小精密度与准确度的关系设图中的圆心O为被测量的真值黑点为其测得值则图 a 系统误差小而随机误差大即准确度较高精密度较低图 b 系统误差大而随机误差小即准确度较低精密度较高图 c 系统误差和随机误差均小即准确度和精密度都较

12、高精密度和准确度关系的示意图国家标准GB T6379 1 2004 ISO5725 1 1994测量方法与结果的准确度正确度与精密度第一部分总则与定义中用两个术语正确度 trueness 与精密度来描述一种测量方法的准确度正确度指大量测试结果的算术平均值与真值或接受参照值之间的一致程度精密度指测试结果之间的一致程度而准确度是精密度和正确度的综合概念即测试结果的随机误差和系统误差的综合反映但是国际标准化组织 ISO 国际电工委员会 IEC 国际计量局 BIPM 国际法制计量组织 OIML 国际临床化学联合会 IFCC 国际理论与应用化学联合会 I

13、UPAC 国际理论与应用物理联合会 IUPAP 等七个组织于1993年颁布的第二版国际通用计量学基本名词 InternationalVocabularyofBasicandGeneralTermsinMetrology 简称 VIM 以及1968年第三届国际法制计量大会通过的法制计量学基本名词 VocabularyofLegalMetrology 简称 VIML 中均未将正确度作为一个正式术语列入国际理论化学和应用化学联合会 IUPAC 的文件中全国自然科学名词审定委员会公布的化学名词中1991年版科学出版社和2009年重新修订版中也无这一术语 2 16正态分布 normald

14、istribution 连续性随机变量的概率分布其随机变量x的概率密度函数为该函数式是数学家高斯 Gauss 导出的又称高斯分布定律是描述随机变量现象的一种最常见的分布式中x是从分布总体中随机抽取的样本值为正态分布的总体均值为总体标准差是正态分布基本参数当随机变量x服从均值标准差的正态分布时记作正态分布密度函数曲线是连续的对称的钟形曲线该曲线表明在处达到最大值越大曲线越平缓离中心值越远的值出现的概率就越小通过计算表明测定值x位于范围的概率为68 26 位于范围的概率为95 45 位于范围的概率为99 73 正态分布概率密度函数曲线 2 17置信概率

15、confidenceprobability 统计推断的可靠把握程度即评价可靠性的参数也称置信度置信水平置信概率P与显著性水平的关系是 1 P 置信概率通常取95 有时也取90 99 2 18置信区间 confidenceinterval 以一定置信概率估计的总体均值所在的区间用有限次重复测定的样本平均值来估计总体均值的区间范围置信区间越宽判断失误的机会就越小但相对而言实用价值就越低 3分析测试数据的基本特性在正态分布密度函数曲线中可以看到多次测定时得到的数据有两个特性数据有向中心值集中的趋势即总体数据具有统计规律性数据又有偏离中心值的倾向离散性和波动性即个别测

16、试结果具有随机性对于数据的这两个特性在数理统计上采用特征参数来表征可以说数理统计基本上是对这两类特征参数在做文章 3 1数据集中趋势的表征一般用两个特性参数来表示 3 1 1算术平均值 arithmeticaverage 表示式对于有限多次测定测定值围绕算术平均值样本平均值集中平均值在不存在系统误差时接近真值测定值在服从正态分布情况下算术平均值为测定结果的最佳值加权平均值 weightedaverage 在不同条件下对同一量进行测定时测定结果的质量不同权重即是用数字表征测定结果的质量指标权重W与测定结果的方差成反比即加权平均值 3 1 2中位值 median 将一系列测定数据按其大小顺序排列位于正中间的数据称为中位值当测定次数N为奇数时居中者即是而当N为偶数时正中间的两个数的平均值为中位值中位值的优点是求法简单又有直观意义不受离群值大小的影响但是用中位值表示数据集中趋势不如平均值准确 3 2数据离散性的表征3 2 1极差R 也称全距一组平行测定数据中最大者和最小者之差相对极差 3 2 2平均偏差 averagedeviati

展开阅读全文