分析测试中的数理统计_.ppt

上传人:marr****208 文档编号:133874467 上传时间:2020-05-31 格式:PPT 页数:146 大小:1.76MB
返回 下载 相关 举报
分析测试中的数理统计_.ppt_第1页
第1页 / 共146页
分析测试中的数理统计_.ppt_第2页
第2页 / 共146页
分析测试中的数理统计_.ppt_第3页
第3页 / 共146页
分析测试中的数理统计_.ppt_第4页
第4页 / 共146页
分析测试中的数理统计_.ppt_第5页
第5页 / 共146页
点击查看更多>>
资源描述

《分析测试中的数理统计_.ppt》由会员分享,可在线阅读,更多相关《分析测试中的数理统计_.ppt(146页珍藏版)》请在金锄头文库上搜索。

1、分析测试中的数理统计臧慕文北京有色金属研究总院分析测试技术研究所国家有色金属及电子材料分析测试中心 1数理统计在分析测试中应用的必要性2数理统计中的一些基本概念3分析测试数据的基本特性4分析测试数据的可靠性检验5分析测试方法的灵敏度 检出限 定量限6回归分析 校正曲线7数值修约规则及数据运算规则 1数理统计在分析测试中应用的必要性1 1分析测试的基本特点 抽样检验分析测试是通过实验测量以获取欲测物质的 有什么 有多少 以及更多更全面的信息 信息 通过 数据 来表述 数据 是分析测试的 产品 1 分析测试的对象有时是 大量 的 不可能进行整体检测 2 大多数分析手段属于 破坏性 技术 消耗掉样品

2、后才能获得数据 逐个检测无意义 分析测试的基本方式是 抽样检验 对于 抽检 应该解决三个基本问题 1 抽样和取样方法要科学合理 使所抽取的样品有足够的代表性 并保证必要的抽样数量和最小取样量 2 在整个测试过程中要实施严格的质量控制 使测定结果准确可靠 3 要通过科学的推理方法 将获得的测试样品的信息 以一定的可靠性去推断和估计样品的全体 欲很好地解决这三个问题 都需要正确运用数理统计理论 是 数理统计 具有的 功能 本讲座主要讨论数理统计在解决第三个问题方面的应用 1 2分析测试结果总是带有误差人 机 料 法 环等因素造成美国旧金山湾污泥分析 不同实验室测定结果之间存在很大差异 难以判断污染

3、真实情况 难以对污染进行有效治理 误差客观存在 实际分析中不能得到确切无误的真值 只能作相对准确的估计 任何一种定量分析测试的结果 都必然带有不确定度 对实验数据进行处理 判断最可能的值是多少 其可靠性如何 数理统计方法就是一种科学方法 1 3分析测试协同试验中大量数据的处理标准物质 标准样品研制均匀性检验 稳定性检验 定值标准方法制定重复性限 再现性限实验室间比对能力验证稳健统计量 统计方法 结果的判别 1 6优化实验条件的实验设计方法建立一个新的或改进已有的分析测试方法 通常要做许多条件试验 以得到最佳测定步骤 合理地安排试验 以科学的实验设计指导实验工作 优化实验条件 以不多的试验次数得

4、到正确满意的试验结论 这也是数理统计的一个重要内容 实验设计的方法有优选法 正交法 单纯形法等 1 7利用控制图管理常规分析质量影响分析测试质量的五大因素是 人 机 料 法 环 正常的情况下 应该对五方面有良好的管理和控制 使测试质量获得重要保证 统计分析测试数据的可靠性也是测试质量的重要保证 除了精密度 准确度的计算并检验保证测试质量的 离线 的 静态 的办法外 还可以应用 统计过程控制 StatisticalProcessControl 即SPC概念 SPC是利用统计技术 控制图 对生产 管理 过程中的各个阶段进行 全过程的监控 科学地区分出生产过程中产品质量的偶然波动与异常波动 常规分析

5、质量管理也可采用控制图 如均值 极差控制图 均值 标准偏差控制图等 数理统计 的重要性和必要性在于 各种分析测试技术 不管是经典的还是现代的 都离不开数理统计方法 数理统计 充分地利用测试数据所提供的信息进行科学分析 指导测试研究 是整个分析测试过程中不可分割的组成部分 是测试过程的延伸和深化 2数理统计中的一些基本概念2 1总体 population 被研究对象的全体 构成总体的基本单位为个体 对分析测试而言 总体是指 在指定条件下 作无限次测量所得的无限多的数据的集合 其中每个数据就是一个个体 2 2样本 sample 从总体所包含的全部个体中随机抽取的一部分 对分析测试而言 样本是指 自

6、总体中随机抽出的一组测量值 2 3误差 error 被测量值与真值之间的差 测量值x带有误差 测量值x扣除误差 后即等于真值 0 亦即误差有正负号 测量值大于真值时 误差为正值 反之为负值 真值通常是不知道的 因此实际上也不可能求得真实误差 误差是一个理想概念 误差还可用相对误差R E 表示 相对误差是误差在真值中所占的比例 即根据误差的来源和性质不同 误差分为3类 系统误差 随机误差 过失误差 2 4系统误差 systematicerror 在同一条件下多次测量同一量时 误差的绝对值和符号保持恒定 或在条件改变时 按某一确定的规律变化的误差 系统误差也称偏倚 系统误差性质 在多次测定中重复出

7、现 具有单向性 即如果测定有系统误差 则所有的测定值或者都偏高 或者都偏低 数值基本是恒定不变的 如果误差来源于某一个固定的原因 这个误差的数值是恒定的 2 5随机误差 randomerror 在实际测量条件下 多次测量同一量时 误差的绝对值和符号以不可预定方式变化着的误差 旧称偶然误差 随机误差性质 由随机因素产生 其大小与正负号都不定 是随机变量 单次测定的随机误差 没有什么规律 但随着测量次数的增加 导致其总和有正负相消的机会 当测定次数足够多时 最后其平均值趋近于零 因此多次测量的平均值的随机误差要比单个测量值的随机误差小 随机误差可用概率统计的方法来处理 如果采用数理统计方法进行处理

8、 就会发现随机误差通常遵循正态分布规律 随机误差具有几个特性 1单峰性 绝对值小的误差出现的概率比绝对值大的误差出现的概率大 2对称性 绝对值相等的正误差和负误差 其出现的概率相等 3有界性 绝对值很大的误差出现的概率近于零 亦即误差有一定的实际限度 4抵偿性 在实际测量条件下对同一量的测量 其误差的算术平均值随着测量次数增加而趋于零 由此 可以通过增加测定次数减小随机误差 2 6过失误差 mistakeerror 由分析人员工作粗心大意或不按规程操作而造成 应该而又能够避免 但如果发现 只能弃去测定结果 2 7偏差 variance 被测量的单次测量值与多次测量的平均值之间的差值 也称离差或

9、变差 通常用偏差 作为误差 的估计量 2 8总体方差 populationvariance 测量值对总体均值的误差平方的统计平均 2 9样本方差 samplevariance 测量值对样本平均值的偏差平方的统计平均 方差具有加和性 当一个测定结果受到多个因素的影响时 测定结果的总的方差等于各个因素产生的方差之和 此即方差加和性原理 是对测定数据作统计分析时所依据的重要原理之一 2 10差方和 thesumofthesquaresofthedeviatiohs 测量值对平均值的偏差的平方的加和 差方和也称离差平方和 2 11总体标准偏差 populationstandarddeviation 总

10、体方差平方根正值 2 12样本标准偏差 samplestandarddeviation 样本方差平方根正值 2 13自由度 degreesoffreedom 方差计算中 和的项数减去对和的限制数 或差方和中独立项的数目 在重复性条件下 对被测量作n次独立测量时所得的样本方差为 其中 i为残差 因此 和的项数即为残差的个数n 而是一个约束条件 即限制数为1 由此可得自由度 n 1 自由度反映了相应实验标准偏差的可靠程度 用贝塞尔公式估计实验标准偏差s时 s的不可靠程度为 n越大 s的可靠程度越大 若测量次数为10 则 9 表明估计的s的不可靠程度约为0 24 可靠程度达76 2 14精密度 pr

11、ecision 在相同条件下 对被测量进行多次重复测量 测得值之间的一致 符合 程度 精密度仅仅依赖于随机误差 精密度高 不一定准确度高 即测得值的随机误差小 不一定其系统误差亦小 2 15准确度 accuracy 被测量的测得值与其 真值 的接近程度 准确度所反映的是测得值的系统误差 准确度高 不一定精密度高 即测得值的系统误差小 不一定其随机误差亦小 精密度与准确度的关系设图中的圆心O为被测量的 真值 黑点为其测得值 则图 a 系统误差小 而随机误差大 即准确度较高 精密度较低 图 b 系统误差大 而随机误差小 即准确度较低 精密度较高 图 c 系统误差和随机误差均小 即准确度和精密度都较

12、高 精密度和准确度关系的示意图 国家标准GB T6379 1 2004 ISO5725 1 1994测量方法与结果的准确度 正确度与精密度 第一部分 总则与定义中 用两个术语 正确度 trueness 与 精密度 来描述一种测量方法的 准确度 正确度 指大量测试结果的 算术 平均值与真值或接受参照值之间的一致程度 精密度 指测试结果之间的一致程度 而 准确度 是 精密度 和 正确度 的综合概念 即测试结果的随机误差和系统误差的综合反映 但是国际标准化组织 ISO 国际电工委员会 IEC 国际计量局 BIPM 国际法制计量组织 OIML 国际临床化学联合会 IFCC 国际理论与应用化学联合会 I

13、UPAC 国际理论与应用物理联合会 IUPAP 等七个组织于1993年颁布的第二版 国际通用计量学基本名词 InternationalVocabularyofBasicandGeneralTermsinMetrology 简称 VIM 以及1968年第三届国际法制计量大会通过的 法制计量学基本名词 VocabularyofLegalMetrology 简称 VIML 中均未将 正确度 作为一个正式术语列入 国际理论化学和应用化学联合会 IUPAC 的文件中 全国自然科学名词审定委员会公布的化学名词中1991年版 科学出版社 和2009年重新修订版中也无这一术语 2 16正态分布 normald

14、istribution 连续性随机变量的概率分布 其随机变量x的概率密度函数为该函数式是数学家高斯 Gauss 导出的 又称高斯分布定律 是描述随机变量现象的一种最常见的分布 式中x是从分布总体中随机抽取的样本值 为正态分布的总体均值 为总体标准差 是正态分布基本参数 当随机变量x服从均值 标准差 的正态分布时 记作 正态分布密度函数曲线是连续的 对称的 钟形 曲线 该曲线表明 在处达到最大值 越大 曲线越平缓 离中心值越远的值出现的概率就越小 通过计算表明 测定值x位于范围的概率为68 26 位于范围的概率为95 45 位于范围的概率为99 73 正态分布概率密度函数曲线 2 17置信概率

15、confidenceprobability 统计推断的可靠把握程度 即评价可靠性的参数 也称置信度 置信水平 置信概率P与显著性水平 的关系是 1 P 置信概率通常取95 有时也取90 99 2 18置信区间 confidenceinterval 以一定置信概率估计的总体均值 所在的区间 用有限次重复测定的样本平均值来估计总体均值 的区间范围 置信区间越宽 判断失误的机会就越小 但相对而言实用价值就越低 3分析测试数据的基本特性在正态分布密度函数曲线中可以看到 多次测定时得到的数据有两个特性 数据有向中心值集中的趋势 即总体数据具有统计规律性 数据又有偏离中心值的倾向 离散性和波动性 即个别测

16、试结果具有随机性 对于数据的这两个特性在数理统计上采用特征参数来表征 可以说 数理统计 基本上是对这两类特征参数在 做文章 3 1数据集中趋势的表征一般用两个特性参数来表示 3 1 1算术平均值 arithmeticaverage 表示式 对于有限多次测定 测定值围绕算术平均值 样本平均值 集中 平均值在不存在系统误差时接近真值 测定值在服从正态分布情况下 算术平均值为测定结果的最佳值 加权平均值 weightedaverage 在不同条件下 对同一量进行测定时 测定结果的质量不同 权重 即是用数字表征测定结果的质量指标 权重W与测定结果的方差成反比 即加权平均值 3 1 2中位值 median 将一系列测定数据按其大小顺序排列 位于正中间的数据称为中位值 当测定次数N为奇数时 居中者即是 而当N为偶数时 正中间的两个数的平均值为中位值 中位值的优点是求法简单 又有直观意义 不受离群值大小的影响 但是用中位值表示数据集中趋势不如平均值准确 3 2数据离散性的表征3 2 1极差R 也称全距 一组平行测定数据中最大者 和最小者 之差相对极差 3 2 2平均偏差 averagedeviati

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号