误差与数据处理课件

上传人:cl****1 文档编号:571446217 上传时间:2024-08-10 格式:PPT 页数:296 大小:1.86MB
返回 下载 相关 举报
误差与数据处理课件_第1页
第1页 / 共296页
误差与数据处理课件_第2页
第2页 / 共296页
误差与数据处理课件_第3页
第3页 / 共296页
误差与数据处理课件_第4页
第4页 / 共296页
误差与数据处理课件_第5页
第5页 / 共296页
点击查看更多>>
资源描述

《误差与数据处理课件》由会员分享,可在线阅读,更多相关《误差与数据处理课件(296页珍藏版)》请在金锄头文库上搜索。

1、第第 3 章章 分析化学中的误差与数据处理分析化学中的误差与数据处理1误差与数据处理优秀课件 在在定定量量分分析析中中,由由于于受受分分析析方方法法、测测量量仪仪器器、所所用用试试剂剂和和分分析析工工作作者者主主观观条条件件等等方方面面的的限限制制,使使测测得得的的结结果果不不可可能能和和真真实实含含量量完完全全一一致致;即即使使是是技技术术很很熟熟练练的的分分析析工工作作者者,用用最最完完善善的的分分析析方方法法和和最最精精密密的的仪仪器器,对对同同一一样样品品进进行行多多次次测测定定,其其结结果果也也不不会会完完全全一一样样。这这说说明明客客观观上上就就存存在在着着难难于于避避免免的的误差

2、误差。3.1 3.1 分析化学中的误差分析化学中的误差( (error) ) 定义:分析结果与真实值之间的差值称为误差定义:分析结果与真实值之间的差值称为误差2误差与数据处理优秀课件 名词术语名词术语n真实值真实值n平均值平均值n中位数中位数n误差误差n偏差偏差n极差:极差:又叫全距,是一组测量数据中最大与最小值之差又叫全距,是一组测量数据中最大与最小值之差n公差公差: 生产部门对分析结果误差允许的一种限量生产部门对分析结果误差允许的一种限量3误差与数据处理优秀课件1. 误差(误差(E)与偏差)与偏差 (d) 误差:分析结果与真实值之间的差值误差:分析结果与真实值之间的差值 偏差:测量值与平均

3、值之间的差值偏差:测量值与平均值之间的差值4误差与数据处理优秀课件误差的表示误差的表示n绝对误差绝对误差 E=X-XTn相对误差相对误差5误差与数据处理优秀课件偏差的表示偏差的表示n绝对偏差绝对偏差n相对偏差相对偏差n平均偏差平均偏差n相对平均偏差相对平均偏差n标准偏差标准偏差n相对标准偏差相对标准偏差 6误差与数据处理优秀课件2. 2. 准确度和精密度准确度和精密度分析结果的衡量指标分析结果的衡量指标一一 、误差和、误差和准确度准确度 二二 、偏差、偏差和精密度和精密度 7误差与数据处理优秀课件准确度和精密度的关系准确度和精密度的关系 精密度高不一定准确度高;精密度高不一定准确度高;精密度高

4、是保证准确度的先决条件;精密度高是保证准确度的先决条件; 精密度和准确度都高的分析结果才是可靠的。精密度和准确度都高的分析结果才是可靠的。8误差与数据处理优秀课件3. 系统误差和随机误差系统误差和随机误差 n系统误差:由某种固定的原因造成的,具有重复行、单向性。理论上它的大小、正负可以测定,又称可测误差。 又分为:方法误差;仪器试剂误差;操作误差和主观误差n随机误差:亦称偶然误差,它有某些难以控制的、无法避免的偶然因素造成。如:环境条件(温度、湿度、气压)等的微小变化,使分析结果在一定的范围内波动引起随机误差。9误差与数据处理优秀课件系统误差减免的措施系统误差减免的措施 根据产生的原因采取措施

5、减免,如:根据产生的原因采取措施减免,如: 1. 1.方法误差方法误差采用标准方法作对照试验采用标准方法作对照试验 2. 2.仪器误差仪器误差校准仪器校准仪器 3. 3.试剂误差试剂误差作空白试验作空白试验10误差与数据处理优秀课件随机误差(偶然误差)随机误差(偶然误差)减免措施:减免措施:特点:特点:影响精密度影响精密度 (1 1)时大,时小,时正,时负(不恒定)时大,时小,时正,时负(不恒定, ,无法校正)无法校正) (2 2)数据的分布符合统计学规律(正态分布)数据的分布符合统计学规律(正态分布) (3 3)影响精密度)影响精密度 (4 4)大小相近的正误差和)大小相近的正误差和 负误差

6、出现的几率机等负误差出现的几率机等; ;小误差出现的小误差出现的频率较高,而大误差出现的频率较低,很大误差出现的几率近于零。频率较高,而大误差出现的频率较低,很大误差出现的几率近于零。减免措施:减免措施:增加平行测定次数,取其平均值。增加平行测定次数,取其平均值。11误差与数据处理优秀课件3.2 有效数字及运算规则有效数字及运算规则n有效数字定义:有效数字定义: 记录的数字不仅表示数量的大小,还要正确地反映测量的精记录的数字不仅表示数量的大小,还要正确地反映测量的精确程度。确程度。 结果结果 绝对误差绝对误差 相对误差相对误差 有效数字位数有效数字位数 0.49400 0.49400 0.00

7、001 0.00001 0.002% 50.002% 5 0.4940 0.4940 0.0001 0.0001 0.02% 40.02% 4 0.494 0.494 0.001 0.001 0.2% 30.2% 3 12误差与数据处理优秀课件 1. 有效数字的位数有效数字的位数 数字零在数据中具有双重作用数字零在数据中具有双重作用数字零在数据中具有双重作用数字零在数据中具有双重作用 (1 1)若作为普通数定使用,是有效数字)若作为普通数定使用,是有效数字 如如如如 0.3180 4 0.3180 4位有效数字位有效数字 3.180 3.180 1010-1 -1 (2 2)若只起定位作用,不

8、是有效数字。)若只起定位作用,不是有效数字。 如如如如 0.0318 3 0.0318 3位有效数字位有效数字 3.18 3.18 1010-2 -2 改变单位不改变有效数字的位数改变单位不改变有效数字的位数改变单位不改变有效数字的位数改变单位不改变有效数字的位数 如如如如 19.02 mL 19.02 mL 为为 19.02 19.02 1010-3 -3 L L pH, pH, pH, pH, pMpMpMpM, , , , lgClgClgClgC, , , , lgKlgKlgKlgK等,有效数字位数只取决于小数部分等,有效数字位数只取决于小数部分等,有效数字位数只取决于小数部分等,有

9、效数字位数只取决于小数部分 如如如如 pHpHpHpH11.20 11.20 是是2 2位有效数字,换算成位有效数字,换算成HH+ + 浓度时为浓度时为: : H+6.3 1012 mol/L mol/L13误差与数据处理优秀课件分析化学中正确记录有效数字分析化学中正确记录有效数字1 1正确地记录测试数据正确地记录测试数据(25mL,25.00mL)25mL,25.00mL)反映出测量仪器精度反映出测量仪器精度 容量量器容量量器:滴定管滴定管、移液管移液管、容量瓶容量瓶,体积取体积取4 4位有效数字位有效数字。 分析天平分析天平(万分之一万分之一)称取样品称取样品,质量取质量取4 4位有效数字

10、位有效数字。 标准溶液的浓度标准溶液的浓度,用用4 4位有效数字表示位有效数字表示。 有关化学平衡计算中的浓度有关化学平衡计算中的浓度,一般保留二位或三位有效数字一般保留二位或三位有效数字。2 2按按有效数字的运算规则有效数字的运算规则正确地计算数据正确地计算数据报出合理的测试结果报出合理的测试结果。14误差与数据处理优秀课件15误差与数据处理优秀课件如:如:如:如: 只能只能只能只能 0.5749 0.57 0.5749 0.57 不能不能不能不能 0.5749 0.575 0.58 0.5749 0.575 0.582. 数字修约规则数字修约规则n修约修约:处理数据时,各测量值的有效数字位

11、数不同,因处理数据时,各测量值的有效数字位数不同,因此需要按规则,确定个测量值位数。在位数确定以后,此需要按规则,确定个测量值位数。在位数确定以后,将它后面的多余数字舍弃,这个过程就叫数字修约。将它后面的多余数字舍弃,这个过程就叫数字修约。n“四舍六入五成双四舍六入五成双”规则规则如:3.1483.1;7.3652 7.4 75.5 76; 0.245 0.24 1.0251 1.03n 一次修约到位,禁止分次一次修约到位,禁止分次 16误差与数据处理优秀课件3. 运算规则运算规则 加减法:加减法: 有效数字位数的保留,取决于绝对误差最大的那有效数字位数的保留,取决于绝对误差最大的那个数,即个

12、数,即以小数点后位数最少的数据为准。以小数点后位数最少的数据为准。 如如 0.012125.641.05782 =? 0.0121 0.0001;25.64 0.01;1.05782 0.00001运算时,先修约,后计算运算时,先修约,后计算 0.0125.641.0626.7117误差与数据处理优秀课件 乘除法:乘除法: 有效数字的位数应以几个数据中相对误差最大的那个为有效数字的位数应以几个数据中相对误差最大的那个为依据依据,即根据有效数字位数最少的数据位数来进行修约。即根据有效数字位数最少的数据位数来进行修约。 如 0.012125.641.05782 = ?三个数的相对误差:三个数的相对

13、误差:1/121 100% = 0.8% 1/2564 100% = 0.4% 1/105782 100% = 0.009%可见以可见以0.121的相对误差最大,故以它为标准都修约为三位有的相对误差最大,故以它为标准都修约为三位有效数字再来进行相乘效数字再来进行相乘 0.012125.61.06 = 0.32818误差与数据处理优秀课件3.3 分析化学中的数据处理分析化学中的数据处理n同一方法的多次测量,结果会不一样n问题 (1)如何表达分析结果 (2)如何处理可疑值或离群值 (3)如何比较不同人、不同室、不同方法所得结果n数理统计的方法解决以上问题19误差与数据处理优秀课件 l总体总体(母体

14、):母体):考察对象某特性值的全体l样本样本(子样):(子样):自总体中随机抽取的一组测量值l样本容量样本容量 n: 样本中所含测量值的数目l样本平均值样本平均值 l总体平均值总体平均值 l真值真值 xT术语(统计学)20误差与数据处理优秀课件 例例如如:分分析析某某矿矿石石中中的的铁铁含含量量,经经取取样样、细细碎碎、缩缩分分后后,得得到到一一定定数数量量(如如500g)的的试试样样,这这500 g 试试样样就就是是供供分分析析用用的的总总体体,如如果果从从中中取取出出8份份试试样样进进行行平平行行分分析析,就就得得到到8个个分分析析结结果果,则则这这一一组组分分析析结结果果就就是是总总体体

15、的的一一个个随随机机样本样本,样本容量样本容量为为8。举例举例21误差与数据处理优秀课件 平均值平均值:设样本容量为:设样本容量为n, 则其平均值为:则其平均值为: 总体平均值总体平均值:无限多次测定的平均值,总体平均值无限多次测定的平均值,总体平均值 确确认认消消除除系系统统误误差差,则则总总体体平平均均值值就就是是真真值值,此此时时,总总体体平均偏差平均偏差为为: 分分析析化化学学中中,测测量量次次数数一一般般较较少少(20),故故涉涉及及到到的的是是 测测量值较少时的平均偏差量值较少时的平均偏差22误差与数据处理优秀课件n 频数分布(频数分布(frequency distribution

16、)n 正态分布(正态分布(normal distribution )n 随机误差的区间概率随机误差的区间概率1. 1. 随机误差的正态分布23误差与数据处理优秀课件 频数分布频数分布n相同条件下对样品中铁含量进行测定,得到相同条件下对样品中铁含量进行测定,得到100个测定值:个测定值:n 1.36 1.49 1.43 1.41 1.37 1.40 1.32 1.42 1.47 1.39n 1.41 1.36 1.40 1.34 1.42 1.42 1.45 1.35 1.42 1.39n 1.44 1.42 1.39 1.42 1.42 1.30 1.34 1.42 1.37 1.36n 1.

17、37 1.34 1.37 1.46 1.44 1.45 1.32 1.48 1.40 1.45n 1.39 1.46 1.39 1.53 1.36 1.48 1.40 1.39 1.38 1.40n 1.46 1.45 1.50 1.43 1.45 1.43 1.41 1.48 1.39 1.45n 1.37 1.46 1.39 1.45 1.31 1.41 1.44 1.44 1.42 1.47n 1.35 1.36 1.39 1.40 1.38 1.35 1.42 1.43 1.42 1.42n 1.42 1.40 1.41 1.37 1.46 1.36 1.37 1.27 1.47 1.

18、38n 1.42 1.34 1.43 1.41 1.41 1.41 1.44 1.48 1.57 1.3724误差与数据处理优秀课件 观察这100个数据,看出:分析结果高高低低,参差不齐测量数据分散性;仔细观察,中间数据多,两头少测量数据的集中趋势。 把100个数据按最大最小的差值,平均分成10等份(区间),计算每一个区间内测量值出现的次数及占总次数的比率频数频数:是指每一范围内测量值出现的次数相对频数相对频数:指频数在测定总次数中占的比率 25误差与数据处理优秀课件 分组(分组(%) 频数频数 相对频数(频率)相对频数(频率) 1.2651.295 1 0.01 1.2951.325 4 0

19、.04 1.3251.355 7 0.07 1.3551.385 17 0.17 1.3851.415 24 0.24 1.4151.445 24 0.24 1.4451.475 15 0.15 1.4751.505 6 0.06 1.5051.535 1 0.01 1.5351.565 1 0.01 100 1.0026误差与数据处理优秀课件 相对频数分布直方图 正态分布曲线左图是相对频数分布直方图;当测量数据再增多,组(区间)划分再细,直方图形式逐渐趋于 一条直线,即正态分布曲线,它表示出了来自同一总体的无限多次测定的各种可能结果(或随机误差)的分布。 横横坐标:测定值坐标:测定值x或或x

20、-;纵纵坐坐标标:测测定定值值的概率密度的概率密度 27误差与数据处理优秀课件正态分布正态分布 正态分布正态分布:即高斯分布,正态分布曲线数学表达式为:即高斯分布,正态分布曲线数学表达式为: n y:概率密度;:概率密度; x:测量值:测量值n:总总体体平平均均值值,即即无无限限次次测测定定数数据据的的平平均均值值,无无系系统统误差时即为真值;反映测量值分布的集中趋势。误差时即为真值;反映测量值分布的集中趋势。n:标准偏差,反映测量值分布的分散程度;:标准偏差,反映测量值分布的分散程度;nx-:误差:误差28误差与数据处理优秀课件两组精密度不同的测量值两组精密度不同的测量值的正态分布曲线的正态

21、分布曲线 y1221 x 0 -x29误差与数据处理优秀课件 正态分布曲线规律:正态分布曲线规律: x = 时时,y值值最最大大,体体现现了了测测量量值值的的集集中中趋趋势势。大大多多数数测测量量值值集集中中在在算算术术平平均均值值的的附附近近,算算术术平平均均值值是是最最可可信信赖赖值值,能能很很好好反反映映测量值的集中趋势。测量值的集中趋势。反映测量值分布集中趋势。反映测量值分布集中趋势。 曲曲线线以以x=这这一一直直线线为为其其对对称称轴轴,说说明明正正误误差差和和负负误误差差出出现现的的概概率率相等。相等。 当当x趋趋于于或或时时,曲曲线线以以轴轴为为渐渐近近线线。即即小小误误差差出出

22、现现概概率率大,大误差出现概率小,出现很大误差概率极小,趋于零。大,大误差出现概率小,出现很大误差概率极小,趋于零。 越越大大,测测量量值值落落在在附附近近的的概概率率越越小小。即即精精密密度度越越差差时时,测测量量值值的的分分布布就就越越分分散散,正正态态分分布布曲曲线线也也就就越越平平坦坦。反反之之,越越小小,测测量量值值的的分分散散程程度度就就越越小小,正正态态分分布布曲曲线线也也就就越越尖尖锐锐。反反映映测测量量值值分分布分散程度。布分散程度。030误差与数据处理优秀课件n 正态分布曲线正态分布曲线 N( , 2)表示表示n 曲线的形状取决于曲线的形状取决于 , 2, 当当 , 确定后

23、,确定后, N( , 2)也就定了。)也就定了。n 积积分分的的计计算算同同 与与 有有关关,计计算算相相当当麻麻烦烦。数数学上解决方法:坐标变换。学上解决方法:坐标变换。31误差与数据处理优秀课件令:可变为: 式 : 标准正态分布曲线标准正态分布曲线32误差与数据处理优秀课件 标准正态分布曲线标准正态分布曲线N(0,1) 是以是以u为单位的曲线,它对为单位的曲线,它对于不同的于不同的 和和 的任何测量值都是通用的。的任何测量值都是通用的。12-3-10.23-200.10.30.4y33误差与数据处理优秀课件随机误差的区间概率随机误差的区间概率 标准正态分布曲线与横坐标标准正态分布曲线与横坐

24、标-到到+之间所夹的面积,之间所夹的面积,代表所有数据出现概率的总和,其值为代表所有数据出现概率的总和,其值为1,即概率即概率P为:为: 34误差与数据处理优秀课件对对于于N(0,1),测测量量值值的的随随机机误误差差在在某某一一区区间间内内出出现现的的概概率率(不不同同u值值所所占占的的面面积积)已已用用积积分分法法求求得得,列列于于书书P57页页表表3-2。表表中中所所列列之之值值为单边值。为单边值。35误差与数据处理优秀课件随机误差出现的区间随机误差出现的区间 测量值出现的区间测量值出现的区间 概率概率 (以为单位) u=1 x=1 68.3% u=1.96 x=1.96 95.0% u

25、=2 x=2 95.5% u=2.58 x=2.58 99.0% u=3 x=3 99.7%关注以下区间关注以下区间36误差与数据处理优秀课件例例题题: 已已知知某某试试样样中中Co质质量量分分数数的的标标准准值值为为1.75%, =0.10%,又已知测量时没有系统误差存在,又已知测量时没有系统误差存在,求求: (1) 分析结果落在分析结果落在 (1.750.15)%范围内的概率。范围内的概率。 (2)分析结果大于分析结果大于2.00%的概率。的概率。解解(1)查表:u=1.5 时,概率为:2 0.4332 = 0.866 = 86.6 %37误差与数据处理优秀课件解解(2) 属于单边检验问题

26、。属于单边检验问题。查表:u 2.5 时,概率为: 0.4938 。整个正态分布曲线右侧的整个正态分布曲线右侧的概率为概率为1/2,即为,即为0.5000,故,故u 2.5的概率为的概率为0.5000 0.4938=0.62%,即分析结果大于,即分析结果大于2.00%的概率为的概率为0.62%。38误差与数据处理优秀课件2. 总体平均值的估计总体平均值的估计 用数理统计的方法来处理分析测定所得到结果,目的是将这些结果作一个科学的表达,使人们能够认识到它的精密度、准确度、可信度如何。 最好的方法是对总总体体平平均均值值进行估计,在一定的置信度下给出一个包含总体平均值的范围。39误差与数据处理优秀

27、课件 总体标准偏差总体标准偏差 样本标准偏差样本标准偏差 相对标准偏差相对标准偏差 标准偏差与平均偏差标准偏差与平均偏差 平均值的标准偏差平均值的标准偏差关于标准偏差的术语关于标准偏差的术语40误差与数据处理优秀课件 总体标准偏差总体标准偏差 当测定次数为无限多次时,各测量值对当测定次数为无限多次时,各测量值对总体平均值总体平均值的偏离,用总体标准偏差的偏离,用总体标准偏差表示:表示: 41误差与数据处理优秀课件样本标准偏差样本标准偏差n 当测量值不多,总体平均值又不知道时,用样本的标准偏当测量值不多,总体平均值又不知道时,用样本的标准偏差差s来衡量该组数据的分散程度。数学表达式为:来衡量该组

28、数据的分散程度。数学表达式为: n式中(式中(n-1)称为)称为自由度,以自由度,以f表示表示,是指独立偏差的个数。,是指独立偏差的个数。n 当测量次数非常多时,测量次数当测量次数非常多时,测量次数n与自由度(与自由度(n-1)的)的 区区 别就很小了,此时别就很小了,此时 ,同时同时 42误差与数据处理优秀课件 相对标准偏差相对标准偏差相对标准偏差相对标准偏差(又称变异系数又称变异系数)为为 43误差与数据处理优秀课件 标准偏差与平均偏差标准偏差与平均偏差 用统计学方法可以证明,当测定次数非常多用统计学方法可以证明,当测定次数非常多(例如大于(例如大于20)时,标准偏差与平均偏差有下列)时,

29、标准偏差与平均偏差有下列关系:关系: =0.7970.80但应当指出:当测定次数较少时,但应当指出:当测定次数较少时, 与与S之间的关之间的关系就可能与此式相差颇大了。系就可能与此式相差颇大了。44误差与数据处理优秀课件 平均值的标准偏差平均值的标准偏差n 何谓平均值的标准偏差?何谓平均值的标准偏差? 从总体中分别抽出从总体中分别抽出m个样本,每个样本各进行个样本,每个样本各进行n次测定(通常分次测定(通常分析只是从总体中抽出一个样本进行析只是从总体中抽出一个样本进行n 次平行测定)。因为有次平行测定)。因为有m个样个样本,也就有本,也就有m个平均值,由个平均值,由m个样本平均值再得到的平均值

30、比只用个样本平均值再得到的平均值比只用一个样本的平均值来估算总体平均值要好。用一个样本的平均值来估算总体平均值要好。用m 个样本平均值再计个样本平均值再计算标准偏差,就是算标准偏差,就是平均值的标准偏差。平均值的标准偏差。 45误差与数据处理优秀课件 平均值的标准偏差与单次结果标准偏差平均值的标准偏差与单次结果标准偏差 数理统计证明:多个样本平均值的标准偏差与单个样本测量结果的标准偏差之间有下列关系: 无限次测量 有限次测量显然,平均值的标准偏差比单次测定结果的标准偏差要小。显然,平均值的标准偏差比单次测定结果的标准偏差要小。46误差与数据处理优秀课件 平均值标准偏差与测定次数关系平均值标准偏

31、差与测定次数关系: 平均值的标准偏差与测定次数的平均值的标准偏差与测定次数的 平方根成反比。平方根成反比。47误差与数据处理优秀课件n平均值的平均偏差与单个平均偏差:平均值的平均偏差与单个平均偏差: 平均值的平均偏差与单个样本测量的平均偏差之间平均值的平均偏差与单个样本测量的平均偏差之间有如下关系:有如下关系: n结论:适当地增加测定次数可提高结果的精密度。结论:适当地增加测定次数可提高结果的精密度。 在日常分析中,一般平行测定:在日常分析中,一般平行测定:34次。次。 较高要求:较高要求:59次次 最多:最多:1012次次48误差与数据处理优秀课件 少量数据的统计处理少量数据的统计处理用用

32、t 分分布布曲曲线线来来处处理理, t 分分布布可可说说明明当当n不大时(不大时(n20)随机误差分布的规律性。)随机误差分布的规律性。正态分布是无数次测量数据的随机误差分布规律。而实际正态分布是无数次测量数据的随机误差分布规律。而实际中,测量次数有限,故随机误差分布不服从正态分布。中,测量次数有限,故随机误差分布不服从正态分布。49误差与数据处理优秀课件 t 分布曲线分布曲线 用用s代代替替,纵纵坐坐标标仍仍为为概概率率密密度度,但但横横坐坐标标则则为为统计量统计量 t t 。t 定义为:定义为:50误差与数据处理优秀课件n自由度自由度f degree of freedom ( f = n-

33、1) t分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是t分布曲线随分布曲线随 自由度自由度 f 而改变。当而改变。当 f 趋近趋近时,时,t 分布就趋近正态分布分布就趋近正态分布。n置信度置信度Pconfidence degree 在某一在某一 t 值时,测定值落在值时,测定值落在(+ t s )范围内的概率。范围内的概率。n显著性水准显著性水准confidence level 在某一在某一t值时,测定值落在值时,测定值落在(+ts)范围以外的概率范围以外的概率( lP )n ta,f :t 值与置信度值与置信度P及自由度及自由度f关系。关系。 例:例: t005,10 表示

34、置信度为表示置信度为95%,自由度为,自由度为10时的时的t值。值。 t001,5 表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值。值。51误差与数据处理优秀课件52误差与数据处理优秀课件 单样本测量结果单样本测量结果以多样本平均值来估计总体以多样本平均值来估计总体平均值可能存在的区间:平均值可能存在的区间: 对于少量测量数据,即对于少量测量数据,即当当 n有限时,必须根据有限时,必须根据t分分布进行统计处理布进行统计处理: 它它表表示示在在一一定定置置信信度度下下,以平均值为中心,包括以平均值为中心,包括总总体体平平均均值值的的范范围围。这这就就叫叫平均值的置信区间。平均值

35、的置信区间。平均值的置信区间平均值的置信区间(confidence intervalconfidence interval)53误差与数据处理优秀课件 置信度:某一区间包含真值(总体平均值)的概率置信度:某一区间包含真值(总体平均值)的概率 (可能性)(可能性) 置信区间:一定置信度下,以平均值为中心,置信区间:一定置信度下,以平均值为中心, 能够包含真值的区间(范围)能够包含真值的区间(范围) 置信度越高,置信区间越大置信度越高,置信区间越大置信度和置信区间置信度和置信区间54误差与数据处理优秀课件例例10 测定某铜矿中铜含量四次结果分别测定某铜矿中铜含量四次结果分别40.53%, 40.4

36、8%,40.57%, 40.42%。计算置信度为。计算置信度为90,95和和99时,总时,总体平均值的置信区间。体平均值的置信区间。P62解:置信度90, 查表t0.10,3=2.35置信度95, 查表t0.10,3=3.18置信度99%, 查表t0.10,3=5.8455误差与数据处理优秀课件 3.4 3.4 显著性检验分析方法准确性的检验显著性检验分析方法准确性的检验 遇到的“不一样”问题:(1)对标准样品分析,所得平均值与标准值不一样(2)不同人员/科室,所得分析结果的不一样(3)新旧方法,所得结果的不一样 上述问题间的差异是系统误差还是随机误差? 属于“假设检验” 存在“显著性差异”认

37、为有系统误差存在,否则,纯属随机误差。 显著性检验显著性检验:利用统计学的方法,检验被处理的问题是否利用统计学的方法,检验被处理的问题是否 存在统计上的显著性差异。存在统计上的显著性差异。方法:t t 检验法和F F 检验法 确定某种方法是否可用,判断实验室测定结果准确性56误差与数据处理优秀课件t 检验法检验法-系统误差的检测系统误差的检测 平均值与标准值平均值与标准值( )的比较的比较 a. 计算计算t 值值 b. 由要求的置信度和测定次数由要求的置信度和测定次数,查表查表,得得: t表表 c. 比较比较 若若 t计计 t表表, 表示有显著性差异,存在系统误差表示有显著性差异,存在系统误差

38、,被检验方法需要改进被检验方法需要改进 若若 t计计 t表,表示有显著性差异两组数据的平均值比较(同一试样)两组数据的平均值比较(同一试样) 计算计算值:值: 新方法-经典方法(标准方法) 两个分析人员测定的两组数据 两个实验室测定的两组数据 a 求合并的标准偏差:求合并的标准偏差:59误差与数据处理优秀课件检验法两组数据间偶然误差的检测检验法两组数据间偶然误差的检测按照置信度和自由度查表按照置信度和自由度查表表表(p64 表表3-4) 比较比较 F计算计算和和F表表计算计算值:值:F检验是通过比较两组数据的方差,以确定它们的精密检验是通过比较两组数据的方差,以确定它们的精密度是否有显著性差异

39、的方法度是否有显著性差异的方法60误差与数据处理优秀课件p65例题 12,13,14 表表3-4所列所列F值是单边值,可以直接用于单侧检验,即值是单边值,可以直接用于单侧检验,即检验某组数据的精密度是大于、等于(或小于、等于)另检验某组数据的精密度是大于、等于(或小于、等于)另一组的精密度时,此时置信度为一组的精密度时,此时置信度为95%;而进行双边检验时,;而进行双边检验时,如判断两组数据的精密度是否存在显著性差异时,即一组如判断两组数据的精密度是否存在显著性差异时,即一组数据可能等于、等于,也可能小于、等于另一组数据的精数据可能等于、等于,也可能小于、等于另一组数据的精密度时,显著性水平为

40、单侧的两倍。此时置信度为密度时,显著性水平为单侧的两倍。此时置信度为90%。说明说明61误差与数据处理优秀课件 3.5 可疑数据的取舍可疑数据的取舍 4d法法 偏差大于偏差大于4d 的测定值可以舍弃的测定值可以舍弃 步骤步骤: 求异常值求异常值(Qu)以外数据的平均值和平均偏差以外数据的平均值和平均偏差 如果如果 , 舍去舍去 方法: 4d法、Q检验法、格鲁布斯(Grubbs)检验法 确定某个数据是否可用。4d法的依据是=0.80, 3 4 62误差与数据处理优秀课件格鲁布斯格鲁布斯(Grubbs)(Grubbs)检验法检验法(4)由测定次数和要求的置信度,查表得)由测定次数和要求的置信度,查

41、表得G 表表(5)比较)比较 若若G计算计算 G 表表,弃去可疑值,反之保留。,弃去可疑值,反之保留。 由于格鲁布斯由于格鲁布斯(Grubbs)检验法引入了标准偏差,故检验法引入了标准偏差,故准确性比准确性比Q 检验法高。检验法高。基本步骤:基本步骤:(1)排序:)排序:1,2,3,4(2)求平均值和标准偏差)求平均值和标准偏差s(3)计算)计算G值值:63误差与数据处理优秀课件Q 检验法检验法步骤:步骤: (1) 数据排列数据排列 X1 X2 Xn (2) 求极差求极差 Xn - X1 (3) 求可疑数据与相邻数据之差求可疑数据与相邻数据之差 Xn - Xn-1 或或 X2 -X1 (4)

42、计算计算: (5) 根据测定次数和要求的置信度,查表:根据测定次数和要求的置信度,查表: (6 6) 将将Q与与QX 相比,若相比,若Q QX 舍弃该数据舍弃该数据, 若若Q 2.5的概率为的概率为0.5000 0.4938=0.62%,即分析结果大于,即分析结果大于2.00%的概率为的概率为0.62%。112误差与数据处理优秀课件2. 总体平均值的估计总体平均值的估计 用数理统计的方法来处理分析测定所得到结果,目的是将这些结果作一个科学的表达,使人们能够认识到它的精密度、准确度、可信度如何。 最好的方法是对总总体体平平均均值值进行估计,在一定的置信度下给出一个包含总体平均值的范围。113误差

43、与数据处理优秀课件 总体标准偏差总体标准偏差 样本标准偏差样本标准偏差 相对标准偏差相对标准偏差 标准偏差与平均偏差标准偏差与平均偏差 平均值的标准偏差平均值的标准偏差关于标准偏差的术语关于标准偏差的术语114误差与数据处理优秀课件 总体标准偏差总体标准偏差 当测定次数为无限多次时,各测量值对当测定次数为无限多次时,各测量值对总体平均值总体平均值的偏离,用总体标准偏差的偏离,用总体标准偏差表示:表示: 115误差与数据处理优秀课件样本标准偏差样本标准偏差n 当测量值不多,总体平均值又不知道时,用样本的标准偏当测量值不多,总体平均值又不知道时,用样本的标准偏差差s来衡量该组数据的分散程度。数学表

44、达式为:来衡量该组数据的分散程度。数学表达式为: n式中(式中(n-1)称为)称为自由度,以自由度,以f表示表示,是指独立偏差的个数。,是指独立偏差的个数。n 当测量次数非常多时,测量次数当测量次数非常多时,测量次数n与自由度(与自由度(n-1)的)的 区区 别就很小了,此时别就很小了,此时 ,同时同时 116误差与数据处理优秀课件 相对标准偏差相对标准偏差相对标准偏差相对标准偏差(又称变异系数又称变异系数)为为 117误差与数据处理优秀课件 标准偏差与平均偏差标准偏差与平均偏差 用统计学方法可以证明,当测定次数非常多用统计学方法可以证明,当测定次数非常多(例如大于(例如大于20)时,标准偏差

45、与平均偏差有下列)时,标准偏差与平均偏差有下列关系:关系: =0.7970.80但应当指出:当测定次数较少时,但应当指出:当测定次数较少时, 与与S之间的关之间的关系就可能与此式相差颇大了。系就可能与此式相差颇大了。118误差与数据处理优秀课件 平均值的标准偏差平均值的标准偏差n 何谓平均值的标准偏差?何谓平均值的标准偏差? 从总体中分别抽出从总体中分别抽出m个样本,每个样本各进行个样本,每个样本各进行n次测定(通常分次测定(通常分析只是从总体中抽出一个样本进行析只是从总体中抽出一个样本进行n 次平行测定)。因为有次平行测定)。因为有m个样个样本,也就有本,也就有m个平均值,由个平均值,由m个

46、样本平均值再得到的平均值比只用个样本平均值再得到的平均值比只用一个样本的平均值来估算总体平均值要好。用一个样本的平均值来估算总体平均值要好。用m 个样本平均值再计个样本平均值再计算标准偏差,就是算标准偏差,就是平均值的标准偏差。平均值的标准偏差。 119误差与数据处理优秀课件 平均值的标准偏差与单次结果标准偏差平均值的标准偏差与单次结果标准偏差 数理统计证明:多个样本平均值的标准偏差与单个样本测量结果的标准偏差之间有下列关系: 无限次测量 有限次测量显然,平均值的标准偏差比单次测定结果的标准偏差要小。显然,平均值的标准偏差比单次测定结果的标准偏差要小。120误差与数据处理优秀课件 平均值标准偏

47、差与测定次数关系平均值标准偏差与测定次数关系: 平均值的标准偏差与测定次数的平均值的标准偏差与测定次数的 平方根成反比。平方根成反比。121误差与数据处理优秀课件n平均值的平均偏差与单个平均偏差:平均值的平均偏差与单个平均偏差: 平均值的平均偏差与单个样本测量的平均偏差之间平均值的平均偏差与单个样本测量的平均偏差之间有如下关系:有如下关系: n结论:适当地增加测定次数可提高结果的精密度。结论:适当地增加测定次数可提高结果的精密度。 在日常分析中,一般平行测定:在日常分析中,一般平行测定:34次。次。 较高要求:较高要求:59次次 最多:最多:1012次次122误差与数据处理优秀课件 少量数据的

48、统计处理少量数据的统计处理用用 t 分分布布曲曲线线来来处处理理, t 分分布布可可说说明明当当n不大时(不大时(n20)随机误差分布的规律性。)随机误差分布的规律性。正态分布是无数次测量数据的随机误差分布规律。而实际正态分布是无数次测量数据的随机误差分布规律。而实际中,测量次数有限,故随机误差分布不服从正态分布。中,测量次数有限,故随机误差分布不服从正态分布。123误差与数据处理优秀课件 t 分布曲线分布曲线 用用s代代替替,纵纵坐坐标标仍仍为为概概率率密密度度,但但横横坐坐标标则则为为统计量统计量 t t 。t 定义为:定义为:124误差与数据处理优秀课件n自由度自由度f degree o

49、f freedom ( f = n-1) t分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是t分布曲线随分布曲线随 自由度自由度 f 而改变。当而改变。当 f 趋近趋近时,时,t 分布就趋近正态分布分布就趋近正态分布。n置信度置信度Pconfidence degree 在某一在某一 t 值时,测定值落在值时,测定值落在(+ t s )范围内的概率。范围内的概率。n显著性水准显著性水准confidence level 在某一在某一t值时,测定值落在值时,测定值落在(+ts)范围以外的概率范围以外的概率( lP )n ta,f :t 值与置信度值与置信度P及自由度及自由度f关系。关

50、系。 例:例: t005,10 表示置信度为表示置信度为95%,自由度为,自由度为10时的时的t值。值。 t001,5 表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值。值。125误差与数据处理优秀课件126误差与数据处理优秀课件 单样本测量结果单样本测量结果以多样本平均值来估计总体以多样本平均值来估计总体平均值可能存在的区间:平均值可能存在的区间: 对于少量测量数据,即对于少量测量数据,即当当 n有限时,必须根据有限时,必须根据t分分布进行统计处理布进行统计处理: 它它表表示示在在一一定定置置信信度度下下,以平均值为中心,包括以平均值为中心,包括总总体体平平均均值值的的范范围

51、围。这这就就叫叫平均值的置信区间。平均值的置信区间。平均值的置信区间平均值的置信区间(confidence intervalconfidence interval)127误差与数据处理优秀课件 置信度:某一区间包含真值(总体平均值)的概率置信度:某一区间包含真值(总体平均值)的概率 (可能性)(可能性) 置信区间:一定置信度下,以平均值为中心,置信区间:一定置信度下,以平均值为中心, 能够包含真值的区间(范围)能够包含真值的区间(范围) 置信度越高,置信区间越大置信度越高,置信区间越大置信度和置信区间置信度和置信区间128误差与数据处理优秀课件例例10 测定某铜矿中铜含量四次结果分别测定某铜矿

52、中铜含量四次结果分别40.53%, 40.48%,40.57%, 40.42%。计算置信度为。计算置信度为90,95和和99时,总时,总体平均值的置信区间。体平均值的置信区间。P62解:置信度90, 查表t0.10,3=2.35置信度95, 查表t0.10,3=3.18置信度99%, 查表t0.10,3=5.84129误差与数据处理优秀课件 3.4 3.4 显著性检验分析方法准确性的检验显著性检验分析方法准确性的检验 遇到的“不一样”问题:(1)对标准样品分析,所得平均值与标准值不一样(2)不同人员/科室,所得分析结果的不一样(3)新旧方法,所得结果的不一样 上述问题间的差异是系统误差还是随机

53、误差? 属于“假设检验” 存在“显著性差异”认为有系统误差存在,否则,纯属随机误差。 显著性检验显著性检验:利用统计学的方法,检验被处理的问题是否利用统计学的方法,检验被处理的问题是否 存在统计上的显著性差异。存在统计上的显著性差异。方法:t t 检验法和F F 检验法 确定某种方法是否可用,判断实验室测定结果准确性130误差与数据处理优秀课件t 检验法检验法-系统误差的检测系统误差的检测 平均值与标准值平均值与标准值( )的比较的比较 a. 计算计算t 值值 b. 由要求的置信度和测定次数由要求的置信度和测定次数,查表查表,得得: t表表 c. 比较比较 若若 t计计 t表表, 表示有显著性

54、差异,存在系统误差表示有显著性差异,存在系统误差,被检验方法需要改进被检验方法需要改进 若若 t计计 t表,表示有显著性差异两组数据的平均值比较(同一试样)两组数据的平均值比较(同一试样) 计算计算值:值: 新方法-经典方法(标准方法) 两个分析人员测定的两组数据 两个实验室测定的两组数据 a 求合并的标准偏差:求合并的标准偏差:133误差与数据处理优秀课件检验法两组数据间偶然误差的检测检验法两组数据间偶然误差的检测按照置信度和自由度查表按照置信度和自由度查表表表(p64 表表3-4) 比较比较 F计算计算和和F表表计算计算值:值:F检验是通过比较两组数据的方差,以确定它们的精密检验是通过比较

55、两组数据的方差,以确定它们的精密度是否有显著性差异的方法度是否有显著性差异的方法134误差与数据处理优秀课件p65例题 12,13,14 表表3-4所列所列F值是单边值,可以直接用于单侧检验,即值是单边值,可以直接用于单侧检验,即检验某组数据的精密度是大于、等于(或小于、等于)另检验某组数据的精密度是大于、等于(或小于、等于)另一组的精密度时,此时置信度为一组的精密度时,此时置信度为95%;而进行双边检验时,;而进行双边检验时,如判断两组数据的精密度是否存在显著性差异时,即一组如判断两组数据的精密度是否存在显著性差异时,即一组数据可能等于、等于,也可能小于、等于另一组数据的精数据可能等于、等于

56、,也可能小于、等于另一组数据的精密度时,显著性水平为单侧的两倍。此时置信度为密度时,显著性水平为单侧的两倍。此时置信度为90%。说明说明135误差与数据处理优秀课件 3.5 可疑数据的取舍可疑数据的取舍 4d法法 偏差大于偏差大于4d 的测定值可以舍弃的测定值可以舍弃 步骤步骤: 求异常值求异常值(Qu)以外数据的平均值和平均偏差以外数据的平均值和平均偏差 如果如果 , 舍去舍去 方法: 4d法、Q检验法、格鲁布斯(Grubbs)检验法 确定某个数据是否可用。4d法的依据是=0.80, 3 4 136误差与数据处理优秀课件格鲁布斯格鲁布斯(Grubbs)(Grubbs)检验法检验法(4)由测定

57、次数和要求的置信度,查表得)由测定次数和要求的置信度,查表得G 表表(5)比较)比较 若若G计算计算 G 表表,弃去可疑值,反之保留。,弃去可疑值,反之保留。 由于格鲁布斯由于格鲁布斯(Grubbs)检验法引入了标准偏差,故检验法引入了标准偏差,故准确性比准确性比Q 检验法高。检验法高。基本步骤:基本步骤:(1)排序:)排序:1,2,3,4(2)求平均值和标准偏差)求平均值和标准偏差s(3)计算)计算G值值:137误差与数据处理优秀课件Q 检验法检验法步骤:步骤: (1) 数据排列数据排列 X1 X2 Xn (2) 求极差求极差 Xn - X1 (3) 求可疑数据与相邻数据之差求可疑数据与相邻

58、数据之差 Xn - Xn-1 或或 X2 -X1 (4) 计算计算: (5) 根据测定次数和要求的置信度,查表:根据测定次数和要求的置信度,查表: (6 6) 将将Q与与QX 相比,若相比,若Q QX 舍弃该数据舍弃该数据, 若若Q 2.5的概率为的概率为0.5000 0.4938=0.62%,即分析结果大于,即分析结果大于2.00%的概率为的概率为0.62%。186误差与数据处理优秀课件2. 总体平均值的估计总体平均值的估计 用数理统计的方法来处理分析测定所得到结果,目的是将这些结果作一个科学的表达,使人们能够认识到它的精密度、准确度、可信度如何。 最好的方法是对总总体体平平均均值值进行估计

59、,在一定的置信度下给出一个包含总体平均值的范围。187误差与数据处理优秀课件 总体标准偏差总体标准偏差 样本标准偏差样本标准偏差 相对标准偏差相对标准偏差 标准偏差与平均偏差标准偏差与平均偏差 平均值的标准偏差平均值的标准偏差关于标准偏差的术语关于标准偏差的术语188误差与数据处理优秀课件 总体标准偏差总体标准偏差 当测定次数为无限多次时,各测量值对当测定次数为无限多次时,各测量值对总体平均值总体平均值的偏离,用总体标准偏差的偏离,用总体标准偏差表示:表示: 189误差与数据处理优秀课件样本标准偏差样本标准偏差n 当测量值不多,总体平均值又不知道时,用样本的标准偏当测量值不多,总体平均值又不知

60、道时,用样本的标准偏差差s来衡量该组数据的分散程度。数学表达式为:来衡量该组数据的分散程度。数学表达式为: n式中(式中(n-1)称为)称为自由度,以自由度,以f表示表示,是指独立偏差的个数。,是指独立偏差的个数。n 当测量次数非常多时,测量次数当测量次数非常多时,测量次数n与自由度(与自由度(n-1)的)的 区区 别就很小了,此时别就很小了,此时 ,同时同时 190误差与数据处理优秀课件 相对标准偏差相对标准偏差相对标准偏差相对标准偏差(又称变异系数又称变异系数)为为 191误差与数据处理优秀课件 标准偏差与平均偏差标准偏差与平均偏差 用统计学方法可以证明,当测定次数非常多用统计学方法可以证

61、明,当测定次数非常多(例如大于(例如大于20)时,标准偏差与平均偏差有下列)时,标准偏差与平均偏差有下列关系:关系: =0.7970.80但应当指出:当测定次数较少时,但应当指出:当测定次数较少时, 与与S之间的关之间的关系就可能与此式相差颇大了。系就可能与此式相差颇大了。192误差与数据处理优秀课件 平均值的标准偏差平均值的标准偏差n 何谓平均值的标准偏差?何谓平均值的标准偏差? 从总体中分别抽出从总体中分别抽出m个样本,每个样本各进行个样本,每个样本各进行n次测定(通常分次测定(通常分析只是从总体中抽出一个样本进行析只是从总体中抽出一个样本进行n 次平行测定)。因为有次平行测定)。因为有m

62、个样个样本,也就有本,也就有m个平均值,由个平均值,由m个样本平均值再得到的平均值比只用个样本平均值再得到的平均值比只用一个样本的平均值来估算总体平均值要好。用一个样本的平均值来估算总体平均值要好。用m 个样本平均值再计个样本平均值再计算标准偏差,就是算标准偏差,就是平均值的标准偏差。平均值的标准偏差。 193误差与数据处理优秀课件 平均值的标准偏差与单次结果标准偏差平均值的标准偏差与单次结果标准偏差 数理统计证明:多个样本平均值的标准偏差与单个样本测量结果的标准偏差之间有下列关系: 无限次测量 有限次测量显然,平均值的标准偏差比单次测定结果的标准偏差要小。显然,平均值的标准偏差比单次测定结果

63、的标准偏差要小。194误差与数据处理优秀课件 平均值标准偏差与测定次数关系平均值标准偏差与测定次数关系: 平均值的标准偏差与测定次数的平均值的标准偏差与测定次数的 平方根成反比。平方根成反比。195误差与数据处理优秀课件n平均值的平均偏差与单个平均偏差:平均值的平均偏差与单个平均偏差: 平均值的平均偏差与单个样本测量的平均偏差之间平均值的平均偏差与单个样本测量的平均偏差之间有如下关系:有如下关系: n结论:适当地增加测定次数可提高结果的精密度。结论:适当地增加测定次数可提高结果的精密度。 在日常分析中,一般平行测定:在日常分析中,一般平行测定:34次。次。 较高要求:较高要求:59次次 最多:

64、最多:1012次次196误差与数据处理优秀课件 少量数据的统计处理少量数据的统计处理用用 t 分分布布曲曲线线来来处处理理, t 分分布布可可说说明明当当n不大时(不大时(n20)随机误差分布的规律性。)随机误差分布的规律性。正态分布是无数次测量数据的随机误差分布规律。而实际正态分布是无数次测量数据的随机误差分布规律。而实际中,测量次数有限,故随机误差分布不服从正态分布。中,测量次数有限,故随机误差分布不服从正态分布。197误差与数据处理优秀课件 t 分布曲线分布曲线 用用s代代替替,纵纵坐坐标标仍仍为为概概率率密密度度,但但横横坐坐标标则则为为统计量统计量 t t 。t 定义为:定义为:19

65、8误差与数据处理优秀课件n自由度自由度f degree of freedom ( f = n-1) t分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是t分布曲线随分布曲线随 自由度自由度 f 而改变。当而改变。当 f 趋近趋近时,时,t 分布就趋近正态分布分布就趋近正态分布。n置信度置信度Pconfidence degree 在某一在某一 t 值时,测定值落在值时,测定值落在(+ t s )范围内的概率。范围内的概率。n显著性水准显著性水准confidence level 在某一在某一t值时,测定值落在值时,测定值落在(+ts)范围以外的概率范围以外的概率( lP )n ta,

66、f :t 值与置信度值与置信度P及自由度及自由度f关系。关系。 例:例: t005,10 表示置信度为表示置信度为95%,自由度为,自由度为10时的时的t值。值。 t001,5 表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值。值。199误差与数据处理优秀课件200误差与数据处理优秀课件 单样本测量结果单样本测量结果以多样本平均值来估计总体以多样本平均值来估计总体平均值可能存在的区间:平均值可能存在的区间: 对于少量测量数据,即对于少量测量数据,即当当 n有限时,必须根据有限时,必须根据t分分布进行统计处理布进行统计处理: 它它表表示示在在一一定定置置信信度度下下,以平均值为中

67、心,包括以平均值为中心,包括总总体体平平均均值值的的范范围围。这这就就叫叫平均值的置信区间。平均值的置信区间。平均值的置信区间平均值的置信区间(confidence intervalconfidence interval)201误差与数据处理优秀课件 置信度:某一区间包含真值(总体平均值)的概率置信度:某一区间包含真值(总体平均值)的概率 (可能性)(可能性) 置信区间:一定置信度下,以平均值为中心,置信区间:一定置信度下,以平均值为中心, 能够包含真值的区间(范围)能够包含真值的区间(范围) 置信度越高,置信区间越大置信度越高,置信区间越大置信度和置信区间置信度和置信区间202误差与数据处理

68、优秀课件例例10 测定某铜矿中铜含量四次结果分别测定某铜矿中铜含量四次结果分别40.53%, 40.48%,40.57%, 40.42%。计算置信度为。计算置信度为90,95和和99时,总时,总体平均值的置信区间。体平均值的置信区间。P62解:置信度90, 查表t0.10,3=2.35置信度95, 查表t0.10,3=3.18置信度99%, 查表t0.10,3=5.84203误差与数据处理优秀课件 3.4 3.4 显著性检验分析方法准确性的检验显著性检验分析方法准确性的检验 遇到的“不一样”问题:(1)对标准样品分析,所得平均值与标准值不一样(2)不同人员/科室,所得分析结果的不一样(3)新旧

69、方法,所得结果的不一样 上述问题间的差异是系统误差还是随机误差? 属于“假设检验” 存在“显著性差异”认为有系统误差存在,否则,纯属随机误差。 显著性检验显著性检验:利用统计学的方法,检验被处理的问题是否利用统计学的方法,检验被处理的问题是否 存在统计上的显著性差异。存在统计上的显著性差异。方法:t t 检验法和F F 检验法 确定某种方法是否可用,判断实验室测定结果准确性204误差与数据处理优秀课件t 检验法检验法-系统误差的检测系统误差的检测 平均值与标准值平均值与标准值( )的比较的比较 a. 计算计算t 值值 b. 由要求的置信度和测定次数由要求的置信度和测定次数,查表查表,得得: t

70、表表 c. 比较比较 若若 t计计 t表表, 表示有显著性差异,存在系统误差表示有显著性差异,存在系统误差,被检验方法需要改进被检验方法需要改进 若若 t计计 t表,表示有显著性差异两组数据的平均值比较(同一试样)两组数据的平均值比较(同一试样) 计算计算值:值: 新方法-经典方法(标准方法) 两个分析人员测定的两组数据 两个实验室测定的两组数据 a 求合并的标准偏差:求合并的标准偏差:207误差与数据处理优秀课件检验法两组数据间偶然误差的检测检验法两组数据间偶然误差的检测按照置信度和自由度查表按照置信度和自由度查表表表(p64 表表3-4) 比较比较 F计算计算和和F表表计算计算值:值:F检

71、验是通过比较两组数据的方差,以确定它们的精密检验是通过比较两组数据的方差,以确定它们的精密度是否有显著性差异的方法度是否有显著性差异的方法208误差与数据处理优秀课件p65例题 12,13,14 表表3-4所列所列F值是单边值,可以直接用于单侧检验,即值是单边值,可以直接用于单侧检验,即检验某组数据的精密度是大于、等于(或小于、等于)另检验某组数据的精密度是大于、等于(或小于、等于)另一组的精密度时,此时置信度为一组的精密度时,此时置信度为95%;而进行双边检验时,;而进行双边检验时,如判断两组数据的精密度是否存在显著性差异时,即一组如判断两组数据的精密度是否存在显著性差异时,即一组数据可能等

72、于、等于,也可能小于、等于另一组数据的精数据可能等于、等于,也可能小于、等于另一组数据的精密度时,显著性水平为单侧的两倍。此时置信度为密度时,显著性水平为单侧的两倍。此时置信度为90%。说明说明209误差与数据处理优秀课件 3.5 可疑数据的取舍可疑数据的取舍 4d法法 偏差大于偏差大于4d 的测定值可以舍弃的测定值可以舍弃 步骤步骤: 求异常值求异常值(Qu)以外数据的平均值和平均偏差以外数据的平均值和平均偏差 如果如果 , 舍去舍去 方法: 4d法、Q检验法、格鲁布斯(Grubbs)检验法 确定某个数据是否可用。4d法的依据是=0.80, 3 4 210误差与数据处理优秀课件格鲁布斯格鲁布

73、斯(Grubbs)(Grubbs)检验法检验法(4)由测定次数和要求的置信度,查表得)由测定次数和要求的置信度,查表得G 表表(5)比较)比较 若若G计算计算 G 表表,弃去可疑值,反之保留。,弃去可疑值,反之保留。 由于格鲁布斯由于格鲁布斯(Grubbs)检验法引入了标准偏差,故检验法引入了标准偏差,故准确性比准确性比Q 检验法高。检验法高。基本步骤:基本步骤:(1)排序:)排序:1,2,3,4(2)求平均值和标准偏差)求平均值和标准偏差s(3)计算)计算G值值:211误差与数据处理优秀课件Q 检验法检验法步骤:步骤: (1) 数据排列数据排列 X1 X2 Xn (2) 求极差求极差 Xn

74、- X1 (3) 求可疑数据与相邻数据之差求可疑数据与相邻数据之差 Xn - Xn-1 或或 X2 -X1 (4) 计算计算: (5) 根据测定次数和要求的置信度,查表:根据测定次数和要求的置信度,查表: (6 6) 将将Q与与QX 相比,若相比,若Q QX 舍弃该数据舍弃该数据, 若若Q 2.5的概率为的概率为0.5000 0.4938=0.62%,即分析结果大于,即分析结果大于2.00%的概率为的概率为0.62%。260误差与数据处理优秀课件2. 总体平均值的估计总体平均值的估计 用数理统计的方法来处理分析测定所得到结果,目的是将这些结果作一个科学的表达,使人们能够认识到它的精密度、准确度

75、、可信度如何。 最好的方法是对总总体体平平均均值值进行估计,在一定的置信度下给出一个包含总体平均值的范围。261误差与数据处理优秀课件 总体标准偏差总体标准偏差 样本标准偏差样本标准偏差 相对标准偏差相对标准偏差 标准偏差与平均偏差标准偏差与平均偏差 平均值的标准偏差平均值的标准偏差关于标准偏差的术语关于标准偏差的术语262误差与数据处理优秀课件 总体标准偏差总体标准偏差 当测定次数为无限多次时,各测量值对当测定次数为无限多次时,各测量值对总体平均值总体平均值的偏离,用总体标准偏差的偏离,用总体标准偏差表示:表示: 263误差与数据处理优秀课件样本标准偏差样本标准偏差n 当测量值不多,总体平均

76、值又不知道时,用样本的标准偏当测量值不多,总体平均值又不知道时,用样本的标准偏差差s来衡量该组数据的分散程度。数学表达式为:来衡量该组数据的分散程度。数学表达式为: n式中(式中(n-1)称为)称为自由度,以自由度,以f表示表示,是指独立偏差的个数。,是指独立偏差的个数。n 当测量次数非常多时,测量次数当测量次数非常多时,测量次数n与自由度(与自由度(n-1)的)的 区区 别就很小了,此时别就很小了,此时 ,同时同时 264误差与数据处理优秀课件 相对标准偏差相对标准偏差相对标准偏差相对标准偏差(又称变异系数又称变异系数)为为 265误差与数据处理优秀课件 标准偏差与平均偏差标准偏差与平均偏差

77、 用统计学方法可以证明,当测定次数非常多用统计学方法可以证明,当测定次数非常多(例如大于(例如大于20)时,标准偏差与平均偏差有下列)时,标准偏差与平均偏差有下列关系:关系: =0.7970.80但应当指出:当测定次数较少时,但应当指出:当测定次数较少时, 与与S之间的关之间的关系就可能与此式相差颇大了。系就可能与此式相差颇大了。266误差与数据处理优秀课件 平均值的标准偏差平均值的标准偏差n 何谓平均值的标准偏差?何谓平均值的标准偏差? 从总体中分别抽出从总体中分别抽出m个样本,每个样本各进行个样本,每个样本各进行n次测定(通常分次测定(通常分析只是从总体中抽出一个样本进行析只是从总体中抽出

78、一个样本进行n 次平行测定)。因为有次平行测定)。因为有m个样个样本,也就有本,也就有m个平均值,由个平均值,由m个样本平均值再得到的平均值比只用个样本平均值再得到的平均值比只用一个样本的平均值来估算总体平均值要好。用一个样本的平均值来估算总体平均值要好。用m 个样本平均值再计个样本平均值再计算标准偏差,就是算标准偏差,就是平均值的标准偏差。平均值的标准偏差。 267误差与数据处理优秀课件 平均值的标准偏差与单次结果标准偏差平均值的标准偏差与单次结果标准偏差 数理统计证明:多个样本平均值的标准偏差与单个样本测量结果的标准偏差之间有下列关系: 无限次测量 有限次测量显然,平均值的标准偏差比单次测

79、定结果的标准偏差要小。显然,平均值的标准偏差比单次测定结果的标准偏差要小。268误差与数据处理优秀课件 平均值标准偏差与测定次数关系平均值标准偏差与测定次数关系: 平均值的标准偏差与测定次数的平均值的标准偏差与测定次数的 平方根成反比。平方根成反比。269误差与数据处理优秀课件n平均值的平均偏差与单个平均偏差:平均值的平均偏差与单个平均偏差: 平均值的平均偏差与单个样本测量的平均偏差之间平均值的平均偏差与单个样本测量的平均偏差之间有如下关系:有如下关系: n结论:适当地增加测定次数可提高结果的精密度。结论:适当地增加测定次数可提高结果的精密度。 在日常分析中,一般平行测定:在日常分析中,一般平

80、行测定:34次。次。 较高要求:较高要求:59次次 最多:最多:1012次次270误差与数据处理优秀课件 少量数据的统计处理少量数据的统计处理用用 t 分分布布曲曲线线来来处处理理, t 分分布布可可说说明明当当n不大时(不大时(n20)随机误差分布的规律性。)随机误差分布的规律性。正态分布是无数次测量数据的随机误差分布规律。而实际正态分布是无数次测量数据的随机误差分布规律。而实际中,测量次数有限,故随机误差分布不服从正态分布。中,测量次数有限,故随机误差分布不服从正态分布。271误差与数据处理优秀课件 t 分布曲线分布曲线 用用s代代替替,纵纵坐坐标标仍仍为为概概率率密密度度,但但横横坐坐标

81、标则则为为统计量统计量 t t 。t 定义为:定义为:272误差与数据处理优秀课件n自由度自由度f degree of freedom ( f = n-1) t分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是t分布曲线随分布曲线随 自由度自由度 f 而改变。当而改变。当 f 趋近趋近时,时,t 分布就趋近正态分布分布就趋近正态分布。n置信度置信度Pconfidence degree 在某一在某一 t 值时,测定值落在值时,测定值落在(+ t s )范围内的概率。范围内的概率。n显著性水准显著性水准confidence level 在某一在某一t值时,测定值落在值时,测定值落在(

82、+ts)范围以外的概率范围以外的概率( lP )n ta,f :t 值与置信度值与置信度P及自由度及自由度f关系。关系。 例:例: t005,10 表示置信度为表示置信度为95%,自由度为,自由度为10时的时的t值。值。 t001,5 表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值。值。273误差与数据处理优秀课件274误差与数据处理优秀课件 单样本测量结果单样本测量结果以多样本平均值来估计总体以多样本平均值来估计总体平均值可能存在的区间:平均值可能存在的区间: 对于少量测量数据,即对于少量测量数据,即当当 n有限时,必须根据有限时,必须根据t分分布进行统计处理布进行统计处理

83、: 它它表表示示在在一一定定置置信信度度下下,以平均值为中心,包括以平均值为中心,包括总总体体平平均均值值的的范范围围。这这就就叫叫平均值的置信区间。平均值的置信区间。平均值的置信区间平均值的置信区间(confidence intervalconfidence interval)275误差与数据处理优秀课件 置信度:某一区间包含真值(总体平均值)的概率置信度:某一区间包含真值(总体平均值)的概率 (可能性)(可能性) 置信区间:一定置信度下,以平均值为中心,置信区间:一定置信度下,以平均值为中心, 能够包含真值的区间(范围)能够包含真值的区间(范围) 置信度越高,置信区间越大置信度越高,置信区

84、间越大置信度和置信区间置信度和置信区间276误差与数据处理优秀课件例例10 测定某铜矿中铜含量四次结果分别测定某铜矿中铜含量四次结果分别40.53%, 40.48%,40.57%, 40.42%。计算置信度为。计算置信度为90,95和和99时,总时,总体平均值的置信区间。体平均值的置信区间。P62解:置信度90, 查表t0.10,3=2.35置信度95, 查表t0.10,3=3.18置信度99%, 查表t0.10,3=5.84277误差与数据处理优秀课件 3.4 3.4 显著性检验分析方法准确性的检验显著性检验分析方法准确性的检验 遇到的“不一样”问题:(1)对标准样品分析,所得平均值与标准值

85、不一样(2)不同人员/科室,所得分析结果的不一样(3)新旧方法,所得结果的不一样 上述问题间的差异是系统误差还是随机误差? 属于“假设检验” 存在“显著性差异”认为有系统误差存在,否则,纯属随机误差。 显著性检验显著性检验:利用统计学的方法,检验被处理的问题是否利用统计学的方法,检验被处理的问题是否 存在统计上的显著性差异。存在统计上的显著性差异。方法:t t 检验法和F F 检验法 确定某种方法是否可用,判断实验室测定结果准确性278误差与数据处理优秀课件t 检验法检验法-系统误差的检测系统误差的检测 平均值与标准值平均值与标准值( )的比较的比较 a. 计算计算t 值值 b. 由要求的置信

86、度和测定次数由要求的置信度和测定次数,查表查表,得得: t表表 c. 比较比较 若若 t计计 t表表, 表示有显著性差异,存在系统误差表示有显著性差异,存在系统误差,被检验方法需要改进被检验方法需要改进 若若 t计计 t表,表示有显著性差异两组数据的平均值比较(同一试样)两组数据的平均值比较(同一试样) 计算计算值:值: 新方法-经典方法(标准方法) 两个分析人员测定的两组数据 两个实验室测定的两组数据 a 求合并的标准偏差:求合并的标准偏差:281误差与数据处理优秀课件检验法两组数据间偶然误差的检测检验法两组数据间偶然误差的检测按照置信度和自由度查表按照置信度和自由度查表表表(p64 表表3

87、-4) 比较比较 F计算计算和和F表表计算计算值:值:F检验是通过比较两组数据的方差,以确定它们的精密检验是通过比较两组数据的方差,以确定它们的精密度是否有显著性差异的方法度是否有显著性差异的方法282误差与数据处理优秀课件p65例题 12,13,14 表表3-4所列所列F值是单边值,可以直接用于单侧检验,即值是单边值,可以直接用于单侧检验,即检验某组数据的精密度是大于、等于(或小于、等于)另检验某组数据的精密度是大于、等于(或小于、等于)另一组的精密度时,此时置信度为一组的精密度时,此时置信度为95%;而进行双边检验时,;而进行双边检验时,如判断两组数据的精密度是否存在显著性差异时,即一组如

88、判断两组数据的精密度是否存在显著性差异时,即一组数据可能等于、等于,也可能小于、等于另一组数据的精数据可能等于、等于,也可能小于、等于另一组数据的精密度时,显著性水平为单侧的两倍。此时置信度为密度时,显著性水平为单侧的两倍。此时置信度为90%。说明说明283误差与数据处理优秀课件 3.5 可疑数据的取舍可疑数据的取舍 4d法法 偏差大于偏差大于4d 的测定值可以舍弃的测定值可以舍弃 步骤步骤: 求异常值求异常值(Qu)以外数据的平均值和平均偏差以外数据的平均值和平均偏差 如果如果 , 舍去舍去 方法: 4d法、Q检验法、格鲁布斯(Grubbs)检验法 确定某个数据是否可用。4d法的依据是=0.

89、80, 3 4 284误差与数据处理优秀课件格鲁布斯格鲁布斯(Grubbs)(Grubbs)检验法检验法(4)由测定次数和要求的置信度,查表得)由测定次数和要求的置信度,查表得G 表表(5)比较)比较 若若G计算计算 G 表表,弃去可疑值,反之保留。,弃去可疑值,反之保留。 由于格鲁布斯由于格鲁布斯(Grubbs)检验法引入了标准偏差,故检验法引入了标准偏差,故准确性比准确性比Q 检验法高。检验法高。基本步骤:基本步骤:(1)排序:)排序:1,2,3,4(2)求平均值和标准偏差)求平均值和标准偏差s(3)计算)计算G值值:285误差与数据处理优秀课件Q 检验法检验法步骤:步骤: (1) 数据排

90、列数据排列 X1 X2 Xn (2) 求极差求极差 Xn - X1 (3) 求可疑数据与相邻数据之差求可疑数据与相邻数据之差 Xn - Xn-1 或或 X2 -X1 (4) 计算计算: (5) 根据测定次数和要求的置信度,查表:根据测定次数和要求的置信度,查表: (6 6) 将将Q与与QX 相比,若相比,若Q QX 舍弃该数据舍弃该数据, 若若Q QX 保留该数据。保留该数据。286误差与数据处理优秀课件 不同置信度下,舍弃可疑数据的不同置信度下,舍弃可疑数据的Q值表值表 测定次数测定次数 Q90 Q95 Q99 3 0.94 0.98 0.99 4 0.76 0.85 0.93 8 0.47

91、 0.54 0.63 287误差与数据处理优秀课件p66, p67, p68 例题15,1617 288误差与数据处理优秀课件3.6 回归分析法回归分析法n分析化学中,经常使用标准曲线(工作曲线)来分析化学中,经常使用标准曲线(工作曲线)来获得未知溶液的浓度。获得未知溶液的浓度。289误差与数据处理优秀课件相关系数相关系数R= (xi-xA)(yi-yA)/ (xi-xA)2 (yi-yA)2)0.5290误差与数据处理优秀课件n 在以上的吸光度在以上的吸光度A与浓度与浓度C的工作曲线绘制中,各测量的工作曲线绘制中,各测量点对于所建立的直线有一定偏离;点对于所建立的直线有一定偏离;n 这就需要

92、我们用数理统计的方法找到一条最接近于各这就需要我们用数理统计的方法找到一条最接近于各测量点的直线,它对所有测量点来说,误差是最小的。测量点的直线,它对所有测量点来说,误差是最小的。如何得到这条直线?方法就是数据进行回归分析。如何得到这条直线?方法就是数据进行回归分析。291误差与数据处理优秀课件一元线性回归方程及回归直线一元线性回归方程及回归直线回归直线用如下方程表示:回归直线用如下方程表示:设做标准曲线时取设做标准曲线时取n个实验点(个实验点(x1,y1; x2,y2;.xn,yn)每个点于回归直线的误差可用以下来描述每个点于回归直线的误差可用以下来描述回归直线与所有点的误差回归直线与所有点

93、的误差292误差与数据处理优秀课件要让所确定的回归直线最接近实验点的真实分布状态,要让所确定的回归直线最接近实验点的真实分布状态,则则Q必然应取极小值。必然应取极小值。分析校正时,可取不同的分析校正时,可取不同的xi测量测量yi,用最小二乘法估计用最小二乘法估计a和和b,使使Q值达到极小值。值达到极小值。数学上求极值的方法,即数学上求极值的方法,即 可推出可推出a 和和b的计算式,继而得出回归方程的计算式,继而得出回归方程293误差与数据处理优秀课件相关系数相关系数实际中,当两个变量间并不是严格的线性关系,数据实际中,当两个变量间并不是严格的线性关系,数据有偏离,这样得到的回归直线是否有意义,可用相关有偏离,这样得到的回归直线是否有意义,可用相关系数来检验。系数来检验。相关系数定义:相关系数定义:294误差与数据处理优秀课件相关系数物理意义a.两个变量之间存在完全线性关系,两个变量之间存在完全线性关系,r=1b.两个变量之间完全不存在线性关系,两个变量之间完全不存在线性关系,r=0c.r在在01之间时,表示两变量存在相关关系。之间时,表示两变量存在相关关系。r值越接近值越接近于于1,线性关系越好。,线性关系越好。295误差与数据处理优秀课件作业P75 1, 3, 4, 5, 8, 11, 13, 16, 20, 22296误差与数据处理优秀课件

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号