第二章分析化学中的数据处理课件

上传人:我*** 文档编号:141132760 上传时间:2020-08-04 格式:PPT 页数:52 大小:386KB
返回 下载 相关 举报
第二章分析化学中的数据处理课件_第1页
第1页 / 共52页
第二章分析化学中的数据处理课件_第2页
第2页 / 共52页
第二章分析化学中的数据处理课件_第3页
第3页 / 共52页
第二章分析化学中的数据处理课件_第4页
第4页 / 共52页
第二章分析化学中的数据处理课件_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第二章分析化学中的数据处理课件》由会员分享,可在线阅读,更多相关《第二章分析化学中的数据处理课件(52页珍藏版)》请在金锄头文库上搜索。

1、Chemical,Analysis,第二章 分析化学中的数据处理,研究对象的某种特性值的全体叫总体;从总体中随机取出的一组数据叫样本;样本所含测量值的数目叫样本容量。例如,对某矿石中Fe的含量作了无限次测定,所得无限多个数据的集合就是总体,其中每个数据就是个体,从中随机取出一组数据(例如8个数据)就是样本,样本容量为8。,2.1 几个概念(P52),设样本容量为n,则其平均值为 当测量次数无限多时,所得平均值 即为总体平均值: (21) 若没有系统误差,则总体平均值就是真实值 在分析化学中,广泛采用标准偏差来衡量数据的分散(离散)程度,总体标准偏差 当测量次数为无限多次时,各测量值对总体平均值

2、的偏离,用总体标准偏差表示: (22) 样本标准偏差 当测量值不多,总体平均值又不知道时,用样本的标准偏差s来衡量该组数据的分散程度。,当测量次数非常多时,测量次数n与自由度(n-1)的区别就很小了,此时 即 同时s 平均值的标准偏差(P58) 单次测定值的标准差S反映的是单次测定值 之间的离散性 平均值的标准差反映的是若干组平行测定,各平均值 之间的离散性,若对某试样作若干批测定,每批又作n个平行测定 则 (24) 由此可见: 平均值的精密度比单次测定的精密度更好, ;平均值的标准偏差与测定次数的平方根成反比.增加测定次数,可使平均值的标准偏差减小。 作 关系图如P59图35所示。,开始时,

3、 随 减少 很快,n5变化较慢,而当n10时,变化很小,进一步增加测定次数,徒劳无益,对提高分析结果可靠性,并无更多好处。实际中,一般的分析作35次平行测定即可,而标样、物理常数、原子量的测定则次数较多,随机误差是由一些偶然因素造成的误差,其大小、方向都不固定,难以预计,不能测量也无法消除。它的出现似乎很不规律,但实质上,它的出现和分布服从统计规律,2.2随机误差的正态分布(P53),它在概率统计中占有特别重要的地位,因为许多随机变量都服从或近似服从正态分布,分析测定中的随机误差也是这样的,P55图33即为正态分布曲线,它的数学表达式为: (25) 式中y为概率密度 x为测量值,1正态分布(高

4、斯GAUSS分布),为总体平均值,即无限次测定数据的平均值,相应于曲线最高点的横坐标值,在没有系统误差时,它即为真值 ,它反映无限个测量数据分布的集中趋势 -总体标准偏差,是到曲线两拐点之一的距离,它表征数据的分散程度,小,数据集中,曲线瘦高;大,数据分散,曲线矮胖。 X表示随机误差,若以X为横坐标,则曲线最高点横坐标为0,即为随机误差的正态分布曲线,由图可看到随机误差有以下规律性: 1)偏差大小相等、符号相反的测定值出现的概率大致相等 2)偏差小的测定值比偏差较大的测定值出现的概率大,偏差很大的测定值出现的概率极小,趋近于0 3)大多数测定值集中在的附近,所以为最可信赖值或最佳值,正态分布曲

5、线随、值不同而不同,应用起来不方便,为此,采用变量转换的方法,将其化为同一分布标准正态分布 即 令 代入(25)式得 又 所以,即将式(25)转化为只有变量的方程 (26) 因此曲线的形状与大小无关,即不同曲线皆合为一条 标准正态分布曲线见P56图34,正态分布曲线与横坐标-到之间所夹的面积代表全部数据出现概率的总和,显然应当是100,即为1 P= (27) 随机误差或测量值在某一区间出现的概率可取不同u值对式(27)进行定积分,求得面积(即为概率),并制得标准正态分布概率积分表。由于积分上下限不同,表的形式有很多种,为了区别,在表上方一般绘图说明表中所列值是什么区间的概率,表中列出的面积与图

6、中阴影部分相对应(P57表32),表示随机误差在此区间的概率,若是求 区间的概率,利用正态分布的对称性,必须乘以2,2随机误差的区间概率,从计算结果可知,95以上的测量值都会落在范围内,随机误差x-超过 的大误差(或测量值)出现的概率0.3,一般化学分析是作几次测定,所以可以认为实际上是不可能出现的,如一旦出现,可认为其不是由于随机因素引起的,应弃去。 例:P57 例7、例8、例9,对无限次测量而言,总体平均值衡量数据的集中趋势,总体标准差反映了数据的离散程度,但是,分析化学中常常只作有限次测定。下面将讨论如何通过有限次测定结果对和进行估计,从而合理地推断总体的特性,2.3 少量数据的统计处理

7、,正态分布是无限次测量数据的分布规律,而实际测定只能是有限次,其分布规律不可能完全相同。 英国的统计学家兼化学家戈塞特(W.S.GOSSET)提出了t分布规律 (28) (书P60公式329有误) 平均值的标准偏差,一有限次测量时的随机误差,总体平均值,无系统误差时就是真值,t分布曲线如图22(P60图36)所示,纵坐标仍为概率密度,横坐标为t,t分布曲线与正态分布曲线相似,只是 t分布曲线随自由度f(f= n-1)而改变,当 时, ,t分布曲线即正态分布曲线。,与正态分布曲线一样,t分布曲线下面一定范围内的面积,即是该范围内测定值出现的概率,但应注意,对于正态分布曲线,只要u值一定,相应的概

8、率也就一定;但对于t分布曲线,当t一定时,由于f不同,相应曲线所包括的面积,即概率也就不同。为此引入置信度的概念,置信度P人们对所作判断的把握程度,其实质为某事件出现的概率,在此表示某一t值时,平均值落在( )区间内的概率。落在此范围之外的概率为(1P)称为显著性水平,用表示。,不同概率P与f值所对应的t值,表示为t,f 。如 t 0.05,10 代表置信度95,自由度为10时的t值。t值表见书P61表33,概率P都是指双边值,即虽然表中所列的t值均为正值,实际上每个t值对应的概率p是指直线tt表和t t表之间所夹曲线下的面积,例如:当f3,p0.95时,t0.05,3 3.18,是指在自由度

9、f3的那条t分布曲线下,直线t3.18与直线t3.18之间所夹的面积为0.95。,理论上当f时,各置信度对应的t值才与u值一致,但实际当f20时,t与u已很接近。,多次重复测定得到一系列测定值,在报告分析结果时,要反映出数据的集中趋势和分散性,一般采用下列三项值, 是总体的最佳估计值,反映数据的集中趋势。S是 的估计值,反映数据的离散程度。测定次数n用于求自由度f,反映数据的可靠程度,二一般分析结果的统计表示法,例 测某铁矿样中Fe的含量,得:37.45,37.30,37.20,37.50,37.25,报告分析结果 解: 37.34 di(i1,2.5)分别为:+0.11 , -0.04 ,

10、0.14 ,+0.16 , -0.09 (%) 所以分析结果报告如下: 37.34 ,s0.13,n5,注意: 1)S结果保留几位,要根据 值而定, 如 =0.9987,则s可为0.0015,也可写为0.002,最多与可疑位“7”相齐。 2)如 无,则s不带,如 20.36,s可写为0.04,此时才用“”,在一定置信度上,根据 (样本)估计(总体 平均值)可能存在的区间,只有当 , ,显然做不到,少数测量得到的总带有一定的不确定性,所以只能在一定置信度上,根据 对可能存在的区间作出估计 由t分布(28)式 (29) 这表示在一定置信度下,以平均值 为中心,包括总体平均值范围,就叫平均值的置信区

11、间(P61)。,三平均值的置信区间(P61),例1:已知=35.21%,S=0.06%,n=4,求P=0.95,0.99时,平均值的置信区间 解: P0.95 , t0.05,3 3.18 理解为:在区间 中包括总体平均值的把握(概率)有95。 P0.99 t0.01,3 5.84 参 P62例10,置信度越高,t曲线下面积越大,置信区间就越大,即所估计的区间包括真值的可能性也就越大。P100,则意味着区间无限大,肯定会包括真值,这样的区间毫无意义;置信度定得太低则不能保证判断的可靠性。分析中通常将P定在95或90,(一)显著性检验 在分析工作中常遇到这样的情况,某人对标样进行分析,得到的平均

12、值( )与标准值( )不一致;或采用两种不同的分析方法分析同一试样,得到的两组测定数据的平均值 不一致;或两个不同分析人员对同一试样进行分析时,两组数据的平均值 不一致。如这种差异是由随机误差引起,则是不可避免的(正常的),可以认为差异不显著;如这种差异是由系统误差引起,则认为它们之间存在“显著性”差异,四 测定数据的评价,1平均值( )与标准值()的显著性检验t检验 为检查某一新分析方法或某操作过程是否存在系统误差,可用标样或基准物质作几次测定,然后用t检验法检验 与 之间是否存在显著性差异 将 、代入(28)式得 (210),步骤: 1)计算 2)选定P(一般取95),查 表 3) , 处

13、于以为中心的95概率区间之外,这种数据出现的机会是极少的,则 与存在显著性差异,说明有系统误差存在; ,则无显著性差异, 与的差异是由随机误差引起的,例 (P63例11)采用某种新方法测定基准明矾中Al2O3的含量,得: 10.79,S0.04,n9,已知明矾中( Al2O3 )的理论值为10.77,问该新方法是否有系统误差? 解: 1.5 t0.05,8 2.314 ,所以 与无显著性差异,2两组平均值的显著性检验F检验t检验 不同分析人员或同一分析人员采用不同方法分析同一试样所得两组数据平均值和往往是不一致的,要判断这两组数据之间是否存在系统误差(显著性差异),通常按如下步骤进行: 设两组

14、数据为 :,(1) F检验检验两组数据的精密度s1、s2 有无显著差异(s1,s2是否来自同一总体) a S2 方差 (211) 因 (方差较大,标准偏差较大)作分子,所以 1 b然后查F表(P64表34) c若 ,说明s1与s2差异不显著,进而用t检验法检验两组数据之间是否存在系统误差,即 是否有显著性差异。若 ,说明s1与s2差异显著。,2)t检验检验两组数据平均值 有无显著性差异( 是否来自同一总体) a 其中S称为合并标准偏差 S= 总自由度fn1n22 为了简化起见,有时不计算合并标准偏差S,若S1=S2,则SS1S2;若S1S2,则SS小,b然后在选定的P下,根据fn1n22,查t

15、表(t.f),若t计算t表 .则说明两组平均值有显著差异 (可认为12 ,而两组数据不属于同一总体) 例:P65例12,例13,(二)异常值(离群值)的取舍 在一组平行测定数据中,有时会出现个别离群值(异常值、可疑值)。首先,要仔细回顾和检查产生离群值的实验过程,如系过失所引起(溶液溅失,加错试剂等),此数据应弃去。否则,就要根据随机误差与分布规律决定取舍,若把有一定偏离仍属随机误差范畴的数据舍去,表面上得到了精密度较好的结果,但这是不科学的、不严肃的。确定了离群值的取舍后,才能计算该组数据的 、s以及进行其他有关数理统计处理。用统计学方法处理离群值的方法有好几种,下面着重介绍Q检验法和格鲁不斯(Grubbs)法,1. Q检验法 步骤:1) (取正值) 2)根据测定次数n和置信度P查Q值表(P68表36),若Q计算Q表,该值应弃去,否则应予保留。 3)Q检验适于测定次数n10,2.格鲁布斯(Grubbs)法 1).将测定值从小到大排列x1,x2,x3.Xn 2)计算统计量T,若x1为可疑值, ;若xn为可疑值, 对于一定的p和n(

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号