第二章、误差和分析 数据处理(2)第四节 分析数据的统计处理一、偶然误差的正态分布 二、偶然误差的区间概率 三、差别检验及离群值的取舍频数分布:设测定某样品60次,因 有偶然误差存在,故分析结果有高 有低,有两头小、中间大的变化趋 势,即在平均值附近的数据出现机 会最多测量次数趋近于无穷大时的频率分布?频率分布曲线下的面积具有什么意义?与测量次数少时的频率分布有何不同?正态分布的概率密度函数式1.x 表示测量值,y 为测量值出现的概率密度 2.正态分布的两个重要参数 (1)μ为无限次测量的总体均值,表示无限个数据的集中趋势 (2)σ是总体标准差,表示数据的离散程度 3.x -μ为偶然误差正态分布曲线:以x(-μ)~y作图 特征:单峰性、对称性、有界性、预测性标准正态分布曲线:以u ~y作图 区间概率:正态分布曲线与横坐标-∞到+∞之 间所夹的面积,代表所有数据出现概 率的和,其值应为1,即概率P为:有限数据的统计处理和 t 分布正态分布与正态分布与 t t 分布异同分布异同1. 正态分布——描述无限次测量数据t t 分布——描述有限次测量数据2.两者所包含面积均是一定范围内测量值出现的概率 正态分布:P 随u 变化;u 一定, P 一定 t 分布: P 随 t 和f 变化;t 一定,概率P与 f 有关 两个重要概念Ø置信度(置信水平)P :某一 t 值时,测量值出现在某范围内的概率 Ø显著性水平α:落在此范围之外的概率,自由度 f =(n-1)显著水平 0.500.100.050.01 11.006.3112.7163.66 20.822.924.309.93 30.762.353.185.84 40.742.132.784.60 50.732.022.574.03 60.721.942.453.71 70.711.902.373.50 80.711.862.313.36 90.701.832.263.25 100.701.812.233.17 200.691.732.092.85 0.671.651.962.58平均值的置信区间 1)一定置信度下,以测量结果为中心,包括总体均值的可信范围2)由少量测定结果均值估计μ的置信区间 例:如何理解如何理解例:对某未知试样中Cl-的百分含量进行测定,4次结果为47.64%,47.69%,47.52%,47.55%,计算置信度90%,95%和99%时的均值 μ 的置信区间?解:Ø结论: 1)置信区间——反映估计的精密度置信度——说明估计的把握程度2)置信度越高,估计区间包含真值的可能性越大,置信度一般95%即可;3)在一定的置信度下,置信区间越小说明测量数据越精密。
差别检验差别检验(一)方差检验—— F 检验法 (二)总体均值的检验—— t 检验法 (一)(一) F F 检验法检验法————检验偶然误差检验偶然误差ØF 的定义:两组数据方差的比值(精密度显著性检验) 例:采用不同方法分析某种试样,用第一种方法测定11次,得标准偏差s1=0.21%;第二种方法测定9次得到标准偏差s2=0.60%试判断两方法的精密度间是否存在显著差异?(P=90%)解:解:(二)(二) t t 检验法检验法————检验系统误差检验系统误差1.平均值与标准值比较——已知真值的 t 检验(准确度显著性检验)例:采用某种新方法测定基准明矾中铝的百分含量,得到以下九个分析结果,10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%问新方法是否可靠?(已知含量标准值10.77%,P=95%)解解 ::2.两组样本平均值的比较——未知真值的 t 检验(系统误差显著性检验) 例:用两种方法测定合金中铝的质量分数,所得结果如下:第一法 1.26% 1.25% 1.22%第二法 1.35% 1.31% 1.33%试问两种方法之间是否有显著性差异(置信度90%)?解 n1=3, x1=1.24% s1=0.021%n2=4, x2=1.33% s2=0.017%→当P=0.90,f=n1+n2-2=5时,t0·10,5=2.02。
t> t0·10,5,故两种分析方法之间存在显著性差异.异常值的检验——Q检验法 检验过程:设一组数据,从小到大排列为:x1,x2,……,xn-1,xnx1、xn为异常值,则Q为:式中分子为异常值与其相邻的一个数值的差值,分母为整组数据的极差Q值越大,说明xn离群越远Q称为“舍弃商”当Q计算>Q表时,异常值应舍去,否则应予保留异常值的检验——G检验检验过程: 例:测定某药物中钴的含量,得结果如 下:1.25,1.27,1.31,1.40μg/g, 试问 1.40这个数据是否应该保留?解解 ::小结小结: :1. 比较:F 检验——检验方法的偶然误差t 检验——检验方法的系统误差G 检验——异常值的取舍 2. 检验顺序:G检验 → F 检验 → t检验例:用两种方法测定合金中铌的百分含量第一法 1.26% 1.25% 1.22%第二法 1.35% 1.31% 1.33% 1.34% (1.52%)试问两种方法是否存在显著性差异(置信度90%)?解解: :标准曲线及线性回归(自学)No.标样浓度 g / L吸收 值 15.000.045 210.00.093 320.00.140430.00.175 540.00.236 6试样0.2001、每个测量值都有误差,标准曲线应怎样作才合理?2、应怎样估计线性的好坏?根据最小二乘法的原理:最佳的回归线 应是各观测值yi 与相对应的落在回归线 上的值之差的平方和(Q)为最小。
yiyx其中:设一元回归方程为:y=ax+b相关系数 Correlation coefficient应怎样估计线性的好坏?可用相关系数 来检验相关系数的定义为:相关系数的意义 1.当所有的 yi 值都在回归线上时,R = 1yxR = 1xyR = -1 2.当 y 与 x 之间不存在直线关系时, R = 0xyR = 0作业:1.P33 11、12。