{行业分析报告}分析结果的数据处理实务

上传人:精****库 文档编号:141062213 上传时间:2020-08-04 格式:PPTX 页数:35 大小:336.50KB
返回 下载 相关 举报
{行业分析报告}分析结果的数据处理实务_第1页
第1页 / 共35页
{行业分析报告}分析结果的数据处理实务_第2页
第2页 / 共35页
{行业分析报告}分析结果的数据处理实务_第3页
第3页 / 共35页
{行业分析报告}分析结果的数据处理实务_第4页
第4页 / 共35页
{行业分析报告}分析结果的数据处理实务_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《{行业分析报告}分析结果的数据处理实务》由会员分享,可在线阅读,更多相关《{行业分析报告}分析结果的数据处理实务(35页珍藏版)》请在金锄头文库上搜索。

1、2-2 分析结果的数据处理,一、置信度与置信区间 二、可疑数据的取舍 三、平均值与标准值的比较 四、两组平均值的比较,如何用测量值来估计真实值?,一、置信度与置信区间,若用单次测量值x来估计真实值 真值被包括在x1内的可能性p=68.3%, 同理 真值被包括在x2内的可能性p=95.5 %, 真值被包括在x3内的可能性p=99.7%。,真值被包括的区间可表示为: = x 叫单次测量结果的置信区间,p叫置信度。,若用平均值 估计真值,叫平均值的置信区间。,p=68.3%,p=95.5%,p=99.7%,其中,由 可见,平均值的置信区间比单次测量结果的置信区间要小,亦即用平均值估计真值的准确度比单

2、次测量值更高,即平均值更接近于真值。,有限次测量结果平均值的置信区间为: 其中, t置信因子,是试验次数n、置信度p的函数。由p14表2-2可以查到 。,p15.例3:测定SiO2的百分含量,得到下列数据:28.62、28.59、28.51、28.42、28.52、28.63。求平均值、标准偏差、置信度分别为90%和95%时平均值的置信区间。 解:,p15 例4 测定钢中含铬量时,先测定两次,得到1.12%和1.15%;以后又补测了三次为1.11%、1.16%和1.12%。试分别按两次和按五次测定的数据计算平均值的置信区间(p=95%)。 解:两次测定时,通过给出的这两条例题 ,可得到如下结论

3、: 测定次数一定时,置信度越高,则t 越大,置信区间越宽。 置信度和精密度一定时,测定次数越多, 越小,置信区间越窄,结果较可靠。,测定铁矿中 Fe 的百分含量, 求得置信度为 95时平均值的置信区间为35.210.10。对此表达式的正确理解是,真值不是随机变量。所以,不能用出现概率来描述。,(A) 在已测定的数据中有95的数据在此区间内 (B) 若再作测定,则数据有95将落入此区间内 (C) 真值在此区间出现的概率为95 (D) 用此区间估计真值的把握有95,二、可疑数据的取舍,22.38, 22.39,22.36,22.40,22.44 这组测量数据中22.44精密度较差,而又没有什么明确

4、理由舍弃它时,怎么办?,例1,以90%的置信度,用Q检验法检验下列数据中22.44是否参加平均值的计算。 22.38, 22.39,22.36,22.40,22.44,1. Q 检验法,将数据从小到大排序: 22.36,22.38, 22.39,22.40,22.44 求极差 ; xnx1 = 22.44-22.36=0.08 求可疑值的邻差( 或 ); xnxn-1=22.44-22.40=0.04 求Q值: 或 ; 将Q值与p18表2-4给出的Q表进行比较。 n=5,Q0.90=0.640.5,则22.44给予保留参加平均。,如果 Q Q表则舍弃可疑值 Q Q表则补12个实验数据后再检验,

5、2. Grubbs法,例2 测定某药物中Co的质量分数(10-6)得到结果如下:1.25,1.27,1.31,1.40。用Grubbs法判断1.4010-6这个数据是否保留。,查p17值表2-3G(p,n ) ,置信度选95,n=4,G表=1.46,G计算G表,故14010-6应保留。,解:用Grubbs法, =1.3110-6,s = O.06610-6,用Q值检验法:可疑值为xn。,查表2-4,置信度选90,n=4,Q表=0.76,Q计算Q表,故14010-6应保留。 Grubbs法和Q值检验法的结果一致。,注意: 1.如果一系列数据中需要检验若干个可疑值,则每次首先检验邻差较大的那个数据

6、。,例如:8.32,8.38,8.44,8.45,8.52,8.69。,因为8.69与8.52的差0.17是所有数据邻差中最大的,所以首先应当检验8.69,然后有必要时,再检验剩下的数据。,2. 从三次测量结果中舍弃一个“离群值” 是不可取的。因为这样做表面上精密度提高了,但实际上会增大了置信区间的宽度。,为什么?,参看p19二四段,n值变小, t 值增大,通过 t 检验能够判断分析方法是否有系统误差。,三、平均值与标准值的比较(系统误差的检验),1. 用某种方法测量标准值为的基准物质或标准试样n次,求平均值 。,2. 计算 t 值,3. 将 t计算 值与表2-2中的 t 值比较 若t 计算

7、t 表,则该测量方法有系统误差; 若t 计算 t 表,则该方法的测量差异主要是随机误差所致。,p19例2,一种新方法用来测定试样含铜量,用含量为11.7 mgkg的标准试样,进行五次测定,所得数据为10.9,11.8,10.9,10.3,10.0。判断该方法是否可行? (是否存在系统误差),解:计算平均值 ,标准偏差 s =0.7,查表2-2 t (0.95,n=5)=2.78,因此,t 计算 t 表,说明该方法存在系统误差,结果偏低。,四、两个平均值的比较,在分析化学实验中往往要通过比较 两种分析方法; 两个实验室; 两个不同操作者; 的试验结果之间是否有显著性差异,来确定他们之间的差异是系

8、统原因造成,还是随机原因造成的。,在两组数据的精密度没有显著差别的情况下,可以用 t 检验法比较这两组数据的平均值,给出上述问题作出回答 。,下面通过 p20 例3 来介绍这种检验方法,某人用两种方法对同一试样进行测定,结果如下: 方法1:1.26 1.25 1.22 方法2:1.35 1.31 1.33 1.34 问这两种方法间有无显著性差异?,解: n甲=3 =1.24 s甲=0.021 n乙=4 =1.33 s乙=0.017,先用 F 检验 比较两种方法的精密度:,续例 3,因为 f =n-1,查表2-5得 F表=9.55,大于F计算=1.53,表明两组数据的 s 没有显著差异。所以能合

9、并它们,查表2-2,因为 f =7-2=5,置信度95%时,t表=2.57,小于上述计算值5.90。表明两种方法有显著差异。,续例 3,这两种方法所能允许的最大随机差别为:,而实际上两者的平均值相差达到0.09,所以,至少有0.05是由于系统的差别引起的。,2-3 误差的传递,分析结果的误差是由各步测量值的误差,在运算时通过某种传递方式而形成的。系统误差和偶然误差的传递规律是不一样的下面分别加以讨论。,一、系统误差的传递规律, 对于加、减运算: 测量值A、B、C的误差对分析结果R 的影响为: , 如果误差为有限量,则: , 极端情况下,有: 若A B和C,则RA,即计算结果的绝对误差取决于 绝

10、对误差最大的A。,对于乘、除运算: 测量值A、B、C的误差对分析结果R 的影响为: 如果误差为有限量,则: 极端情况下,有: 若 ,则 ,即计算结果的相对误差由相对误差最大的 决定 。,二、随机误差的传递规律, 在加、减运算中,由此可见,在加减运算中分析结果的方差,取决于测量值中方差最大者。,在乘、除运算中,由此可见,在乘除运算中分析结果的相对标准偏差的平方取决于参加运算的测量值中相对标准偏差的平方最大者。,2-4 有效数字及其运算规则,一、有效数字的概念 有效数字 通过实验仪器所能测量到的数字。 例如:滴定管的体积读数20.52mL; 分析天平称出的质量读数0.5180g; 分光光度计的吸光

11、度读数0.235等等。 有效数字与其他数字的区别 不仅表示数值的大小,还表示所用仪器的精度。,例如,用分析天平称某物体的质量,应读准到小数点后第四位: 正确 不正确 记录数据 0.5180g 0.518g 绝对误差 0.0001g 0.001g 相对误差 0.02% 0.2%,实验数据的表示应当注意: 在实验数据的所有有效数字中,只允许最后一位是可疑值。 数据中的“0”是否为有效数字,取决于它所起的作用。起定位作用的“0”不是有效数字,与测定精度有关的“0”均是有效数字。,只起定位作用,0.5180g=518.0mg=518000 g =5.180105g,在用有效数字表示大于1的整数时,应采

12、用科学记数法。,25.00mL,25mL,0.02500L,2.50010-2L,例:下列数据各包含几位有效数字 0.0376 1.2067 0.2180 0.0040 1.810 -5 0.005 2.0103 1000 10.98%,3位,5位,4位,4位,2位,2位,1位,2位,含糊,因测量误差的存在,所以实验数据的最后一位是可疑数字,而用它进行运算的结果也只能保留一位可疑数字。,二、有效数字的运算规则,1.加减运算 运算结果的绝对误差,应当与参加运算数据中绝对误差最大者一致。,26.71,R=0.0001+0.01+0.000010.01,0.0121+25.64+1.05782=26

13、.70992,0.0325 RE%=0.3,5.103 RE%=0.02 , 60.06 RE%=0.02,139.8 RE%=0.07。,2.乘除运算 运算结果的有效数字位数,应当与参加运算数据中相对误差最大者一致。,0.0712503630.3%=0.0002,0.0713,化学计量系数、得失电子数、质子转移数、倍数等的有效数字位数应视为足够多。 第一位数字大于等于8的数据,其有效数字的位数可比该数据的实际位数多算一位,例如,8.33可以当作4位有效数字处理。 计算的中间结果可多保留一位有效数字,最终结果则应按四舍五入规则舍弃其他多余的可疑值,只保留一位可疑值。 在全分析中应采用“四舍六入

14、五成双”的规则对数据进行修约。,3.取舍有效数字应注意,涉及到平衡常数的计算,其结果的有效数字一般保留两位。 对数和pH值的有效数字是小数点后的部分,小数点前的部分起定位作用,不是有效数字。 误差和偏差最多用两位有效数字表示。 常量组分分析中,含量10%的结果用四位有效数字表示;含量在110%的用三位有效数字表示;微量组分分析通常用两到三位有效数字表示分析结果。,从上述计算可知:,例如:HAc-NaAc浓度均为0.100mol/L时溶液的pH值。, 涉及平衡常数的计算,结果一般取两位有效数字。, 对数的有效数字是小数点后的数字。,例题p26 10(1),计算 2.1870.854 + 9.61

15、0-50.03260.00814 原式1.8677+ 9.610-5 0.0002654 =1.867831 1.868 计算,例:把下列数据以“四舍六入五成双”的方法修约为2位有效数字: 3.3486 2.6502 3.050 6.36 0.73500 7.5499 1.25000 1.25001,3.3,2.7,3.0,6.4,0.74,7.5,1.2,1.3,四舍六入五成双,尾数大于5的数进位,尾数小于5的数舍弃。 尾数等于5的数,若前一位数是偶数或0,则5应舍弃;前一位数是奇数,则5应进位。,0.365510.366,0.365340.365,2-5 一元回归分析,我们在实验中常常会遇

16、到两组数之间存在直线关系的情况。如果用作图法表示这组数间的关系,n个人就有可能给出n条斜率和截距各不相同的直线。,为实验点, 为线上点。,1.最小二乘法原理,最小二乘法是拟合实验数据的常用方法。它处理线性实验数据的中心思想是:选择恰当的斜率b和截距a,使确立的直线方程与所有实验点 yi 间的“差方和”最小。即,2. 相关系数 r,实验数据的线性相关程度,用相关系数 r 来定量描述。,当r =1,两变量间完全线性相关; 当r = 0 ,两变量间无线性相关关系; 当0|r| 1 ,两变量间有一定线性相关性,这时 r 只有大于p26表2-6中的临界值,相关性才显著。,sx和sy分别是x 和y的标准偏差,p26例,p26表2-6,p

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号