《ZY检验数据分析杭州区域》由会员分享,可在线阅读,更多相关《ZY检验数据分析杭州区域(31页珍藏版)》请在金锄头文库上搜索。
1、课程名称:检验数据分析课程名称:检验数据分析 课程编号:课程编号:ZY125ZY125编写区域:杭州区域编写区域:杭州区域主编人员:蒋红专主编人员:蒋红专目 录第一章:定量分析中的数据处理第一章:定量分析中的数据处理n第一节第一节 分析结果的数据处理分析结果的数据处理n第二节第二节 定量分析数据的定量分析数据的评价评价n第三节第三节 有效数字及其运算有效数字及其运算规则规则n第四节第四节 X-RX-R控制图的应用控制图的应用第一节 分析结果的数据处理n一、平均偏差一、平均偏差n二、标准偏差二、标准偏差n三、平均值的标准偏差三、平均值的标准偏差n四、四、置信度与置信区间置信度与置信区间一、一、
2、平均偏差平均偏差n平均偏差又称算术平均偏差, 用来表示一组数据的精密度。 n平均偏差:n特点:特点:简单; n缺点:缺点:大偏差得不到应有反映。二、二、 标准偏差标准偏差 标准偏差又称均方根偏差; 标准偏差的计算分两种情况:1当测定次数趋于无穷大时当测定次数趋于无穷大时 标准偏差 : 为无限多次测定 的平均值(总体平均值) 即: 当消除系统误差时,即为真值。2有限测定次数有限测定次数 标准偏差 : 相对标准偏差 :(变异系数变异系数)CV% = S / X 例题例题n用标准偏差比用平均偏差更科学更准确。 n例: 两组数据 n (1) X-X: 0.11, -0.73, 0.24, 0.51,
3、n -0.14, 0.00, 0.30, -0.21, n n=8 d1=0.28 S1=0.38 n (2) X-X:0.18,0.26,-0.25,-0.37,n 0.32 , -0.28, 0.31, -0.27n n=8 d2=0.28 S2 =0.30 d1=d2,S1 S2三、三、 平均值的标准偏差平均值的标准偏差nm个n次平行测定的平均值:n由统计学可得: 由s s n 作图:n由关系曲线,当n 大于5时, s s 变化不大,实际测定5次即可。 n 以 X s的形式表示分析结果更合理。例题例题n例:水垢中例:水垢中 Fe2O3 的百分含量测定数据为的百分含量测定数据为 (测测 6
4、次次) : 79.58%,79.45%,79.47%, 79.50%,79.62%,79.38% X = 79.50% s = 0.09% s= s/ n = 0.04%n 则真值所处的范围为(无系统误差)则真值所处的范围为(无系统误差) : 79.50% + 0.04%n 数据的可信程度多大?如何确定?数据的可信程度多大?如何确定?四、置信度与置信区间四、置信度与置信区间偶然误差的正态分布曲线:置信度与置信区间置信度与置信区间对于有限次测定,平均值 与总体平均值 关系为 :s.有限次测定的标准偏差; n.测定次数。 表1-1 t 值表 ( t. 某一置信度下的几率系数)讨论:讨论:讨论:讨论
5、:1. 置信度不变时:n 增加, t 变小,置信区间变小; 2. n不变时:置信度增加,t 变大,置信区间变大; 置信度置信度置信度置信度真值在置信区间出现的几率真值在置信区间出现的几率 ; 置信区间置信区间置信区间置信区间以平均值为中心,真值出现的范围;以平均值为中心,真值出现的范围;第二节第二节 定量分析数据的定量分析数据的评价评价一、可疑数据的取舍一、可疑数据的取舍 1Q 检验法检验法 2.2. 格鲁布斯(格鲁布斯(Grubbs)检验法检验法二、分析方法准确性的检验二、分析方法准确性的检验 1. t 检验法检验法法法 2. 检验法检验法定量分析数据的评价定量分析数据的评价 解决两类问题解
6、决两类问题:(1) 可疑数据的取舍可疑数据的取舍 过失误差的判断 方法:Q检验法; 4d法。 确定某个数据是否可用。(2) 分析方法的准确性分析方法的准确性 系统误差的判断 显著性检验显著性检验:利用统计学的方法,检验被处理的问题 是否存在 统计上的显著性差异。 方法:t 检验法和F 检验法; 确定某种方法是否可用,判断实验室测定结果准确 性。1 Q 检验法检验法步骤步骤: (1) 数据从小到大排列 X1 X2 Xn (2) 求极差 Xmax Xmin (3) 求可疑数据与相邻数据之差 X?-X 式中X?-可疑值 X-与X?相邻之值 (4) 计算:Q值= X?-X /( Xmax Xmin)一
7、、可疑数据的取舍一、可疑数据的取舍 过失误差的判断过失误差的判断(5) 根据测定次数和要求的置信度,(如90%)查表: 表1-2 不同置信度下,舍弃可疑数据的Q值表 测定次数测定次数 Q90 Q95 Q99 3 0.94 0.98 0.99 4 0.76 0.85 0.93 8 0.47 0.54 0.63(6)将Q与QX (如 Q90 )相比, 若Q QX 舍弃该数据, 若Q QX 保留该数据, 当数据较少时 舍去一个后,应补加一个数据。2 4d法法 4d法即法即4倍于平均偏差法,适用于倍于平均偏差法,适用于4-6个平行数据的取舍。个平行数据的取舍。基本步骤:基本步骤:(1)除了可疑值外,将
8、其余数据相加求算术平均值X及平均偏差d(2)将可疑值与平均值X相减, 若可疑值-X4d,则可疑值应舍去; 若可疑值-X4d,则可疑值应保留例:测得如下一组数据,30.18,30.56,30.23,30.35,30.32其中最大值是否舍去?解:30.56为最大值,定为可疑值。则 X=(30.18+30.23+30.35+30.32)/4=30.27 d=(0.09+0.04+0.08+0.05)/4=0.065因 30.56-30.27=0.29 0.29 4d故 30.56值应舍去。 当选用新的化验方法进行定量测定时,必须事先考察该方法是否存在系统当选用新的化验方法进行定量测定时,必须事先考察
9、该方法是否存在系统误差。只有确认其法没有系统误差或者系统误差能被校正才能采用,才误差。只有确认其法没有系统误差或者系统误差能被校正才能采用,才可信任用该法得到的数据。通常采用下列两种方法对化验方法可靠性进可信任用该法得到的数据。通常采用下列两种方法对化验方法可靠性进行检验。行检验。 1. t 检验法检验法 t检验法又称标准物质法。将包含有被测组分和试样的基体相似的标准物质(样品),用测定试样所选用的分析方法进行n次测定,计算出标准物质(样品)中所含被测组分的算术平均值及标准偏差,然后将此算术平均值与标准物质所给出的该组分的含量比较。步骤: a.计算t值 b. 查t值表 据自由度(f)=n-1,
10、置信度P,查表,以t表表示之 c.比较t计算与t表值 若 t计算 t表,则x与 有显著差异,该法不能直接采用。二、分析方法准确性的检验二、分析方法准确性的检验 -系统误差的判断系统误差的判断2.F检验法F检验法是将同一欲测试样用标准方法(或可靠的经典的分析方法)和 所选用的新分析方法,分别进行多次测定。标准方法测得的为平均值x1,标准偏差s1及测定次数n1。所选用的新方法测得的为平均值x2,标准偏差s2及测定次数n2。 先用F检验法检验两法测定值或两组数值间的精密度有无显著性差异。如精密度无显著性差异,则再继续用t检验法检验x1 与x2也无显著性差异,则说明新分析方法可以采用,两组数值相近。步
11、骤: a.计算F值 式中S大、S小为S1与S2比较而得,S值较大的作为S大,与S大相应的那组数据的(n-1) 定为f大, S值较小的作为S小,与S小相应的那组数据的(n-1)定为f小。 b.依据f大与f小,从F表查F值,得到F表值 c.比较F计算和F表。若F计算F表,则两组测定值S1与S2差异不显著,可继续进行t检验;反之,则S1与S2差异显著,说明新的方法不能直接采用,不必往下检验。 d .继续t检验的具体步骤: (1)计算t值, (2)依据)依据f=n1+n2-2与置信度与置信度P,查,查t值表,得到值表,得到t表表(3)若)若t计算计算t表表,即,即X1与与X2无显无显著差异著差异95%
12、置信度的F值f大12345f小1161.4199.5215.7224.6230.2218.511919.1619.2519.3310.139.559.289.129.0147.716.946.596.396.2656.615.795.415.195.05置信系数t值自由度f=n-1置信度P自由度f=n-1置信度P90%时的t值95%时的t值99%时的t值90%时的t值95%时的t值99%时的t值16.3112.7163.6691.832.263.2522.924.39.92101.812.233.1732.353.185.84201.722.092.8442.132.784.6301.72.0
13、42.7552.012.574.03601.6722.6661.942.453.711201.661.982.6271.92.363.51.641.962.5881.862.313.35一、有效数字一、有效数字二、有效数字运算规则二、有效数字运算规则第三节第三节 有效数字及其运算有效数字及其运算规则规则一、 有效数字1.有效数字的使用 有效数字是指实际上能测量到的数字,通常包括全部准确数字和一位不确定的可以数字。有效数字保留的位数与测量方法和仪器的准确度有关。使用有效数字,应注意以下几点。(1)记录测量所得数据时,应当、也只允许保留一位可以数字,即不允许增加位数,与不应减少位数。例如,化验中称
14、量质量和测量体积,获得如下数字,其意义是有所不同的。 12.5000g,是六位有效数字,这不仅表明试样的质量为12.5000g,还表示称量误差在0.0001g,是用分析天平称量的。如将其质量记录成12.50g,则表示该试样是在台称上称量的,其称量误差为 0.01g。 (2)有效数字的位数还反映了测量的相对误差。如称量某试剂的质量为0.5180 g,标示该试剂质量是(0.5180 0.0001 )g,其相对误差为:RE%= (0.0001)*100%/0.5180 0.02%(3)有效数字位数与量的使用单位无关。如称得某物的质量是12 g,两位有效数字。 若以mg为单位时,应记为1.2*104
15、mg,而不应该记为12000 mg。(4)数据中的“0”要作具体分析。数字中间的“0”,如2005中“00”都是有效数字。数字前边的“0”,如0.012kg,其中“0.0”都不是有效数字,它们只起定位作用。数字后边的“0”,尤其是小数点后的“0”,如2.50中“0”是有效数字,即2.50是三位有效数字。(5)计算有效数字的的位数时,若第一位数字等于或大于8时,其有效数字应多算一位。(6)简单的计数、分数倍数,属于准确数或自然数,其有效位数是无限的(7)分析化学中常遇到的pH,pK等,其有效数字的位数仅取决于小数部分的位数,其整数部分只说明原数值的方次。2.有效数字的修约 四舍六入五成双,即当尾
16、数4时,舍去;尾数6时,进位;当尾数为5时,则应试保留的末尾数是奇数还是偶数,5前为偶数应将5舍去, 5前为奇数则将5进位。二、二、有效数字运算规则有效数字运算规则1.加减运算 加减运算时,应以参加运算的各数据中绝对误差最大(即小数点后位数最少)的数据为标准,决定结果(和或差)的有效位数。例:12.35+0.0056+7.8903=?解:绝对误差最大的是12.35。应以它为依据先修约,再计算。 12.35+0.01+7.89=20.25为稳妥起见,也可在修约时多保留一位,算完后再修约一次。 12.35+0.006+7.890=20.24620.25 2.乘除运算 乘除运算中,应以参加运算的各数
17、据中相对误差最大(即有效数字位数最少)的数据为标准,决定结果(积或商)的有效位数。中间算式中可多保留一位。遇到首位数为8或9时,可多算一位有效数字。例1:求0.0121*25.64*1.05782=?解:各数的相对误差分别为: 0.0121数的相对误差=1/121*100% 25.64数的相对误差=1/2564*100% 1.05782数的相对误差=1/105782*100%即0.0121数的相对误差最大,有效数字位数最少,应以它为标准先进行修约,再计算:0.0121*25.6*1.06=0.328或先多保留一位有效数字,算完后再修约一次。 0.0121*25.64*1.058=0.3282,
18、修约为0.328例2:酸价检测,称油样4.522克,用0.01025mol/LKOH标液滴定时,消耗标液5.25毫升,直接代入计算公式如下: 酸价(mgKOH/g)=5.25*0.01025*56.11/4.522=0.668 0.67如以5.25为标准先进行修约,再计算: 酸价(mgKOH/g)=5.25*0.0102*56.1/4.52=0.665 0.66第四节 X-R控制图的应用1.X-R控制图 对于计量数据而言,这是最常用最基本的控制图。它用于控制对象为长度、重量、强度、纯度、时间、收率和生产量等计量值的场合。 X控制图主要用于观察正态分布的均值的变化,R控制图用于观察正态分布的分散
19、或变异情况的变化,而X-R控制图将两者联合运用,用于观察正态分布的变化。2.举例分析n选取我司某家面粉供应商近阶段吸水率进货检验数据,分析厂家面粉生产的过程能力。n数据如下:序号吸水率5 xijj=1i=1,25RiXi1Xi2Xi3Xi4Xi5161.5 61.8 62.0 61.9 62.0 309.2 61.8 0.5261.6 61.7 62.0 62.9 61.5 309.7 61.9 1.4362.0 61.7 61.1 61.7 61.2 307.7 61.5 0.9460.9 61.5 61.7 61.5 61.8 307.4 61.5 0.9562.0 62.2 62.0 6
20、2.0 61.7 309.9 62.0 0.5661.5 61.0 62.0 62.6 62.8 309.9 62.0 1.8762.2 62.0 61.2 61.7 61.7 308.8 61.8 1861.7 61.7 61.8 61.4 60.5 307.1 61.4 1.3960.961.561.860.861306.0 61.2 1106161.2616160.6304.8 61.0 0.61160.861.26161.660.5305.1 61.0 1.11261.76161.761.761.6307.7 61.5 0.71361.361.161.560.760.8305.4 61
21、.1 0.81460.860.861.26161304.8 61.0 0.4156261.761.66161.6307.9 61.6 11660.861.560.8 60.8 61.5 305.4 61.1 0.71761.0 61.2 61.2 60.5 60.9 304.8 61.0 0.71860.9 61.2 61.5 60.7 61.2 305.5 61.1 0.81961.7 62.0 62.0 62.0 62.0 309.7 61.9 0.32061.6 62.2 62.262.261.6 309.8 62.0 0.62161.4 61.3 61.6 63.0 62.0 309.
22、3 61.9 1.72262.0 61.6 62.6 61.8 61.5 309.5 61.9 1.12362.0 61.8 62.0 61.9 62.2 309.9 62.0 0.42461.8 61.8 61.8 60.2 61.5 307.1 61.4 1.62561.8 61.3 61.7 61.5 62.0 308.3 61.7 0.7Xi以X-R控制图为例,分析厂家的过程能力。n步骤1:取预备数据,然后将数据合理分成25个子组,见上表n步骤2:计算各组样本的平均数Xin步骤3:计算各组样本的极差Rin步骤4:计算样本总均值X与平均样本极差R Xi=1538.1 R=22.5 X=6
23、1.5256 R=0.9n步骤5:计算R图的参数 当子组大小n=5,D4=2.114,D3=0,代入R图的公式,得到: UCLR=D4R=2.114*0.9=1.9026 CLR=R=0.9 LCLR=D3R=- 画R图:见R图判稳。故接着再建立X图。由于n=5,查表知A2=0.577,再将 X=61.5256 R=0.9代入X图: UCLX=X+A2R=61.5256+0.577*0.9=62.0449 CLX=X=61.5256 LCLX=X-A2R=61.5256-0.577*0.9=61.0063画X图:此时过程的变异度与均值均处于稳态。步骤6:与规范进行比较 对于给定的质量规范TL=
24、60.0,TU=66.0,利用R和X计算Cp =R/d2=0.9/2.326=0.38693 Cp=(TU-TL)/6=(66.0-60.0)/(6*0.39)=2.5641 由于X=61.5256与容差中心M=63.0不重合,所以需要计算Cpk K=(M-)/(T/2)=2(63-61.5256)/(66.0-60.0) =0.4914670.49 Cpk=(1-k)*Cp=(1-0.491467)*2.5641=1.30393结论:无偏移情况的Cp表示过程加工的一致性,即“质量能力”,Cp越大,则质量能力越强;有偏移情况的Cpk反映过程中心与公差中心M的偏移情况,Cpk越大,则两者偏离越小
25、,是过程的“质量能力”与“管理能力”两者综合的结果。故Cp与Cpk两者的着重点不同,需要同时加以考虑。联合应用联合应用CpCp与与CpkCpk所代表的合格品率所代表的合格品率Cp0.330.6711.331.672Cpk0.33 68.269%84.000%84.134%84.134%84.13447%84.13447%0.67 95.450%97.722%97.725%97.72499%97.72499%1.00 99.730%99.865%99.86501%99.86501%1.33 99.994%99.99683%99.99683%1.67 99.99994%99.99997%2.00 99.9999998%查上表,我们可以得出此家面粉厂的统计过程状态满足设计的、工艺的和顾客的要求。步骤7:以上步骤1-步骤6为分析用控制图,延长统计过程状态下的X-R 图的控制限,进入控制用控制图阶段,实现对面粉厂生产过程的日常控制,从而稳定我司制造的软水添加量,生产出更好口感的面饼。