《1.2试验数据误差的估计与检验 (2)》由会员分享,可在线阅读,更多相关《1.2试验数据误差的估计与检验 (2)(49页珍藏版)》请在金锄头文库上搜索。
1、1.5试验数据误差的估计与检验检验:检验:1.计算一个值计算一个值A2.由两个值由两个值 (1)自由度)自由度df (2)给定的)给定的显著水平显著水平a=0.05查表:查表: Ba(df) 或者或者B0.5a(df)3.对比对比A值与值与B(df)值得出相关的结论)值得出相关的结论1.5试验数据误差的估计与检验1.5.1 随机误差的检验随机误差的检验1.5.1.1卡方检验,一组数据随机误差卡方检验,一组数据随机误差检验( -test) 1.5.1.2 F检验,两组数据随机误差检验,两组数据随机误差检验1.5试验数据误差的估计与检验1.5.1.1检验( -test) (1)目的:)目的:对试验
2、数据的随机误差或精密度进行检验。对试验数据的随机误差或精密度进行检验。 在试验数据的总体方差在试验数据的总体方差已知的情况下,已知的情况下,(2)检验步骤:)检验步骤:若试验数据若试验数据服从正态分布,则服从正态分布,则 计算统计量计算统计量服从自由度为服从自由度为的的分布分布1.5试验数据误差的估计与检验查临界界值 显著性水平显著性水平 一般取一般取0.01或或0.05,表示有显著差异的概率,表示有显著差异的概率n 双侧(尾)检验双侧(尾)检验(two-sided/tailed test) :检验检验 若若则判断两方差无显著差异,否则有显著差异则判断两方差无显著差异,否则有显著差异 1.5试
3、验数据误差的估计与检验1.5.1 1.5.1 随机误差的估计随机误差的估计1、适用条件:试验数据的总体方差 已知的情况其中, 为显著水平检验,卡方检验随机误差随机误差有一组试验数据x1,x2,x3服从正态分布,则统计量服从自由度为的分布,(见附录1)1.5试验数据误差的估计与检验检验方法检验方法1.双侧检验:若2.单侧检验:则该组数据的方差与原总体方差无显著差异,否则有显著差异左侧检验:若则该组数据的方差与原总体方差无显著减小,否则有显著减小右侧检验:若则该组数据的方差与原总体方差无显著增大,否则有显著增大1.5试验数据误差的估计与检验1.5试验数据误差的估计与检验例题1-5 p10已知:用某
4、分光光度计测定某样品中三价铁离子的浓度,正常情况下的测定方差为 ,修复后相同样品的测量值为0.142、0.156、0.161、0.145、0.176、0.159、0.165求:检修后仪器的稳定性是否有了显著变化解:稳定性即指随机误差的大小,可用 检验。 由已知得:依题意,查得所以,检修后仪器的稳定性有了显著变化。1.5试验数据误差的估计与检验例题1-6 p10已知:某厂进行技术改造,以减少减少酒精中甲醇的含量的波动性,原酒精中的甲醇含量的方差为 ,改造后25个样品方差求:技术改革后酒精中甲醇含量的波动性是否更小解:依题意,要检验改革后酒精中甲醇含量的波动性是否有明显减小,可用 左侧检验依题意,
5、查得 可见,技术改造后酒精中的甲醇含量的波动性有显著减少,技改效果明显。1.5试验数据误差的估计与检验2. F检验检验随机误差随机误差适用条件:两组具有正态分布的试验数据之间的精密度的比较设有两组数据都服从于正态分布,样本方差分别为则服从自由度为及的F分布见附录21.5试验数据误差的估计与检验检验方法检验方法1.双侧检验:若2.单侧检验: 则该组数据的方差与原总体方差无显著差异,否则有显著差异左侧检验:若则方差1比方差2无显著减小,否则有显著减小右侧检验:若 则方差1比方差2无显著增大,否则有显著增大1.5试验数据误差的估计与检验例1-7 用新旧两种方法测定废水中三价铁离子的含量新法:0.16
6、3,0.175,0.159、旧法:0.153,0.181,0.165,0.155、求:1)两种方法的精密度是否有显著差异 2)新方法是否比旧法的精密度有显著提高解:1)依题意,精密度指方差的大小,采用F双侧检验依题意:查表得即:两种方法的精密度无显著差异,是一致的。1.5试验数据误差的估计与检验1. t检验法系统误差,正确度系统误差,正确度适用条件:数据的算术平均值算术平均值Xp与给定值与给定值U0是否有显著差异。(1)平均值与给定值平均值与给定值的比较计算值t与查表之ta(df)则统计量:服从自由度的t分布。双侧检验:左侧检验:右侧检验:则给定值与平均值无显著差异,否则、则给定值与平均值无显
7、著减小,否则、则给定值与平均值无显著增大,否则、 1.5.2 1.5.2 系统误差的检验系统误差的检验1.5试验数据误差的估计与检验例题1-8已知:标准样品含水量7.5%,测量结果为7.6,7.8,8.5,8.3,8.7;求:1.仪器的测量结果是否存在显著的系统误差? 2.仪器的测量结果较标准值是否明显增大?解:解:1属于双侧检验,2属于右测检验由已知:由由查表得所以仪器的测量结果存在显著的系统误差所以仪器的测量结果较标准值明显增大1.5试验数据误差的估计与检验(2)两个平均值两个平均值的比较适用条件:两组试验数据的平均值的比较a.两组数据的方差无显著差异时,统计量其中:先F检验,再分为两情况
8、:1-无显著差异;2-有显著差异再进行t检验查表ta(df),之后对比t 与 ta(df)b.两组数据的方差有显著差异时,统计量1.5试验数据误差的估计与检验其中:-2查表t0.5a(df),之后对比/t/ 与 t0.5a(df),系统误差是否一致1.5试验数据误差的估计与检验例1-9已知:两种方法测量样品的含水量,测量结果分别为、求:两种方法之间是否存在系统误差解:1.判断两组数据的方差是否存在显著差异 2.进行t检验1.5试验数据误差的估计与检验(3)成对数据的比较 适用条件:适用条件:试验数据是成对出现的,除了被比较的因素之外,其他条件是相同的。采用统计量:其中或1.5试验数据误差的估计
9、与检验自由度:检验:对于给定的显著水平,不存在显著的系统误差,否则存在显著的系统误差。则,成对数据之间计算t0.5a(df), 并与 t 对比1.5.2系统误差的检验1.5试验数据误差的估计与检验2、秩和检验法适用于对试验数据的统计分布不清楚的情况 P222P222 计算计算R1R1,由,由n1n1,n2n2和和a a,查到,查到T1T1和和T2T2 ,比较R1与T、1T2的关系检验方法: 设独立测得两组的数据为: 1)将两组数据混和以后,从1开始,按从小到大的顺序重新排列,2)观察测量次数较少那一组数据的序号,它的测得值在混合后的次序编号(即秩),再将所有测得值的次序相加,得到的序号号即为秩
10、和R1。3)两组的测量次数 ,可根据测量次数较少的组的次数 n1 和测量次数较多的组的次数 n2 ,由秩和检验表(附录4)查得 T1 和 T2 ,若 则无根据怀疑两组间存在系统误差。 这里总假定1.5.2系统误差的检验2 2) 当当 ,秩和,秩和 R R1 1 近似服从正态分布近似服从正态分布 括号中第一项为数学期望,第二项为标准差,此时括号中第一项为数学期望,第二项为标准差,此时 T T1 1 和和 T T2 2 可可由正态分布算出。由正态分布算出。 1.5试验数据误差的估计与检验 例例1-11 1-11 两组数据如下,求有无系统误差两组数据如下,求有无系统误差甲:甲:8.68.6,10.0
11、10.0,9.99.9,8.88.8,9.19.1,9.19.1乙:乙:8.78.7,8.48.4,9.29.2,8.98.9,7.47.4,8.08.0,7.37.3,8.18.1,6.86.8秩 1 2 3 4 5 6 7 8 9 10 11.5 11.5 13 14 15甲 8.6 8.8 9.1 9.1 9.9 10.0乙 6.8 7.3 7.4 8.0 8.1 8.4 8.7 8.9 9.2因为因为查秩和临界表,得查秩和临界表,得T1 =33, T2 =63, R1 T2,故乙组有测定误差 1.5.3过失误误差的检验的检验1.5试验数据误差的估计与检验在一系列重复测量数据中: 可疑数
12、据:如有个别数据与其它的有明显差异,它很可能含有粗大误差 不恰当剔除含大误差的数据,会造成测量精密度偏高的假象; 混有粗大误差的数据,即异常值,未加剔除,会造成测量精密度偏低以上两种情况还都严重影响对平均值的估计因此,对数据中异常值的正确判断与处理,以获得客观的测量结果一、粗大误差产生的原因一、粗大误差产生的原因 产生粗大误差的原因是多方面的,大致可归纳为: 测量人员的主观原因 客观外界条件的原因测量者工作责任感不强、工作过于疲劳、缺乏经验操作不当,或在测量时不小心、不耐心、不仔细等,造成错误的读书或记录。测量条件意外地改变(如机械冲击、外界振动、电磁干扰等)。1.5.3 1.5.3 过失误差
13、的检验过失误差的检验二、判别粗大误差的准则二、判别粗大误差的准则 在测量过程中,确实是因读错记错数据,仪器的突然故障,或外界条件的突变等异常情况引起的异常值,一经发现,就应在记录中除去,但需注明原因。这种从技术上和物理上找出产生异常值的原因,是发现和剔除粗大误差的首要方法。有时,在测量完成后也不能确知数据中是否含有粗大误差,这时可采用统计的方法进行判别。统计法的基本思想是:给定一个显著性水平,按一定分布确定一个临界值,凡超过这个界限的误差,就认为它不属于偶然误差的范围,而是粗大误差,该数据应予以剔除。 在判别某个测得值是否含有粗大误差时,要特别慎重,应作充分的分析和研究,并根据判别准则予以确定
14、。常用的判别准则有:1.5.3过失误差的检验1.5试验数据误差的估计与检验(一)(一) 拉依达准则,不查表拉依达准则,不查表 该准则是最常用也是最简单的判别粗大误差的准则,它是以测量次数充分大为前提,但通常测量次数比较少,因此该准则只是一个近似的准则。实际测量中,常以贝塞尔公式算得 s ,以 代替真值。对某个可疑数据 ,若其残差满足: (a=0.01)或 2s(a=0.05) 则可认为该数据含有粗大误差,应予以剔除 利用贝塞尔公式容易说明:在n10n10的情形,用 准则剔除粗误差注定失败。为此,在测量次数较少时,最好不要选用 准则。下表是 准则的“弃真”概率,从表中看出 准则犯“弃真”错误的概
15、率随n的增大而减小,最后稳定于0.3%。 1.5.3过失误差的检验1.5试验数据误差的估计与检验例例 12 12 对某量进行15次等精度测量,测得值如下所列,设这些测得值已消除了系统误差,试判别该测量列中是否含有粗大误差的测得值。 测量数值:20.30,20.39,20.39,20.39,20.40,20.40,20.40,20.41,20.42,20.42,20.42,20.43,20.43,20.43,20.431.5试验数据误差的估计与检验解:由已知得其中最可疑的数据为其中最可疑的数据为20.30,因此有,因此有即它含有粗大误差,故将此测得值剔除。再根据剩下的14个测得值重新计算,得:
16、因此20.39不是坏值,不用剔除,剩下的数据没有坏值,只剔除20.30 1.5.3过失误差的检验1.5试验数据误差的估计与检验其中最可疑的数据为其中最可疑的数据为20.39,因此有,因此有(二)格拉布斯准则(二)格拉布斯准则 P223,P223,查表查表G(aG(a,n)n) 1950年格拉布斯(Grubbs)根据顺序统计量的某种分布规律提出一种判别粗大误差的准则。1974年我国有人用电子计算机做过统计模拟试验与其它几个准则相比,对样本中仅混入一个异常值的情况,用格拉布斯准则检验的功率最高。时,即判别该测得值应予剔除。这里 称为格拉布斯检验临界值。附录5对某个可疑数据 dp ,当 1.5试验数
17、据误差的估计与检验0.050.010.050.013456789101112131415161.151.461.671.821.942.032.112.182.232.282.332.372.412.441.161.491.751.942.102.222.322.412.482.552.612.662.702.75171819202122232425303540501002.482.502.532.562.582.602.622.642.662.742.812.872.963.172.782.822.852.882.912.942.962.993.013.103.183.243.343.591
18、.5试验数据误差的估计与检验例例1313 用例12测得值,试判别该测量列中的测得值是否含有粗大误差。解:由表计算得:按测得值的大小,顺序排列得仅有两测得值可怀疑,但由于故应先怀疑 是否含有粗大误差,查表应予剔除所以, 剩下的14个数据,再重复上述步骤,判别 是否含有粗大误差。1.5.3过失误差的检验1.5试验数据误差的估计与检验故可判别 不包含粗大误差,且其余测得值也不含粗大误差。 查表所以最可疑最可疑(三)狄克松准则(三)狄克松准则 (自己看) 1950年狄克松(Dixon)提出另一种无需估算 和 的方法,它是根据测量数据按大小排列后的顺序差来判别是否存在粗大误差。有人指出,用Dixon准则
19、判断样本数据中混有一个以上异常值的情形效果较好。以下介绍一种狄克松双侧检验准则。(1)单侧情形 设正态测量总体的一个样本 ,将 按大小顺序排列成顺序统计量 ,即 构造检验高端异常值 和低端异常值 的统计量 D或D ,表1-3若 ,或 则应该剔除 或 。 如附录6所示。 1.5.3过失误差的检验1.5试验数据误差的估计与检验1.5试验数据误差的估计与检验n检验高端异常值检验低端异常值37810111314301.5试验数据误差的估计与检验(2)双侧情形a.根据表1-3,计算D或D b.对于给定的显著水平 ,在附录6中查出对应的双侧临界值c.当 判断 为异常值d. 当 判断 为异常值e. 否则没有
20、异常值f. 例1-14说明:1.可疑数据应逐一检查,不能同时检验多个数据。按数据与平均值的偏差大小来检验,先检验偏差大的数据2.剔除一个数后,如果要检验下一个数据,应注意试验数据的总数发生了变化3.用不同的方法检验同一组数据,结果可能不同小结:1.大样本情况(n50)用3s准则最简单方便,虽然这种判别准则的可靠性不高,但它使用简便,不需要查表,故在要求不高时经常使用;2. 30n50情形,用格拉布斯准则效果较好;3n30情形,用格拉布斯准则适于剔除一个异常值。3.在较为精密的实验场合,可以选用二种准则同时判断,当一致认为某值应剔除或保留时,则可以放心地加以剔除或保留。当二种方法的判断结果有矛盾
21、时,则应慎重考虑,一般以不剔除为妥。因为留下某个怀疑的数据后算出的 s 只是偏大一点,这样较为安全。另外,可以再增添测量次数,以消除或减少它对平均值的影响。1.5.3过失误差的检验1.5试验数据误差的估计与检验 以上讨论了三类测量误差,它们的特点各异,因而处理的方法也有较大差别。现简单归纳如下: 随机误差具有抵偿性,这是它最本质的特性,算术均值和标准差是表示测量结果的两个主要统计量;系统误差则违背抵偿性,因而会影响算术均值,变化的系统误差还影响标准差;粗大误差则存在于个别的可疑数据中,也会影响算术均值和标准差。 随机误差服从统计规律,是无法消除的,但通过适当增加测量次数可提高测量精度;系统误差
22、则是有确定性规律,在掌握这个规律后,可以采取适当的措施消除或减小它;粗大误差既违背统计规律,又违背确定性规律,可用物理或统计的方法判断后剔除。 为处理一组测量数据,往往先找出个别可疑数据,经统计判断确认无粗大误差后,再用适当的方法检验数据中是否含有明显的系统误差,如确认已无系统误差,最后处理随机误差,统计算术平均值、标准差及极限误差,以正确的表达方式给出测量结果。 1.5.3过失误差的检验1.5试验数据误差的估计与检验1.6有效数字的运算 1.6.1 有效数字(有效数字(significance figure) 能够代表一定物理量的数字能够代表一定物理量的数字有效数字的位数可反映试验或试验仪表
23、的精度有效数字的位数可反映试验或试验仪表的精度数据中数据中小数点的位置不影响有效数字的位数小数点的位置不影响有效数字的位数例如:例如:50,0.050m,5.0104m第一个第一个非非0数前的数字都不是有效数字,而第一个非数前的数字都不是有效数字,而第一个非0数后数后的数字都是有效数字的数字都是有效数字例如:例如: 29和和29.00第一位数字等于或大于第一位数字等于或大于8,则可以多计一位,可以认为四,则可以多计一位,可以认为四位有效数字位有效数字例如:例如:9.99 二、二、数字数字运算规则运算规则 1.6有效数字的运算 (1)加、减运算:)加、减运算: 与其中与其中小数点后位数最少的相同
24、小数点后位数最少的相同(2)乘、除运算)乘、除运算 以各以各乘、除数中有效数字位数最少的为准乘、除数中有效数字位数最少的为准(3)乘方、开方运算:)乘方、开方运算: 与与其底数的相同其底数的相同: 例如:例如:2.42=5.8(4)对数运算:)对数运算: 与其与其真数的相同真数的相同 例如例如ln6.841.92;lg0.000044三、数字舍入规则三、数字舍入规则 1.6有效数字的运算 (5)在在4个以上数的平均值计算中,平均值的有效数字可增个以上数的平均值计算中,平均值的有效数字可增加一位加一位(6)所有取自手册上的数据,其有效数字位数按实际需要)所有取自手册上的数据,其有效数字位数按实际
25、需要取,但原始数据如有限制,则应服从原始数据。取,但原始数据如有限制,则应服从原始数据。(7)一些常数的有效数字的位数可以认为是无限制的)一些常数的有效数字的位数可以认为是无限制的 例如,圆周率例如,圆周率、重力加速度、重力加速度g g、1/31/3等等(8)一般在工程计算中,取)一般在工程计算中,取23位有效数字位有效数字1.6有效数字的运算 1.6.3 有效数字的修约规则有效数字的修约规则4:舍去:舍去5,且其后跟有,且其后跟有非零数字非零数字 ,进,进1位位例如:例如:3.14159 3.1425,其右,其右无数字或皆为无数字或皆为0时时,“尾留尾留双双”:若所保留的末位数字为奇数则进若
26、所保留的末位数字为奇数则进1若所保留的末位数字为偶数则舍弃若所保留的末位数字为偶数则舍弃例如:例如:3.1415 3.142双双 1.3665 1.366双双1.7 误差的传递误差的传递不推导,只结果不推导,只结果1.7.1 误差传递基本公式误差传递基本公式不推导,只结果不推导,只结果设全微分得:得用代替或误差传递公式误差传递公式直接测量误差误差传递系数1.7 误差的传递不推导,只结果不推导,只结果所以,绝对误差为:相对误差为:间接测量值或函数为:间接测量值或函数为:或函数标准误差传递公式为:1.7 误差的传递不推导,只结果不推导,只结果由于测量次数有限,一般采用:1.7.2 常用函数的误差传
27、递基本公式常用函数的误差传递基本公式函数最大绝对误差标准误差1.7 误差的传递不推导,只结果不推导,只结果1.7.3 误差传递公式的应用误差传递公式的应用例1-16 一组等精度测量值,它们的算术平均值为试推导出 标准误差的表达式。解:因为误差传递系数为: 可见,间接测量或函数的误差是各直接测量值的各项分误差之和,而分误差的大小取决于直接测量误差和误差传递系数的乘积。所以可以根据各分误差的大小,来判断间接测量或函数误差的主要来源,为提高试验质量或改变实验方法提供依据。1.7 误差的传递不推导,只结果不推导,只结果算术平均值的标准误差为:由于是等精度测量,它们的标准误差相同, 所以算术平均值的标准
28、误差为:算术平均值的绝对误差为:1.7 误差的传递只结果只结果例1-17 测量静止流体内部某处的静压强,计算公式为:测量值:求:p的最大绝对误差、最大相对误差解:各变量的绝对误差为:各变量的误差传递系数:1.7 误差的传递最大绝对误差为:又:真值为:最大相对误差:小小 结结给出数据,会求算术平均误差和对数平均误差给出数据,会求算术平均误差和对数平均误差知道样本标准差的计算知道样本标准差的计算试验数据误差的检验试验数据误差的检验 (1) 随机误差(精度)的检验随机误差(精度)的检验 一组数据:卡方检验一组数据:卡方检验 两组数据:两组数据:F检验检验 (2)系统误差检验:系统误差检验:t检验检验 平均值与与给定值平均值与与给定值 两组数据平均值两组数据平均值 两组成对数据两组成对数据 (3)秩和检验法秩和检验法小小 结结异常数据的检验和处理异常数据的检验和处理 (1)拉依达准则,不查表拉依达准则,不查表 (2)格拉布斯准则格拉布斯准则 P223,查表查表G(a,n)计算误差传递计算误差传递 计算那个压强计算的例题计算那个压强计算的例题