误差理论与数据处理 青岛大学机电工程学院,三大类误差的特征、性质以及减小各类误差对测量精度影响的措施,掌握等精度测量的数据处理方法,掌握不等精度测量的数据处理方法,重点与难点,第二章误差的基本性质与处理,当对同一测量值进行多次等精度的重复测量时,得到一系列不同的测量值(常称为测量列),每个测量值都含有误差,这些误差的出现没有确定的规律,即前一个数据出现后,不能预测下一个数据的大小和方向但就误差整体而言,却明显具有某种统计规律零部件变形及其不稳定性,信号处理电路的随机噪声等温度、湿度、气压的变化,光照强度、电磁场变化等瞄准、读数不稳定,人为操作不当等一、随机误差产生的原因,第一节随机误差,随机误差是由很多暂时未能掌握或不便掌握的微小因素构成,主要有:,测量装置方面的因素,环境方面的因素,人为方面的因素,随机误差的分布可以是正态分布,也有非正态分布,而多数随机误差都服从正态分布我们首先来分析服从正态分布的随机误差的特性二、正态分布,设被测量值的真值为,L,0,,一系列测得值为,l,i,,则测量列的随机误差,i,可表示为:,(2-1),正态分布的分布密度,f,(,),与分布函数,F,(,),为,(2-2),(2-3),式中:,标准差(或均方根误差),e,自然对数的底,基值为,2.7182,。
它的数学期望为:,(2-4),它的方差为:,(2-5),服从正态分布的随机误差都具有的四个特征:对称性、单峰性、有界性、补偿性由于多数随机误差都服从正态分布,因此正态分布在误差理论中占有十分重要的地位由式(,2-2,)可以推导出:,由,f,(,)0,,,f,(+,)=,f,(-,),,可推知分布具有对称性,即绝对值相等的正误差与负误差出现次数相等,这称为误差,对称性,;,当,=0,时有,f,max,(,)=,f,(0),,即,f,(,),f,(0),,可推知绝对值小的误差比绝对值大的误差出现的次数多,这称为误差的,单峰性,;,虽然函数,f,(,),的存在区间是,-,+,,但实际上,随机误差,只是出现在一个有限的区间内,即,-,k,+k,称为误差的,有界性,;,随着测量次数的增加,随机误差的算术平均值趋向于零,即,,这称为误差的,补偿性,其平均误差为:,(2-6),此外由可解得或然误差为:,(2-7),图,2-1,为正态分布曲线以及各精度参数在图中的坐标值为曲线上拐点,A,的横坐标,,值为曲线右半部面积重心,B,的横坐标,,值的纵坐标线则平分曲线右半部面积一,),算术平均值的意义,三、算术平均值,对某量进行一系列等精度测量时,由于存在随机误差,因此其获得的测量值不完全相同,此时应以算术平均值作为最后的测量结果。
设 为,n,次测量所得的值,则算术平均值为,:,(2-8),由前面正态分布随机误差的第四特征可知 ,因此,下面证明当测量次数无限增加,算术平均值必然趋近于真值,L,o,.,即,由此得出结论:如果能够对某一量进行无限多次测量,就可得到不受,随机误差,影响的测量值,或其影响很小,可以忽略这就是当测量次数无限增大时,算术平均值(数学上称之为最大或然值)被认为是最接近于真值的理论依据但由于实际上都是有限次测量,故只能把算术平均值近似地作为被测量的真值一般情况下,被测量的真值为未知,不可能按,式(,2-1,),求得随机误差,这时可用算术平均值代替被测量的真值进行计算此时的随机误差称为残余误差,,,简称残差:,若测量次数有限,由参数估计知,算术平均值是该测量总体期望的一个最佳的估计量,即满足无偏性、有效性、一致性,并满足最小二乘法原理;在正态分布条件下满足最大似然原理2-9),此时可用更简便算法来求算术平均值任选一个接近所有测得值的数,l,0,作为参考值,,计算每个测得值,l,i,与,l,0,的差值:,(2-10),式中的 为简单数值,很容易计算,因此按,(,2-10,),求算术平均值比较简单例,2-1】,测量某物理量,10,次,得到结果见表,2-1,,求算术平均值。
解,】,:,任选参考值,l,0,=1879.65,计算差值 和 列于表,2-1,,很容易求得算术平均值,=1879.64,二)算术平均值的计算校核,算术平均值及其残余误差的计算是否正确,可用求得的残余误差代数和来校核由,式中的是根据,(,2-8,),计算的,当求得的为未经凑整的准确数时,则有:,残余误差代数和为零,这一性质,可用来校核算术平均值及其残余误差计算的正确性但当实际得到的为经过凑整的非准确数,存在舍入误差,,即有,成立,而,经过分析证明,用残余误差代数和校核算术平均值及其残差,其规则为:,残差代数和应符合:,当,求得的为非凑整的准确数时,为零;,当,求得的为凑整的非准确数时,为正,其大小为求时的余数;,当,求得的为凑整的非准确数时,为负,其大小为求时的亏数残差代数和绝对值应符合:,当,n,为偶数时,;,当,n,为奇数时,式中的,A,为实际求得的算术平均值末位数的一个单位以上两种校核规则,可根据实际运算情况选择其一,但大多数情况选用第二种规则可能较方便,它不需要知道所有测得值之和当 为凑整的非准确数时,任一残差 小于等于 末位的半个单位,故残差代数绝对值符合上式例,2-2】,用例,2-1,数据对计算结果进行校核。
解,:因,n,为偶数,,A,0.01,,,由表,2-1,知,故计算结果正确例,2-3】,测量某直径,11,次,得到结果如表,2-2,所示,求算术平均值并进行校核解,:算术平均值为:取 ,2000.067,用第一种规则校核,则有:,用第二种规则校核,则有:,故用两种规则校核皆说明计算结果正确一)均方根误差(标准偏差),为什么用,来作为评定随机误差的尺度?可以从高斯(正态)分布的分布密度 推知:,令 ,则有:,高斯参数,h,为精密度由于,h,值无法以实验得到,故以,值代之四、测量的标准差,由于,值反映了测量值或随机误差的散布程度,因此,值可作为随机误差的评定尺度值愈大,函数 减小得越慢;,值愈小,减小得愈快,即测量到的精密度愈高,,如图,2-2,所示标准差,不是测量中任何一个具体测量值的随机误差,,的大小只说明,在一定条件下等精度测量列随机误差的概率分布情况在该条件下,任一单次测得值的随机误差,,,一般都不等于,,,但却认为这一测量列中所有测得值都属于同样一个标准差,的概率分布在不同条件下,对同一被测量进行两个系列的等精度测量,其标准差也不相同二)或然误差,测量列的或然误差,,,它将整个测量列的,n,个随机误差分为个数相等的两半。
其中一半,(,n/2,个,),随机误差的数值落在,-+,范围内,而另一半随机误差数值落在,-+,范围外,:,查 表,得到 时,,z=0.6745,,,故有,其实际意义是:若有,n,个随机误差,则有,n/2,个落在区间,-,+,之内,而另外,n/2,个随机误差则落在此区间之外三)算术平均误差,测量列算术平均误差,的定义是:该测量列全部随机误差绝对值的算术平均值,用下式表示:,由概率积分可以得到,与,的关系:,五、标准偏差的几种计算方法,目前世界各国大多趋于采用,作为评定随机误差的尺度因为,:,的平方恰好是随机变量的数字特征之一(方差),,本身又恰好是高斯误差方程,f,(,),式中的一个参数,即,s,=,,,所以采用,,正好符合概率论原理,又与最小二乘法最切合,;,对大的随机误差很敏感,能更准确地说明测量列的精度;,极限误差与标准偏差的关系简单:,im,=3,;,公式推导和计算比较简单一)等精度测量列中单次测量标准偏差的计算,1,、见塞尔,(Bessel),公式,(2-13),(2-14),式中,为算术平均值误差,将它和 代入上式,有,将上式对应相加得:,将式,(2-15),平方有:,即,(2-15),若将式,(2-14),平方后再相加得:,(2-16),(2-17),当,n,适当大时,可认为 趋近于零,并将 代入式,(2-16),得:,由于 ,代入式,(2-17),得:,即,(2-18),此式称为贝赛尔公式,2,、,别捷尔斯法,由贝赛尔公式得:,进一步得:,则平均误差有:,由式,(,2-6,),得:,故有:,(2-26),此式称为,别捷尔斯(,Peters,),公式,,它可由残余误差,v,的绝对值之和求出单次测量的标准差,,而算术平均值的标准差 为,:,(2-27),【,解,】,:计算得到的值分别填于表中,因此有,3,、极差法,用贝赛尔公式和别捷尔斯公式计算标准差均需先求算术平均值,再求残余误差,然后进行其他运算,计算过程比较复杂。
当要求简便迅速算出标准差时,可用极差法例,2-4】,用别捷尔斯法求得表,2-3,的标准差若等精度多次测量测得值 服从正态分布,在其中选取最大值 与最小值 ,则两者之差称为极差:,n,2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20,1.13 1.69 2.06 2.33 2.53 2.70 2.85 2.97 3.08 3.17 3.26 3.34 3.41 3.47 3.53 3.59 3.64 3.69 3.74,(2-28),(2-29),根据极差的分布函数,可求出极差的数学期望为,(2-30),因,故可得 的无偏估计值,若,仍以,表示,则有,式中 的数值见表,2-4,例,2-5】,仍用表,2-3,的测量数据,用极差法求得标准差解:,4,、最大误差法,在某些情况下,我们可以知道被测量的真值或满足规定精度的用来代替真值使用的量值(称为实际值或约定值),因而能够算出随机误差 ,取其中绝对值最大的一个值 ,当各个独立测量值服从正态分布时,则可求得关系式:,一般情况下,被测量的真值为未知,不能按,(,2-31,),式求标准差,应按最大残余误差 进行计算,其关系式为:,式,(,2-31,),和,(,2-32,),中两系数 、的倒数见表,2-5,。
2-31),(2-32),最大误差法简单、迅速、方便,且容易掌握,因而有广泛用途当 时,最大误差法具有一定精度例,2-6】,仍用表,2-3,的测量数据,按最大误差法求标准差,则有,,而,故标准差为,【,例,2-7】,某激光管发出的激光波长经检定为 ,由于某些原因未对此检定波长作误差分析,但后来又用更精确的方法测得激光波长 ,试求原检定波长的标准差解,:,因后测得的波长是用更精确的方法,故可认为其测得值为实际波长,(,或约定真值,),,则原检定波长的随机误差 为,:,故标准差为,:,5,、四种计算方法的优缺点,贝塞尔公式的计算精度较高,但计算麻烦,需要乘方和开方等,其计算速度难于满足快速自动化测量的需要;,别捷尔斯公式最早用于前苏联列宁格勒附近的普尔科夫天文台,它的计算速度较快,但计算精度较低,计算误差为贝氏公式的,1.07,倍;,用极差法计算,,非常迅速方便,可用来作为校对公式,当,n10,时可用来计算,,,此时计算精度高于贝氏公式;,用最大误差法计算,更为简捷,容易掌握,,当,n10,以后,的减小很慢此外,由于增加测量次数难以保证测量条件的恒定,从而引入新的误差,因此一般情况下取,n=10,以内较为适宜。
总之,提高测量精度,应采取适当精度的仪器,选取适当的测量次数所以,(2-21),评定算术平均值的精度标准,也可用或然误差,R,或平均误差,T,,,相应公式为:,若,用,残余误差表示上述公式,则有:,【,例,2-8】,用游标卡尺对某一尺寸测量,10,次,假定已消除系统误差和粗大误差,得到数据如下,(,单位为,mm),:,75.01,,,75.04,,,75.07,,,75.00,,,75.03,,,75.09,,,75.06,,,75.02,,,75.08,求算术平均值及其标准差解,:本例题中的测量数据与表,2-3,中的测量数据一样,表中的算术平均值为 因为 ,,与表中的 结果一致,故计算正确。