《测试数据处理.》由会员分享,可在线阅读,更多相关《测试数据处理.(33页珍藏版)》请在金锄头文库上搜索。
1、 测试数据处理测试数据处理1.1 1.1 经典理论回顾经典理论回顾测不准的概念与数学期望测不准的概念与数学期望测试结果的置信概率测试结果的置信概率测试不确定度的表征测试不确定度的表征1.2 1.2 测量信息论测量信息论熵熵信息熵信息熵最大熵估计最大熵估计贝叶斯算法贝叶斯算法1.3 1.3 测量过程的统计控制测量过程的统计控制1.4 1.4 校准方法学校准方法学1.1 1.1 经典理论回顾经典理论回顾信息技术信息技术 信息的采集信息的采集- -处理处理- -传输传输- -利用利用测试技术是科学研究中信息的获取、处理和显示的重要测试技术是科学研究中信息的获取、处理和显示的重要手段手段, ,是人们认
2、识客观世界取得定性或定量信息的基本方是人们认识客观世界取得定性或定量信息的基本方法法. .测试的经典理论是以大样本量为基础的概率统计方法测试的经典理论是以大样本量为基础的概率统计方法; ;1.1 1.1 经典理论回顾经典理论回顾 测试的本质就是人类与客观物理世界的相互作用测试的本质就是人类与客观物理世界的相互作用, ,它提它提供一种物理世界定量的供一种物理世界定量的可重复可重复和和可信赖可信赖的方法;的方法; 测试是测试是认识认识客观物理世界的客观物理世界的过程过程;从本质上来说;从本质上来说, ,测试测试就是将未知量与一个假定已知量进行就是将未知量与一个假定已知量进行比较的过程比较的过程.
3、.已知量已知量常常就是我们常说的标准;常常就是我们常说的标准; 测试仪器就是测试仪器就是简化测试过程的设备简化测试过程的设备. .1.1 1.1 经典理论回顾经典理论回顾 比较比较测试就是将未知量与一个假定已知量进行测试就是将未知量与一个假定已知量进行比较的过程比较的过程. .注意,图中的质量标准是一个形状规则的物体,而未知量则是不规则的。注意,图中的质量标准是一个形状规则的物体,而未知量则是不规则的。电子科大电子科大CATCAT室室测不准的概念与数学期望测不准的概念与数学期望在任何测试过程中,都不可避免地会产生测试误差。测试误差就是在任何测试过程中,都不可避免地会产生测试误差。测试误差就是真
4、值与测试值之差。真值与测试值之差。测量信息论测量信息论就是分析和处理测试误差的理论就是分析和处理测试误差的理论和方法。和方法。 测量误差测量误差= =真值真值- -测量值测量值 ? 客观世界的物理真值是永远得不到的客观世界的物理真值是永远得不到的! !测不准理论测不准理论! !它只能是测量值的无限近似它只能是测量值的无限近似! !只能是只能是数学期望数学期望! !无解方程,不确定性,无解方程,不确定性,信息熵信息熵!以此为出发点以此为出发点, ,推动了测试科学的发展推动了测试科学的发展! !信息测试的误差来源信息测试的误差来源测试误差的来源是多种多样的。按测试误差的性测试误差的来源是多种多样的
5、。按测试误差的性质和特点可分为:质和特点可分为:系统误差系统误差随机误差随机误差操作误差操作误差 系统误差系统误差系统误差系统误差 严格说来,任何测试仪器在物理上都不可能是十全严格说来,任何测试仪器在物理上都不可能是十全十美的。例如,连接器会导致衰减和反射;十美的。例如,连接器会导致衰减和反射;“完全相同完全相同”的信的信号通道之间也会有细微的差别;相同放大器的增益大小不一样号通道之间也会有细微的差别;相同放大器的增益大小不一样等等。等等。这些差异是固定的、不变的,它是系统所造成的这些差异是固定的、不变的,它是系统所造成的。由此。由此而产生的测试误差就称为系统误差。而产生的测试误差就称为系统误
6、差。系统误差在相同测试条件下,其误差的大小是系统误差在相同测试条件下,其误差的大小是恒定的恒定的,或者遵,或者遵循确定规律而变化的,也就是说,系统误差是有循确定规律而变化的,也就是说,系统误差是有规律性规律性的。的。系统误差可通过系统误差可通过校准校准来排除或减小。来排除或减小。随机误差随机误差随机误差随机误差是由不相关的多种随机因素造成的是由不相关的多种随机因素造成的, ,其特性是:其特性是:没有规律性没有规律性不可预见性不可预见性不可控制性不可控制性随机误差随机误差具有概率分布的特点,因此,随机误差又具有:具有概率分布的特点,因此,随机误差又具有:有界性有界性对称性对称性抵偿性抵偿性随机误
7、差是最难处理的,因此,随机误差是最难处理的,因此,测量信息论主要研究的就是随机误测量信息论主要研究的就是随机误差的处理。差的处理。人们常说的误差处理,大都是指人们常说的误差处理,大都是指随机误差随机误差而言。而言。测试值的数学期望测试值的数学期望数学期望数学期望当当对对一一个个被被测测值值x x进进行行n n次次等等精精度度测测试试,而而获获得得n n个个测测试试数数据据时时,由由概概率率论论的的贝贝努努力力(Bernoulli)(Bernoulli)定定理理可可知知:事事件件发发生生的的频频度度收收敛敛于于它它的的概概率率(见见下下页页),即即当当测测试试次次数数为为无无穷穷大大时时,可可以
8、以用用事事件件发发生生的的频频度度代代替替事事件件发发生生的的概概率率。这这时,测试值时,测试值x x的数学期望为:的数学期望为:式中:式中:n n为总的测试次数,为总的测试次数,n ni i为取值为取值x xi i的次数,的次数,x xi i为每次的测试取值。为每次的测试取值。测试值出现的频度测试值出现的频度1/n1/n可用概率可用概率P Pi i 代替,因此,测试值代替,因此,测试值x x的数学期望值:的数学期望值:可可见见,测测试试值值 x x的的数数学学期期望望值值就就是是当当测测试试次次数数n n为为无无穷穷大大时时,各各次次测测试试值值的的算算术术平均值平均值。测试值的数学期望测试
9、值的数学期望频度频度n ni i/n/n 一个独立同分布测试数据为:一个独立同分布测试数据为:1.01,1.02,1.01,1.03,1.02,1.15,1.01,1.00,1.01,1.121.01,1.02,1.01,1.03,1.02,1.15,1.01,1.00,1.01,1.12取值:取值: 1.00 1.01 1.00 1.01 1.02 1.021.031.031.121.121.15 1.15 a a频度:频度: 1/101/104/104/10 2/10 2/101/101/101/101/101/10 1/10 n ni i/n/n概率:概率: 1/101/104/104/
10、10 2/10 2/101/101/101/101/101/10 1/10 p pi i测试值的数学期望测试值的数学期望频度频度n ni i/n/n概率矩阵概率矩阵测试值的数学期望测试值的数学期望连续函数的数学期望连续函数的数学期望将离散序列的累加改为积分即可将离散序列的累加改为积分即可方差方差测测试试值值的的数数学学期期望望只只反反映映了了测测试试值值的的大大小小,而而方方差差则则反反映映了了测测试试数数据据的的离离散散程程度。可以证明,度。可以证明,测试值的方差测试值的方差为:为:测测试试值值的的方方差差不不仅仅描描述述了了测测试试数数据据的的离离散散程程度度,同同时时,也也说说明明了了随
11、随机机误误差差对对测测试值的影响。这里要说明的是:试值的影响。这里要说明的是:方差是的平方后再进行平均,目的是防止正负误差的相互抵消;方差是的平方后再进行平均,目的是防止正负误差的相互抵消;平方后再平均的方法,使方差对大的误差有更高的灵敏度;平方后再平均的方法,使方差对大的误差有更高的灵敏度;方差的均方根,称为方差的均方根,称为均方根误差均方根误差,也称标准偏差,有:,也称标准偏差,有:随机误差的统计处理随机误差的统计处理随机误差根据其概率分布特性的不同有不同的统计处理方法。随机误差根据其概率分布特性的不同有不同的统计处理方法。高斯分布高斯分布在在概概率率论论中中,中中心心极极限限定定理理认认
12、为为:如如果果一一个个随随机机变变量量可可以以表表示示为为大大量量独独立立随随机机变变量量之之和和,而而其其中中每每一一个个随随机机变变量量对对于于总总和和而而言言是是十十分分微小微小的,则可认为这个随机变量服从正态分布,即高斯分布。的,则可认为这个随机变量服从正态分布,即高斯分布。显显然然,随随机机误误差差是是满满足足上上述述条条件件的的。因因为为造造成成随随机机误误差差的的多多种种因因素素是是彼彼此此独独立立的的,其其值值也也是是微微小小的的。因因此此,随随机机误误差差的的概概率率服服从从高高斯斯分布。这样测试值的分布。这样测试值的随机误差随机误差及测试值的及测试值的概率密度概率密度分别为
13、:分别为:高斯分布高斯分布随机误差和测试值的正态概率分布曲线随机误差和测试值的正态概率分布曲线从图所示的测试值及测试误差的概率分布曲线,可以看出:从图所示的测试值及测试误差的概率分布曲线,可以看出:测试误差由于随机误差的影响呈正态分布时,测试误差由于随机误差的影响呈正态分布时,测试值对称的分布于数学期望的两侧;测试值对称的分布于数学期望的两侧;绝对值小的随机误差出现的概率大,绝对值小的随机误差出现的概率大,而绝对值大的随机误差出现的概率小;而绝对值大的随机误差出现的概率小;测试值的分散程度可用标准方差来表示,测试值的分散程度可用标准方差来表示,随机误差大的测试值出现的概率小随机误差大的测试值出
14、现的概率小。P(x)x均匀分布均匀分布概率密度、数学期望、标准偏差概率密度、数学期望、标准偏差 xba1/b-aP(x)数学期望:数学期望:标准偏差:标准偏差:概率密度:概率密度:三角分布三角分布概率密度和标准偏差概率密度和标准偏差xP(x)-aa1/a概率密度:概率密度:标准偏差:标准偏差:梯形分布梯形分布标准偏差标准偏差xP(x)ab标准偏差:标准偏差: 反正弦分布反正弦分布密度函数和标准偏差密度函数和标准偏差P(x)x-aa标准偏差:标准偏差:概率密度:概率密度:t t分布分布概率密度函数概率密度函数tP(t)tp(v)-tp(v)概率密度:概率密度:标准偏差的合成标准偏差的合成当被测量
15、为多个输入变量当被测量为多个输入变量X X的函数,且各变量之间相关,在由的函数,且各变量之间相关,在由X X的标准偏差计算的标准偏差计算被测量的标准偏差时,必须考虑它们的相关性。则方差为:被测量的标准偏差时,必须考虑它们的相关性。则方差为:标准偏差为:标准偏差为:有限次测试的算术平均值及其偏差有限次测试的算术平均值及其偏差在实际测试中,测试次数不可能为无穷大,其数学期望仍为:在实际测试中,测试次数不可能为无穷大,其数学期望仍为:而标准偏差为:而标准偏差为:测试结果的置信概率测试结果的置信概率由于随机误差的影响,测试值总是偏离它的数学期望,且是随机的,也可用测由于随机误差的影响,测试值总是偏离它
16、的数学期望,且是随机的,也可用测试值试值的置信概率表示:的置信概率表示:式中:式中:置信概率可由表查出:置信概率可由表查出:异常数据的剔除异常数据的剔除由上可见,测量误差大于由上可见,测量误差大于3 3的概率仅占的概率仅占0.27%0.27%,因此,大于该值的数据均认为是差,因此,大于该值的数据均认为是差错,判断式为:错,判断式为:( (注意,此过程要重复进行注意,此过程要重复进行)电子科大电子科大CATCAT室室测试不确定度的表征测试不确定度的表征测测试试不不确确定定度度就就是是表表征征测测试试结结果果正正确确性性的的程程度度。测测试试的的不不确确定定度度可可用用标标准准偏偏差差表表示示,也
17、也可可用用测测试试值值的的置置信信区区间间来来表表示示。因因此此,不不确定度也是一个测试结果质量的确定度也是一个测试结果质量的定量定量表征。表征。测试不确定度可分为三类:测试不确定度可分为三类:(1)(1)标准不确定度:标准不确定度:A A类:用概率统计方法计算标准不确定度(静态类:用概率统计方法计算标准不确定度(静态, ,大样本);大样本);B B类:用非概率统计方法计算标准不确定度类:用非概率统计方法计算标准不确定度( (动态动态, ,小样本小样本) );(2)(2)合成标准不确定度:由各标准不确定度的分量合成得到;合成标准不确定度:由各标准不确定度的分量合成得到;(3)(3)扩展不确定度
18、:由标准不确定度乘以一个系数的区间来得到扩展不确定度:由标准不确定度乘以一个系数的区间来得到。注意注意误差:与真值差异的程度误差:与真值差异的程度不确定度:测试值分散的程度不确定度:测试值分散的程度标准不确定度的标准不确定度的A A类计算方法类计算方法A1A1:多次重复测试,标准不确定度:多次重复测试,标准不确定度u(x)u(x)就等于标准偏差:就等于标准偏差:A2A2:将测试曲线用最小二乘法拟合成一条直线:将测试曲线用最小二乘法拟合成一条直线:测试测试曲线曲线拟和拟和直线直线a斜率:斜率:btv可分别求出可分别求出a,b,ta,b,t的标准偏差,并根据它们的相关性求出合成标准偏差,即为的标准
19、偏差,并根据它们的相关性求出合成标准偏差,即为标准不确定度:标准不确定度:标准不确定度的标准不确定度的A A类计算方法类计算方法A3.A3.当测试过程采用当测试过程采用统计控制时,其合成标准偏差为:统计控制时,其合成标准偏差为:A4A4:先求特殊方差(如阿仑:先求特殊方差(如阿仑 方差):方差):其中:其中:k k为核查次数为核查次数 s si i是标准偏差是标准偏差标准不确定度为:标准不确定度为:再求标准方差:再求标准方差:标准不确定度的标准不确定度的B B类计算类计算所谓所谓B B类计算法就是用非概率统计方法计算标准不确定度的方法。当被测试值类计算法就是用非概率统计方法计算标准不确定度的方
20、法。当被测试值X X不是由重复测得时,就只能用对不是由重复测得时,就只能用对X X的可能变化的有关信息来计算。的可能变化的有关信息来计算。B B类计算的信息来源有:类计算的信息来源有:* *以前测试的数据;以前测试的数据;* *经验和对有关仪器的特性的知识;经验和对有关仪器的特性的知识;* *生产厂的技术说明书及其有关手册;生产厂的技术说明书及其有关手册;* *检定证书,校准证书,测试报告等数据资料;检定证书,校准证书,测试报告等数据资料;计算方法是根据经验和有关数据分析被测试值的计算方法是根据经验和有关数据分析被测试值的区间区间(-e(-e,e)e),并根据假设被测,并根据假设被测值的概率分
21、布及要求的置信概率估计值的概率分布及要求的置信概率估计包含因子包含因子,则测试不确定度为:,则测试不确定度为:K=2-3合成不确定度的计算合成不确定度的计算1 1)如果测试结果的标准不确定度包含多个互不)如果测试结果的标准不确定度包含多个互不 相关的不确定度分量,则合成不确定度为单相关的不确定度分量,则合成不确定度为单 个不确定度的方和根值:个不确定度的方和根值:2 2)如果各不确定度相关,则有:)如果各不确定度相关,则有:3 3)如为指数相关,则有:)如为指数相关,则有:4 4)如果相关系数为)如果相关系数为1 1,则有:,则有:即为线性和。即为线性和。扩展不确定度的计算扩展不确定度的计算扩
22、展不确定度由合成扩展不确定度由合成不确定度乘以包含因不确定度乘以包含因子子K K得到:得到:被测值以高的置信概率被测值以高的置信概率居于置信区间:居于置信区间:熵熵信息熵信息熵最大熵估计最大熵估计贝叶斯算法贝叶斯算法1.2 1.2 测量信息论测量信息论熵熵-新的世界观新的世界观 地地球球是是一一个个封封闭闭系系统统,其其能能源源、资资源源和和容容积积有有限限,人人类类社社会会的的发发展增长必然有一个极限。展增长必然有一个极限。热力学定律热力学定律熵的概念是从热力学引导出来的。熵的概念是从热力学引导出来的。热力学第热力学第0定律定律:温度与热平衡温度与热平衡。1709年荷兰年荷兰G。D。Fahrenheit建立华氏温标,建立华氏温标,1742年瑞典天文学家年瑞典天文学家A。Celsius建立摄氏温标,建立摄氏温标,热热力力学学第第一一定定律律(能能量量守守恒恒定定律律):能能量量是是守守恒恒的的、不不灭灭的的,只只能能从从一一种种形形式式转转变变成成另另一一种种形形式式。从从而而否否认认了了第第一一类类“永永动动机机”。物理学家焦耳经物理学家焦耳经30年的研究,于年的研究,于1848年提出。年提出。