简谈测量数据处理中的正态分布

上传人:mg****85 文档编号:34176171 上传时间:2018-02-21 格式:DOCX 页数:7 大小:28.79KB
返回 下载 相关 举报
简谈测量数据处理中的正态分布_第1页
第1页 / 共7页
简谈测量数据处理中的正态分布_第2页
第2页 / 共7页
简谈测量数据处理中的正态分布_第3页
第3页 / 共7页
简谈测量数据处理中的正态分布_第4页
第4页 / 共7页
简谈测量数据处理中的正态分布_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《简谈测量数据处理中的正态分布》由会员分享,可在线阅读,更多相关《简谈测量数据处理中的正态分布(7页珍藏版)》请在金锄头文库上搜索。

1、 简谈测量数据处理中的正态分布 彭碧瑶 201312123010摘要:基于概率论与数理统计中的正态分布,在实际生产生活中应用广泛,其也可以在测量过程中得以应用。对于测量数据的处理,正态分布的分布方式与模型在误差分析过程发挥着巨大作用。0.引言在测量工作的进行过程中,对于部分客观存在的量,无论测量仪器多么精密、测量方法多么合理,其测量结果总会存在带小不同的差异,用术语来说便是误差。而这时,正态分布模型及其曲线在误差分析和数据处理便发挥了重要作用。1.高斯法导出的偶然误差曲线实际上,测量数据误差的产生原因有很多,正态分布也并不是都能适用的。而在测量过程中所产生的偶然误差(看似无规律)则恰好符合正态

2、分布,因此对于偶然误差的分析与减小,正态分布便是不可或缺的处理数据方式。人们通过大量的实践,总结出偶然误差所具有的特点:具有界限:在固定的观测条件下,误差的绝对值有一定的限定,换句话说就是超出一定的界限值的误差,其出现的概率为零;聚集中间:绝对值较小的误差比绝对值较大的误差出现的概率大;左右对称:绝对值相等的正负误差出现的概率相等;互相抵偿:偶然误差的数学期望为零。因此,高斯结合实际测量,导出了偶然误差分布曲线的解析表达式,也就是一维正态分布的密度函数曲线的解析式。高斯法的一个关键是:当 n时,l= 即算术平均数趋近于该变量的数学期望。因此,可以认为观测值误差 和观测值改正数 v 有相同的特性

3、。设对某随机变量观测 n 次,出现 n 个误差 1,2 ,n,其联合出现的概率为 P(1,2 ,n)=f(1)df(2 )df(n)d出现这一组 ,而不出现其他一组,说明这一组误差联合出现的概率最大,上式有最大值,等价于 G=f(1)f( 2)f(n)=max或 lnG=ln f(1)+lnf(2)+lnf(n)=lnf(v1)+ln f(v2)+ln f(vn)=max式中,vi= l-li 是l= 函数,不同的l 有不同的 vi。要在上式最大条件下找出l ,或者说找到这样一个l ,使一组v1,v2 ,vn 出现的概率最大,因此将上式求导并令其等于零,即() =(v1) +(v2) +(vn

4、) =0因为 =1 再令 =(vi)dvi (vi)vi则有 (v1)1v1+(v2)2v2+(vi)vi vi=0又因为 =0v1+v2+vi则必有 (v1)1=(v2)2=(vi)vi =(v)v即 dlnf(v)=Cvdvlnf(v)=Cvdv=122+f(v)= =A122+ 122q 其中,A,C 是两个待定的常数。因为 v 和 具有相同的特性,将上式的 v 换成 ,即 f()= A122因为因变量为 ,上式为偶函数,即满足 f()=f(-),又因为 绝2对值大,f()小,即为降函数,令 12=2又由偶然误差性质知: d=1, d=1+-() +-22令 t=h,则 dt=hd,有

5、dt=1+-2=1即 f(v)= 高斯称 h 为精确度。h 值不同,曲线形状22不同。由方差定义式得 2=+-2()得 即2=122 2=122由此可得 ()12222这就是偶然误差分布曲线的解析表达式,若将 作为一般的随机变量并用 x 表示,则数学期望不等于零,设为 ,则由上式可知一维正态分布的密度函数曲线的表达式为 ()12()222取 f()的一价导数并令其等于零,即(- )=0 ()12222 222当 =0 时,f(0)= 为函数的最大值。取 f()的二价导数并令其等 12于零,即 ( )=0 ()12222 21由此求出的 为曲线拐点的横坐标,其值为 拐=以上便是由高斯法导出偶然分

6、布曲线的关系式以及特殊点。2.衡量误差的指标在上面我们已经推出了偶然误差分布曲线符合正态分布的表达式,那么其性质也可以和正态分布对应。在测量数据处理中,需要评定结果的精度,即指偶然误差分布的密集或离散程度,也就是离散度的大小。而精度的高低则与上式中的 h 和 有关。在测量中定义按有限次数观测的偶然误差求得的标准差称为中误差,即 。在 的几何意义中, 越小,上面曲线的形状越陡峭,曲线在纵轴方向的顶峰越高,在纵轴两侧越迅速逼近纵轴,表示大误差出现的频率越小,小误差出现的频率越大,偶然误差分布越集中,其对应的精度越高;反之, 越大,上面曲线的形状越平缓,曲线在纵轴方向的定峰越低,在纵轴两侧越缓慢逼近

7、纵轴,表示大误差出现的频率越大,小误差出现的频率越小,偶然误差分布越分散,其对应的精度越低。而在正态分布曲线具有两个拐点,其值为变量的数学期望,对于偶然误差而言,数学期望是零,所以拐点为 。根据正态分布的性质,设以 k 倍的中误差作为区间,则偶然误差在此区间中出现的概率为 P( )=|)=21()当 k=1.96 时,有 .由(|1.96)=21(1.96)=0.05此逆事件概率为 0.95.设 =0.05 为小概率事件。在一次实验中,它不应该出现。从母体中抽取的 xi 来自 ,则x 。(,2) (,2/)于是有(|1.96/)=0.95这就是说,区间(x- ,x+ )包含母体均值1.96/1

8、.96/ 的概率为 0.95。显然,概率越大,区间越小,就越能知道 位于何处。因此,这是一种估计方法,称为参数的区间估计。其中该区间称为 95%置信区间,此区间的端点称为置信限,95% 称为置信度。而x 属于这个区间,就能认为x 代表 ;若x + ,就是小概率事件竟然出现了,与常1.96/ 1.96/理不符,也就不满足 X 。(,2)我们用x 来估计母体均值 ,一是代表 ,一是不代表 ,那么就要进行判断,进行检验。而假设检验所用的方法就是:先作一个假设,称为原假设,记为 H0,然后找一个合适的统计量(子样值的函数) ,利用抽得的子样来计算统计量的数值。如果在原假设 H0 正确的条件下,此数值出

9、现的概率很小,则根据小概率事件原理,拒绝或舍弃原假设,否则接受原假设。检验不同于数学定理的证明。一个定理不带有随机性;而假设是否被接受则受抽样随机性的影响,所以称为统计假设。若 H0 遭到拒绝,则实际上是接受了另一个假设,称为备选假设,记为 H1。采用什么样的备选假设,应根据问题的具体性质来决定。假设检验就是在原假设和备选假设中作出选择,两者性质是一样的,并无重要与不重要之分。从假设检验的过程可以发现,其主要工作是母体分布的选定及其检验,参数估计和统计量的检验,而正态分布又是一个常用的母体分布模型,根据正态分布曲线以及其性质可以更好的进行假设检验,以求出所需要的参数。4.结语科学的发展无不与测

10、量息息相关,对自然界所发生的量变现象的研究,需要借助于各式各样的试验与测量来完成。而试验的结果会产生大量的观测数据。那么就需要正确熟练的处理数据,因此,正态分布在误差分析中的作用很重要,重要在于它是一种模型,简化了偶然误差处理过程,有助于更直观的分析和改正;其在数据其他处理中也可以发挥其模型直观的作用。更多地应用正态分布等数理统计方法,现代测量的数据一定会更加简单,更加便捷的。参考文献1茆诗松、程依明、濮晓龙编, 概率论与数理统计教程,高等教育出版社,2004.72喻国荣、王庆、潘树国编,现代测量数据处理理论,中国大地出版社,2011.113顾孝烈、鲍峰、程效军编,测量学,同济大学出版社,2011.2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号