最小二乘法拟合原理

上传人:平*** 文档编号:15086201 上传时间:2017-11-03 格式:DOC 页数:4 大小:171.22KB
返回 下载 相关 举报
最小二乘法拟合原理_第1页
第1页 / 共4页
最小二乘法拟合原理_第2页
第2页 / 共4页
最小二乘法拟合原理_第3页
第3页 / 共4页
最小二乘法拟合原理_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《最小二乘法拟合原理》由会员分享,可在线阅读,更多相关《最小二乘法拟合原理(4页珍藏版)》请在金锄头文库上搜索。

1、最小二乘拟合在物理实验中经常要观测两个有函数关系的物理量。根据两个量的许多组观测数据来确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。这类问题通常有两种情况:一种是两个观测量 x 与 y 之间的函数形式已知,但一些参数未知,需要确定未知参数的最佳估计值;另一种是 x 与 y 之间的函数形式还不知道,需要找出它们之间的经验公式。后一种情况常假设 x 与 y 之间的关系是一个待定的多项式,多项式系数就是待定的未知参数,从而可采用类似于前一种情况的处理方法。一、最小二乘法原理在两个观测量中,往往总有一个量精度比另一个高得多,为简单起见把精度较高的观测量看作没有误差,并把这个观测量选作 x,而

2、把所有的误差只认为是 y 的误差。设 x 和y 的函数关系由理论公式y f( x; c1, c2, cm) (0-0-1)给出,其中 c1, c2, cm是 m 个要通过实验确定的参数。对于每组观测数据( xi, yi) i1,2,N。都对应于 xy 平面上一个点。若不存在测量误差,则这些数据点都准确落在理论曲线上。只要选取 m 组测量值代入式(0-0-1) ,便得到方程组yi f( x; c1, c2, cm) (0-0-2) 式中 i1,2,m.求 m 个方程的联立解即得 m 个参数的数值。显然 Nm 的情况下,式(0-0-2)成为矛盾方程组,不能直接用解方程的方法求得 m 个参数值,只能

3、用曲线拟合的方法来处理。设测量中不存在着系统误差,或者说已经修正,则y 的观测值 yi围绕着期望值 摆动,其分布为正态分布,则 yi的概率密度为,221,.;epimiiii cxfyp式中 是分布的标准误差。为简便起见,下面用 C 代表( c1, c2, cm) 。考虑各次i测量是相互独立的,故观测值( y1, y2, cN)的似然函数.iiiN xfyL1221 ;exp. 取似然函数 L 最大来估计参数 C,应使(0-0-3)min;122Ni iixfy取最小值:对于 y 的分布不限于正态分布来说,式(0-0-3)称为最小二乘法准则。若为正态分布的情况,则最大似然法与最小二乘法是一致的

4、。因权重因子 ,故式2/1ii(0-0-3)表明,用最小二乘法来估计参数,要求各测量值 yi的偏差的加权平方和为最小。根据式(0-0-3)的要求,应有 mkCxfyccNi iik ,.210;122 从而得到方程组(0-0-4)ffci kii ,.;12解方程组(0-0-4) ,即得 m 个参数的估计值 ,从而得到拟合的曲线方程m,.21。mcxf,.;21然而,对拟合的结果还应给予合理的评价。若 yi服从正态分布,可引入拟合的 x2量,(0-0-5)Ni iiCxfx1222;把参数估计 代入上式并比较式(0-0-3) ,便得到最小的 x2值mcc,.21(0-0-6)Ni iicfy1

5、222in;可以证明, 服从自由度 v N-m 的 x2分布,由此可对拟合结果作 x2检验。2minx由 x2分布得知,随机变量 的期望值为 N-m。如果由式(0-0-6)计算出 接近2min minN-m(例如 ) ,则认为拟合结果是可接受的;如果 ,则Nin2minN认为拟合结果与观测值有显著的矛盾。二、直线的最小二乘拟合曲线拟合中最基本和最常用的是直线拟合。设 x 和 y 之间的函数关系由直线方程y a0+a1x (0-0-7)给出。式中有两个待定参数, a0代表截距, a1代表斜率。对于等精度测量所得到的 N组数据( xi, yi) , i 1, 2, N, xi值被认为是准确的,所有

6、的误差只联系着 yi。下面利用最小二乘法把观测数据拟合为直线。1直线参数的估计前面指出,用最小二乘法估计参数时,要求观测值 yi的偏差的加权平方和为最小。对于等精度观测值的直线拟合来说,由式(0-0-3)可使(0-0-8)aNi iixay1210最小即对参数 a(代表 a0, a1)最佳估计,要求观测值 yi的偏差的平方和为最小。根据式(0-0-8)的要求,应有 ,0211012100 Ni iiaNi ii xxy . i iii ii aya整理后得到正规方程组.,210 iii iiyxaxN解正规方程组便可求得直线参数 a0和 a1的最佳估计值 和 。即0a1(0-0-10)222i

7、i iiii xNy(0-0-11)221ii iii yxa2拟合结果的偏差由于直线参数的估计值 和 是根据有误差的观测数据点计算出来的,它们不可避01免地存在着偏差。同时,各个观测数据点不是都准确地落地拟合线上面的,观测值 yi与对应于拟合直线上的 这之间也就有偏差。iy首先讨论测量值 yi的标准差 S。考虑式(0-0-6) ,因等精度测量值 yi所有的 都相i同,可用 yi的标准偏差 S 来估计,故该式在等精度测量值的直线拟合中应表示为(0-0-12).12102minNiixayx已知测量值服从正态分布时, 服从自由度 v N-2 的 x2分布,其期望值i .11022in NSNi

8、ii由此可得 yi的标准偏差(0-0-13).2110Ni iixay这个表示式不难理解,它与贝塞尔公式是一致的,只不过这里计算 S 时受到两参数和 估计式的约束,故自由度变为 N-2 罢了。0a1式(0-0-13)所表示的 S 值又称为拟合直线的标准偏差,它是检验拟合结果是否有效的重要标志。如果 xy 平面上作两条与拟合直线平行的直线 ,1010 SxaySxay如图 0-0-1 所示,则全部观测数据点( xi, yi)的分布,约有 68.3%的点落在这两条直线之间的范围内。图 0-0-1 拟合直线两侧数据点的分布下面讨论拟合参数偏差,由式(0-0-10)和(0-0-11)可见,直线拟合的两

9、个参数估计值 和 是 yi的函数。因为假定 xI是精确的,所有测量误差只有 yi有关,故两个估计0a1参数的标准偏差可利用不确定度传递公式求得,即 .; 2121010 NiiaNiia SSyS把式(0-0-10)与(0-0-11)分别代入上两式,便可计算得(0-0-14);220iiiax(0-0-15).221iiaNS三、相关系数及其显著性检验当我们把观测数据点( xi, yi)作直线拟合时,还不大了解 x 与 y 之间线性关系的密切程度。为此要用相关系数 ( x, y)来判断。其定义已由式(0-0-12)给出,现改写为另一种形式,并改用 r 表示相关系数,得(0-0-16)2/12iiiiyxx式中 和 分别为 x 和 y 的算术平均值。r 值范围介于-1 与+1 之间,即-1r1。当xyr0 时直线的斜率为正,称正相关;当 r0 时直线的斜率为负,称负相关。当|r|1 时全部数据点( xi, yi)都落在拟合直线上。若 r0 则 x 与 y 之间完全不相关。r 值愈接近1则它们之间的线性关系愈密切。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号