插值与拟合讲义

上传人:今*** 文档编号:105835706 上传时间:2019-10-13 格式:DOCX 页数:40 大小:4.17MB
返回 下载 相关 举报
插值与拟合讲义_第1页
第1页 / 共40页
插值与拟合讲义_第2页
第2页 / 共40页
插值与拟合讲义_第3页
第3页 / 共40页
插值与拟合讲义_第4页
第4页 / 共40页
插值与拟合讲义_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《插值与拟合讲义》由会员分享,可在线阅读,更多相关《插值与拟合讲义(40页珍藏版)》请在金锄头文库上搜索。

1、插值与拟合 Interpolation and FittingInterpolation and Fitting插值与拟合-V2.11. 前言Preface22. 插值与拟合 Interpolation and Fitting22.1. 最小二乘法理论基础(The basic theory of Least Squares Method)22.2. 数据拟合和曲线拟合(Data Fitting & Curve Fitting)33. 不同曲线的拟合模型43.1. 线性模型 Y=C1+C2X43.2. 拋物线模型y=C1+C2X+C3X2 43.3. 对数模型 Y=C1+C2ln(x)53.4.

2、 指数模型 y=aebx53.5. 双曲模型y=1/(C1+C2X)53.6. 幂模型 Power y=xn53.7. 多项式拟合 Polynomial Fitting63.7.1. 多项式拟合原理(共6步)63.7.2. 多元函数求偏导的推导过程(共7步)103.7.3. 线性方程组解法LU分解法(共4步)143.7.4. 矩阵A的LU分解的流程图(共8步)174. 最小二乘法拟合范例 Example of Fitting by Least Squares Method284.1. 先验证算法正确性284.2. 利用最小二乘法计算最优曲线284.3. VS2010中动态内存的申请295. 添

3、加绘画控件306. 参考资料及课本错误之处326.1. 参考资料326.2. 课本上的错误之处321. 前言Preface工作中需要根据已知的n组数据,推测未来几个点的数据(或曲线的趋势),如健康指南。注:离散的数据在Excel表中,只是将各点简单的用直线相连,它并不是一个有规律可循的光滑曲线,更不可能由它来预测未来线条的趋势。因此我们需要通过这些离散的点,拟合出一条有规律的曲线,然后通过它来计算后面几个点的数据或趋势。(2017-02-27)如下面表1表2,在Excel中,分别预测了两个点和一个点的值。某实验得到的9次数据及预测序号XY1122373484510561167117810899

4、91081011611123“4.1验证算法正确性”中可以精确计算出f(11)=5.82;f(12)=3.27。取整即为6和3。即左图显示。某一化学反应过程中, 温度()对产品得率 (%)的影响序号温度 得率 (%)1100452110513120544130615140706150747160788170859180通过公式可计算出当X=190和X200时,对应的Y值。f(190)=95.07;f(200)=100.194。取整即为95和100。即左图显示。891019090112001002. 插值与拟合 Interpolation and Fitting要想实现前言提到的根据现有测试数据

5、来预测未来数据,可以用插值与拟合的方法。在此要感谢我的同学赵淑红教授,是她提醒我要用最小二乘法。没有她的提醒,我还真不知从何处入手来解决问题。高手的作用:就是需要时,手轻轻一指方向,剩下的就是俺们这些干活的要做的事。2.1. 最小二乘法理论基础(The basic theory of Least Squares Method)最小二乘解:先看什么是矛盾方程组(Over Determined System)。实践中,往往会遇到,含n个未知数、m个方程的线性代数方程组。其中方程的个数m远大于未知数的个数n。我国地质测量中,遇到过13万个未知数,17万个方程的矛盾方程组,如下面公式1.1。(注:题外

6、话,国家超大型计算机会优先用于地质勘探。第一用于军事,求导弹轨迹。第二用于气象,预报瞬息万变的天气。第三用于地质测量,用于快速的判断地下资源)Aij xj = bi, i=0,1,2,m。 (注:mn)对于上述方程组,我们引入矩阵:。方程组1.1一般是无解的,但可以考虑一个近似解:X,使得AX尽可能接近b。即寻找x1,x2,xn,使得: (注:mn,为何这里却是mn呢?前面提到实际中m可能远大于n,是指实测的数据较多,上面公式中mn是指将要拟合出的方程组中各项的系数m,它的个数是小于等于方程组最高次方n的。(2017-03-15补)2.2. 数据拟合和曲线拟合(Data Fitting & C

7、urve Fitting)数据拟合:上述矛盾方程组是个通用表达式,实际工作中,大多数是在三维立体空间的曲线,其中最多的还是XY坐标系的二维曲线。为此,我们将上式简化为,通过一组观测值(Xk,Yk),k=1,2,m,来确定X与Y的关系,或函数y=f(x)的表达式无法给出时,我们试图通过这组带有观测误差的数据(Xk,Yk)来寻找接近f(x)的函数。这一解决问题的思路叫“数据拟合”,反应在曲线上,就叫“曲线拟合(Curvefitting)”。1 拟合方法有很多种,如:线性插值、抛物线插值、拉格朗日插值、样条插值、最小二乘法插值。结合这些插值与拟合的方法,我们选择“效率最高的”最小二乘法拟合。最小二乘

8、法又称最小平方法,它利用“最小误差的平方和”来寻找最佳的匹配函数。最小二乘法是高斯(Gauss)发明的,1809年发表在他的著作天体运动论中。后经改良,又多方验证,在离散的点中,通过这种算法得到的曲线,计算效率最高,优于其它算法。1801年奥地利天文学家海因里希奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。综合考虑,在我们的产品中,将采用最小二乘法来计算趋势图。2 最小二乘法只是一个大方向的指导方法。在实际工作中,会根据观测数据的物理背景,结合观测数据先选定一个初步的曲线模型。常见的曲线模型有:线型、抛物线型、对数型、指数型/幂、多项式、双曲型等。3 “误差平方和最小原则”。前面提到的多种模

9、型,实际中选择哪种更接近呢?实际中采用“误差平方和最小原则”。如:根据某15组测试数据采用两种不同的拟合模型:双曲模型和指数模型。用最小二乘法对两种不同模型得到结果如下。哪一种更接近实测值呢?请看下图。注:下面对平方和进行开方,和的最小值和开方的最小值,其实原理是一样,就是比较哪种值相对较小。3. 不同曲线的拟合模型下面详细讲解不同曲线的拟合模型。注:各个曲线模型的推导过程,这里不再描述,直接写结果。3.1. 线性模型 Y=C1+C2X 其正规方程组为其C1和C2的解为:其中:3.2. 拋物线模型y=C1+C2X+C3X2 抛物线模型的正规方程组为:C1、C2、C3推导过程稍后由杨鹏辉自行给出

10、,课本上没有给出推导过程和结果。(2017-03-01)3.3. 对数模型 Y=C1+C2ln(x)对数模型 ,其最小二乘解C1、C2满足下式。其中C1、C2的解为:(注:待杨鹏辉给出,课本上没有给出求解过程和结果,2017-03-01)3.4. 指数模型 y=aebx指数模型y=aebx中的a和b可由下面公式决定。将等式两边取对数,得,令Ylny,套用线性模型,Y=C1+C2X,则C1lna,C2b。由3.1线性模型知,故。由于:,。 又由于:C1=lna,C2=b,故:,。3.5. 双曲模型y=1/(C1+C2X) 其C1、C2满足公式: 。其中。3.6. 幂模型 Power y=xn 转

11、换成模型,则为 。如何求幂的最小二乘法,书没有介绍,待收集整理。杨鹏辉,2017-03-023.7. 多项式拟合 Polynomial Fitting下面重点讲下多项式,为什么要重点讲一个课本上没有的多项式呢?因为Excel中离散点拟合曲线时,发现多项式拟合出的曲线和预测曲线的趋势,最接近我们所要的。但“多项式拟合”课本上没有。只好从网上多方搜集。其实前面提到6种类型中,线型和抛物线都属于多项式,它们属于多项式中的特例。所谓多项式,就是多个单项式通过加减乘除组合而成的混合式子。按其最高次方n,叫做n次多项式。如叫做3次多项式,分别叫各项的系数。下面结合网上资料,并参考计算方法P169171来讲

12、述多项式拟合的原理及推导过程。3.7.1. 多项式拟合原理(共6步)由2.1中的1.3式可知,最小二乘法核心是求“误差平方和的最小极限”,如下表。(2017-03-02) (注:mn)(1.3)下面结合实际例子,给了推导过程。如化学反应中,由实验测得分解物浓度y与时间t的关系如下表所示。t051015202530354045505560y01.272.162.863.443.874.154.374.514.584.624.644.66注:从数据和实际理论可知,该曲线是一条“快速上升,再逐渐趋于平缓”的一条曲线,因为浓度最终会趋于饱和,表现在曲线上是由上升到趋于平缓的一条曲线。下面给出具体的曲线

13、公式。(注:这个曲线理论上最接近的是双曲模型中的双曲正切函数,但也可以用多项式表达,本文最终会给出二者谁误差更小)注:下表是通过Excel表计算出的拟合曲线,它是个二次多项式,显示不对,它的趋势是下降的。理论,浓度是不会下降的,只会趋于某一个饱和值。后面我会根据“双曲模式”再计算出它的公式。(2017.03.15补)浓度与时间的关系序号TY100251.273102.164152.865203.446253.877304.158354.379404.5110454.5811504.6212554.6413604.66准备工作:综合来讲,书本上太简单,又有错误,网上内容更是很难理解。现结合书本和

14、网上信息,细细讲解。注:两个定理的证明过程不再给出,它的结论是“m 次最小平方逼近多项式是存在唯一解的”,它的系数由线性方程组(4.8.2)确定。为什么要给出书上没有的推导过程呢?主要是因为,(1)书上其它地方有印刷错误,我不敢保证,这些公式没有印刷问题。(2)要知其然,还要知其所以然。故我希望自己能推导出来。第一步:选择拟合多项式的次数。注:课本上通用讲法是,先把离散点在XY坐标中标出来,初步根据点的分布形状,取一个n次m多项式,但n取多少呢?课本讲了,也就是前面几种模型。但事实上,那几种模型,只适合于非计算机时代,即手工时代,小运算量。在现在计算机时代,这个n取多少合适,那真要看“谁的误差平方和最小”,这种运算量还是较大的。(1.3)式为各点距

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号