《数学建模之第六讲曲线拟合》由会员分享,可在线阅读,更多相关《数学建模之第六讲曲线拟合(59页珍藏版)》请在金锄头文库上搜索。
1、第五讲第五讲 曲线拟合与函数逼近曲线拟合与函数逼近引例:引例:Hooker定律定律 设设F表示弹簧受力,表示弹簧受力,x表示弹簧伸长量;经过试验得到下表示弹簧伸长量;经过试验得到下面的一组数据,试确定弹簧受力与伸长量的关系面的一组数据,试确定弹簧受力与伸长量的关系给出一组离散点,确定一个简单函数近似原函数,多项式给出一组离散点,确定一个简单函数近似原函数,多项式插值提供了一种处理手段。插值提供了一种处理手段。然而,在实际问题中,给出的结点处的离散数据或多或少的然而,在实际问题中,给出的结点处的离散数据或多或少的都带有误差,插值要求多项式严格通过这些插值结点,无形都带有误差,插值要求多项式严格通
2、过这些插值结点,无形之中就将这些点处的误差保存下来;之中就将这些点处的误差保存下来;尤其是当结点数目较多时,误差可能累积起来,从而对最终近尤其是当结点数目较多时,误差可能累积起来,从而对最终近似效果产生较大影响这正是高次插值产生似效果产生较大影响这正是高次插值产生Runge现象的一现象的一个主要原因;个主要原因;此外,即便给出的结点处的离散数据较为精确,但由于插值此外,即便给出的结点处的离散数据较为精确,但由于插值条件的限制,也导致多项式插值仅仅在处理结点附近的函数条件的限制,也导致多项式插值仅仅在处理结点附近的函数值近似问题时较为有效,即插值的局部近似效果好,整体逼值近似问题时较为有效,即插
3、值的局部近似效果好,整体逼近效果差。近效果差。这些都促使我们考虑一种函数逼近的新方法这些都促使我们考虑一种函数逼近的新方法曲线拟合。曲线拟合。所谓函数逼近是求一个简单的函数所谓函数逼近是求一个简单的函数 不要求这个不要求这个函数能够经过所有的已知结点(可以消除局部误差影响);函数能够经过所有的已知结点(可以消除局部误差影响);而是要求在整体上而是要求在整体上“尽量好尽量好”的逼近原函数(尽可能表现数的逼近原函数(尽可能表现数据据的趋势,靠近这些点。的趋势,靠近这些点。 追求的是整体逼近效果)。追求的是整体逼近效果)。 这样,在每个已知结点处,这种逼近就会有误差这样,在每个已知结点处,这种逼近就
4、会有误差函数逼近就是从整体上使误差尽量的小一些函数逼近就是从整体上使误差尽量的小一些如引例中就是用一条直线一次多项式从整体上逼近弹簧受如引例中就是用一条直线一次多项式从整体上逼近弹簧受力与伸长量之间的函数关系并不要求这条直线经过所有结点,力与伸长量之间的函数关系并不要求这条直线经过所有结点,事实上也没有这样的直线能够实现这一点。事实上也没有这样的直线能够实现这一点。1 离散最小二乘的曲线拟合问题离散最小二乘的曲线拟合问题满足满足 f(x) 与与 P P(x) 在已知结点处在已知结点处的距离最小。的距离最小。f(x)为定义在区间为定义在区间a,b上的连续函数,上的连续函数,互不相同的点,互不相同
5、的点,为区间上为区间上n+1个个为给定的某一函数类。求为给定的某一函数类。求上的函数上的函数 P(x)如果这种距离取为如果这种距离取为2范数的话,称为最小二乘问题。范数的话,称为最小二乘问题。即,求即,求P(x),使得,使得最小。最小。一、多项式最小二乘拟合一、多项式最小二乘拟合设设为给定的一组数据,求一个为给定的一组数据,求一个n次(次(nm)多项式函数,多项式函数,使得,使得最小。满足这一条件的多项式称作样本点(最小。满足这一条件的多项式称作样本点(x,y)的最小二乘)的最小二乘拟合多项式。拟合多项式。要确定这样的多项式,首先应该确定其次数要确定这样的多项式,首先应该确定其次数n,这往往是
6、根,这往往是根据样本点的走势进行判断事实上,这是多项式拟合中最难据样本点的走势进行判断事实上,这是多项式拟合中最难确定的一点,例如,依据下面的两幅散点图,可以分别选确定的一点,例如,依据下面的两幅散点图,可以分别选择一次多项式直线和二次多项式抛物线进行拟合。择一次多项式直线和二次多项式抛物线进行拟合。在次数确定之后,只需确定多项式系数在次数确定之后,只需确定多项式系数即可即可令,令,使得,使得Q最小。最小。我们的目的是求一组我们的目的是求一组根据多元函数极值理论,只需令根据多元函数极值理论,只需令即,即,也就是,也就是,将上面的将上面的n+1个等式联立得到方程组如下,个等式联立得到方程组如下,
7、将上面的方程组写成矩阵乘法的形式将上面的方程组写成矩阵乘法的形式最小。最小。使得使得上述方程组成为多项式最小二乘拟合的法方程组,可以看出,上述方程组成为多项式最小二乘拟合的法方程组,可以看出,其系数矩阵是一个对称阵。该方程组的解其系数矩阵是一个对称阵。该方程组的解至此,我们要找的至此,我们要找的n次最小二乘拟合多项式次最小二乘拟合多项式P(x)就确定了。就确定了。相关理论:相关理论:Th:法方程组存在唯一解,且该方程组的解就是使:法方程组存在唯一解,且该方程组的解就是使得偏差平方和最小的解。证略得偏差平方和最小的解。证略例例1:考察某种纤维的强度与其拉伸倍数的关系:考察某种纤维的强度与其拉伸倍
8、数的关系,下表是实际下表是实际测定的测定的24个纤维样品的强度与相应的拉伸倍数的记录个纤维样品的强度与相应的拉伸倍数的记录:纤维强度随拉伸纤维强度随拉伸倍数增加而增加倍数增加而增加并且并且24个点大致个点大致分布在一条直线分布在一条直线附近附近我们希望直线我们希望直线与所有的样本点与所有的样本点越接近越好越接近越好令令令令即即将数据代入,得到线性方程组:将数据代入,得到线性方程组:解得:解得:即:即:Matlab程序:程序:二、一般线性最小二乘拟合二、一般线性最小二乘拟合设设是给定的一组数据,在给定的是给定的一组数据,在给定的函数类函数类中,确定一个中,确定一个函数函数,使得,使得,最小。这一
9、问题称作是一般最小二乘拟合问题。最小。这一问题称作是一般最小二乘拟合问题。显然,当取显然,当取时,上述问题时,上述问题就成为多项式最小二乘拟合问题。就成为多项式最小二乘拟合问题。在在中的系数,确定的方法与多项式最小二乘拟合中类似,即令中的系数,确定的方法与多项式最小二乘拟合中类似,即令给定之后,只需确定拟合函数给定之后,只需确定拟合函数以及,令以及,令得得即即将上面的将上面的n+1个等式联立得到法方程组:个等式联立得到法方程组:其中,其中,法方程组法方程组存在唯一解,且该唯一解就是所求存在唯一解,且该唯一解就是所求问题的最小二乘解。问题的最小二乘解。Th:第一步:函数空间的基第一步:函数空间的
10、基,然后列出法方程,然后列出法方程第一步:函数空间的基第一步:函数空间的基,然后列出法方程,然后列出法方程例:例:例例2:求拟合以下数据的最小二乘解求拟合以下数据的最小二乘解解解:从数据的散点图可以看出从数据的散点图可以看出因此假设拟合函数与基函数分别为因此假设拟合函数与基函数分别为x=.24 .65 .95 1.24 1.73 2.01 2.23 2.52 2.77 2.99y=.23 -0.26 -1.10 -0.45 .27 .10 -0.29 .24 .56 16.7941 -5.3475 63.2589-5.3475 5.1084 -49.008663.2589 -49.0086 1
11、002.5 1.6163-2.382726.7728通过计算通过计算,得法方程组的系数矩阵及常数项矩阵为得法方程组的系数矩阵及常数项矩阵为用用Gauss列主元消去法列主元消去法,得得 -1.0410 -1.2613 0.030735拟合的平方误差为拟合的平方误差为三、可线性化的非线性最小二乘拟合三、可线性化的非线性最小二乘拟合 曲线拟合问题的关键在于四点,其一是确定恰当拟合函曲线拟合问题的关键在于四点,其一是确定恰当拟合函数类型这是最重要也是最困难的一点;其二是确定最正数类型这是最重要也是最困难的一点;其二是确定最正确拟合的标准例如最小二乘原理;其三是确定拟合函数确拟合的标准例如最小二乘原理;
12、其三是确定拟合函数中的待定参数利用函数极值理论建立并求解方程组;其中的待定参数利用函数极值理论建立并求解方程组;其四是对拟合效果进行评价如:利用偏差平方和、均方差等四是对拟合效果进行评价如:利用偏差平方和、均方差等。 在前两目的学习中,我们看到最终确定拟合函数中的系在前两目的学习中,我们看到最终确定拟合函数中的系数是利用线性方程组的求解来实现,因此我们将其称作是线数是利用线性方程组的求解来实现,因此我们将其称作是线性最小二乘拟合。假设待定系数确实定需要用到非线性方程性最小二乘拟合。假设待定系数确实定需要用到非线性方程组,那么称为是非线性最小二乘拟合。这类问题由于牵涉到组,那么称为是非线性最小二
13、乘拟合。这类问题由于牵涉到非线性方程组的求解,因此变得有些困难。然而不少非线性非线性方程组的求解,因此变得有些困难。然而不少非线性拟合问题都可以利用某些手段如变量代换将其转化为线拟合问题都可以利用某些手段如变量代换将其转化为线性拟合问题。性拟合问题。例例3:在某化学反响里:在某化学反响里,测得生成物浓度测得生成物浓度y%与时间与时间t的数据如下的数据如下,试建立,试建立y关于关于t的经验公式的经验公式t=1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16y=4.00,6.40,8.00,8.80,9.22,9.50,9.70,9.86,10.00, 10.20,10.
14、32,10.42,10.50,10.55,10.58,10.60解:解:第一步:画出生成物浓度与反响时间的散点图第一步:画出生成物浓度与反响时间的散点图第二步:确定拟合函数类型。作为例题我们直接给出第二步:确定拟合函数类型。作为例题我们直接给出下面两种函数:下面两种函数:(1)指数函数形式)指数函数形式(2)双曲函数形式)双曲函数形式其中,其中,a,b是待定系数是待定系数第三步:确定最正确拟合原那么。这里我们依然采用最小二第三步:确定最正确拟合原那么。这里我们依然采用最小二乘原理。我们以第一种函数类型为例:即确定一组系数乘原理。我们以第一种函数类型为例:即确定一组系数a,b使得使得最小。最小。
15、第四步:利用多元函数极值理论,建立关于待定系数第四步:利用多元函数极值理论,建立关于待定系数a,b的的方程组。方程组。令令即,即, 显然,上面的方程组整理之后,是关于显然,上面的方程组整理之后,是关于a,b的非线性的非线性方程组这就是非线性拟合的含义,这直接导致了方程组这就是非线性拟合的含义,这直接导致了a,b求解的困难。求解的困难。我们考虑用下面的变量代换手段将此问题线性化。我们考虑用下面的变量代换手段将此问题线性化。对于指数函数形式对于指数函数形式在方程两端取对数,在方程两端取对数,作变量代换:作变量代换:得到:得到:,其中,其中A、b是待定系数是待定系数由此我们将由此我们将y与与t的关系
16、转化为的关系转化为Y与与T的关系,利用最小二乘原理的关系,利用最小二乘原理可以得到可以得到A、b的最优解。的最优解。,由此,即,由此,即对于双曲函数形式对于双曲函数形式两边取倒数后再利用变量两边取倒数后再利用变量代换的手段同样可以将问题线性化,请自行完成。代换的手段同样可以将问题线性化,请自行完成。参考解答:参考解答: a=0.0802,b=0.1627,即,即思考:该如何评判两种不同曲线的拟合效果?思考:该如何评判两种不同曲线的拟合效果? 可化为线性拟合问题的常见函数类型可化为线性拟合问题的常见函数类型拟合函数类型拟合函数类型变量代换变量代换线性化的拟合函数线性化的拟合函数四、加权最小二乘曲
17、线拟合四、加权最小二乘曲线拟合我们称其为权重系数。权重值越大,那么认为该数据点越重要。我们称其为权重系数。权重值越大,那么认为该数据点越重要。 定义加权平方误差为定义加权平方误差为可能是不一样的。可能是不一样的。对于一组给定的数据点对于一组给定的数据点,各点的重要性,各点的重要性表示数据点表示数据点的重要程度。的重要程度。假设假设设拟合函数设拟合函数s(x)来自函数类来自函数类即即为拟合系数。为拟合系数。拟合的目标仍然是找一组拟合的目标仍然是找一组使得使得求求的最小值点,的最小值点,可以根据多元函数极值理论,令可以根据多元函数极值理论,令得得即即显然上式是一个关于显然上式是一个关于的的n+1元
18、线性方程组元线性方程组引入记号引入记号定义加权内积定义加权内积上面的上面的n+1阶线性方程组可以表示为阶线性方程组可以表示为矩阵形式矩阵形式(法方程组法方程组)为为作为特殊情形作为特殊情形,用多项式作拟合函数的法方程组为用多项式作拟合函数的法方程组为2 超定方程组的最小二乘解超定方程组的最小二乘解线性方程组线性方程组假设假设mn 方程个数超过未知量个数,这类方程组通常没方程个数超过未知量个数,这类方程组通常没有准确解,称之为超定方程组。在实际中也有重大应用。有准确解,称之为超定方程组。在实际中也有重大应用。超定方程组没有准确解,也就是说任给一组超定方程组没有准确解,也就是说任给一组代入到方程组
19、中后,每个方程左右两边可能都有偏差。代入到方程组中后,每个方程左右两边可能都有偏差。即求即求使得使得最小。最小。满足这一条件的满足这一条件的称为超定方程组的最小二乘解称为超定方程组的最小二乘解原方程组后方程左右两边偏差的平方和最小。原方程组后方程左右两边偏差的平方和最小。我们希望找到一组数我们希望找到一组数,将它代入到,将它代入到即即利用多元函数极值理论,为了求得最小二乘解,只需令利用多元函数极值理论,为了求得最小二乘解,只需令即即将这个将这个n阶线性方程组写成矩阵乘法形式:阶线性方程组写成矩阵乘法形式:例例4:求超定方程组的最小二乘解:求超定方程组的最小二乘解解法一:解法一:令令令令解得:解
20、得:解法二:解法二:令令解得解得3 正交多项式曲线拟合正交多项式曲线拟合 求解线性最小二乘问题的主要困难在于法方程组往往为求解线性最小二乘问题的主要困难在于法方程组往往为病态的,并且阶数越高病态越严重。为了克服这一困难,可病态的,并且阶数越高病态越严重。为了克服这一困难,可以选用适用于病态方程组求解的奇异值分解法等去求解法方以选用适用于病态方程组求解的奇异值分解法等去求解法方程组,也可以通过坐标的平移变换和伸缩变换,降低法方程程组,也可以通过坐标的平移变换和伸缩变换,降低法方程组的病态程度。或者考虑用离散正交多项式进行曲线拟合。组的病态程度。或者考虑用离散正交多项式进行曲线拟合。一、离散正交多
21、项式一、离散正交多项式Def:如果两个多项式:如果两个多项式P(x),Q(x)满足满足则称则称P(x)与与Q(x)在点集在点集上是离散正交的。上是离散正交的。设设是多项式系,其中是多项式系,其中是是k次多项式,如果次多项式,如果则称该多项式系是点集则称该多项式系是点集上的离散正交多项式系。上的离散正交多项式系。二、离散正交多项式系的构造二、离散正交多项式系的构造对于给定的点集对于给定的点集可以按照下列公式构造离散可以按照下列公式构造离散正交多项式系正交多项式系其中其中这样的这样的是首项系数为是首项系数为1的的k次多项式,且该多项式系次多项式,且该多项式系是正交系。(证明:归纳法略)是正交系。(
22、证明:归纳法略)例例5: 试构造点集试构造点集0,1,2,3,4,5上的离散正交多项式系上的离散正交多项式系时使用。过程如下:时使用。过程如下:解:根据上面的两个递推公式进行构造。计算中,在求出每个解:根据上面的两个递推公式进行构造。计算中,在求出每个的同时,将其在所给节点上的值求出,以备求下一个的同时,将其在所给节点上的值求出,以备求下一个三、用正交多项式作最小二乘拟合三、用正交多项式作最小二乘拟合对于给定的数据点对于给定的数据点若拟合函数若拟合函数S(x)的基函数选为正交多项式系的基函数选为正交多项式系即,即,则使得则使得最小的一组系数将是下列法方程组的解:最小的一组系数将是下列法方程组的
23、解:其解显然为其解显然为从而容易得到拟合多项式。从而容易得到拟合多项式。在实际计算中,只要根据递推公式逐步构造在实际计算中,只要根据递推公式逐步构造的同时,的同时,相应地求出拟合多项式中的系数相应地求出拟合多项式中的系数,并逐步把,并逐步把累加到累加到S(x)中去,最后就可得到所求的拟合多项式。中去,最后就可得到所求的拟合多项式。这里拟合多项式的次数这里拟合多项式的次数n可以事先确定,也可以在计算过程可以事先确定,也可以在计算过程中根据误差情况确定。中根据误差情况确定。用这种方法进行多项式曲线拟合,只用递推公式,而不用解用这种方法进行多项式曲线拟合,只用递推公式,而不用解方程组,防止了法方程组
24、病态所造成的麻烦。方程组,防止了法方程组病态所造成的麻烦。例例6.试用最小二乘法求拟合这组数据的多项式试用最小二乘法求拟合这组数据的多项式解解: 从散点图可知从散点图可知数据和二次多项式拟合较好数据和二次多项式拟合较好因此选用二次多项式作因此选用二次多项式作这组数据的拟合函数这组数据的拟合函数设拟合函数设拟合函数取取因此拟合多项式为因此拟合多项式为平方误差为平方误差为一、函数逼近问题的数学提法一、函数逼近问题的数学提法对函数函数类A中给定的函数中给定的函数计算的函数算的函数类B中,求函数中,求函数,使,使与与之差在之差在某种度量意某种度量意义下下最小。最小。,要求在另一类较简单的便于,要求在另
25、一类较简单的便于函数函数类A通常是区通常是区间a,b上的上的连续函数,函数,记作作函数类函数类B通常是代数多项式,分式有理函数或三角多项式。通常是代数多项式,分式有理函数或三角多项式。4 最正确平方逼近最正确平方逼近在前两节中,我们采用的逼近标准原那么是最小二乘原在前两节中,我们采用的逼近标准原那么是最小二乘原理,同时是作用在离散数据点上的函数逼近;这一节我们将理,同时是作用在离散数据点上的函数逼近;这一节我们将选取另外的逼近标准,并且用来逼近复杂或未知函数的类型选取另外的逼近标准,并且用来逼近复杂或未知函数的类型选为多项式函数。选为多项式函数。二、函数逼近的两种常用度量标准二、函数逼近的两种常用度量标准(1)求)求P(x),使,使最小。在这种意义下的函数逼近称为最佳一致逼近。最小。在这种意义下的函数逼近称为最佳一致逼近。(2)求)求P(x),使,使最小。在这种意义下的函数逼近称为最佳平方逼近。最小。在这种意义下的函数逼近称为最佳平方逼近。