《当问题的机理非常不清楚难以直接利用其他知识来建模时》由会员分享,可在线阅读,更多相关《当问题的机理非常不清楚难以直接利用其他知识来建模时(20页珍藏版)》请在金锄头文库上搜索。
1、 当问题的机理非常不清楚难以直接当问题的机理非常不清楚难以直接利用其他知识来建模时,一个较为自然利用其他知识来建模时,一个较为自然的方法是利用数据的方法是利用数据进行曲线拟合,找出进行曲线拟合,找出变量之间的近似依赖关系即函数关系。变量之间的近似依赖关系即函数关系。经验模型和数据拟合经验模型和数据拟合第三章第三章 经验模型经验模型经验模型经验模型 当问题的机理非常不清楚难以直接利用其它知识来当问题的机理非常不清楚难以直接利用其它知识来建模时,一个常见的方法就是利用已有数据进行曲线拟建模时,一个常见的方法就是利用已有数据进行曲线拟合,合,找出变量之间函数关系的近似表达式,我找出变量之间函数关系的
2、近似表达式,我们称之为经验公式。通过经验公式建立的模们称之为经验公式。通过经验公式建立的模型称为经验模型。型称为经验模型。 经验模型区别于其它类型模型的特点是它的建立不经验模型区别于其它类型模型的特点是它的建立不需要根据问题机理去提出假设,它只是建模者对数据分需要根据问题机理去提出假设,它只是建模者对数据分析所做的经验判断。析所做的经验判断。建模者要首先对照数据特点建模者要首先对照数据特点根据自己的经验判断该函数关系应当用哪类根据自己的经验判断该函数关系应当用哪类函数中的一个来近似表达,两者的偏差不会函数中的一个来近似表达,两者的偏差不会太大。其后,只需在此类函数中找出在某种太大。其后,只需在
3、此类函数中找出在某种意义下偏差最小的一个即可。意义下偏差最小的一个即可。 建立经验模型的一般步骤为:建立经验模型的一般步骤为:(1)(1)将数据画在某坐标系中,观察这些点的分布,将数据画在某坐标系中,观察这些点的分布,根据经验判定哪类函数作为近似表达式较为合适根据经验判定哪类函数作为近似表达式较为合适(2)(2)然后确定函数中的参数,使经验公式与数据的然后确定函数中的参数,使经验公式与数据的相符性在某种意义下最好相符性在某种意义下最好(3)(3)最后,对公式做试用检验,考察其造成的误差最后,对公式做试用检验,考察其造成的误差是否在可接受的范围内,若不能接受,则需要修是否在可接受的范围内,若不能
4、接受,则需要修正经验公式,重新建模。正经验公式,重新建模。 建立经验公式较为常用的方法有最小二建立经验公式较为常用的方法有最小二乘法和插值方法。乘法和插值方法。( (最小二乘法)最小二乘法)假设经过测量得到的假设经过测量得到的n n组数据列表如下:组数据列表如下:0123456727.026.826.526.326.125.725.324.8 将这些数据画在平面直角坐标系中,见散点图将这些数据画在平面直角坐标系中,见散点图2-102-10。从图上可看出,这些点的分布大致在一条直。从图上可看出,这些点的分布大致在一条直线附近,于是我们根据经验判断线附近,于是我们根据经验判断y=y=f(xf(x)
5、 )是线性函数,是线性函数,并设并设f(x(x)=)=ax+bax+b,其中,其中a,ba,b 为待定常数。为待定常数。图图3-13-1常数常数a,ba,b如何选定呢?我们当然希望如何选定呢?我们当然希望 经过所有的经过所有的数据点,即对于每个数据点,即对于每个 ,能有,能有 ,但此式一,但此式一般是不成立的般是不成立的 我们只能要求我们只能要求 与与 的偏差的偏差 , ,都都很小。那么所有偏差之和很小。那么所有偏差之和 最小能否保证每个最小能否保证每个偏差都很小呢?显然不行,因为偏差有正有负,求和时有偏差都很小呢?显然不行,因为偏差有正有负,求和时有可能会互相抵消从而将偏差掩盖起来。若要求偏
6、差的绝对可能会互相抵消从而将偏差掩盖起来。若要求偏差的绝对值之和值之和 很小的话,虽然可以避免这种相互很小的话,虽然可以避免这种相互抵消,但函数不具备连续的导函数,不利于进一步的讨论。抵消,但函数不具备连续的导函数,不利于进一步的讨论。为避免上述两种情况的产生,我们一般都采用以误差的平为避免上述两种情况的产生,我们一般都采用以误差的平方和方和 达到最小的方法来保证总体偏差较小。达到最小的方法来保证总体偏差较小。这种选择参数这种选择参数a a、b b的方法叫做最小二乘法。的方法叫做最小二乘法。 是一个二元函数,由多元微积分知是一个二元函数,由多元微积分知识,为使它取到最小,只需令其对变量、的一阶
7、偏识,为使它取到最小,只需令其对变量、的一阶偏导数均为零,解相应的二元一次方程组即可,据此,导数均为零,解相应的二元一次方程组即可,据此,不难求得:不难求得:其中其中 例例1 1 (刀具的更换)(刀具的更换)用自动化机床连续加工某零件,由于刀具损坏等原因会生用自动化机床连续加工某零件,由于刀具损坏等原因会生产出次品,但实际情况是,当发现刀具已坏时,利用这把产出次品,但实际情况是,当发现刀具已坏时,利用这把坏刀具也许已经生产了若干个次品。如果我们能在平时生坏刀具也许已经生产了若干个次品。如果我们能在平时生产中留意一下,掌握刀具磨损的规律,在其坏掉之前就将产中留意一下,掌握刀具磨损的规律,在其坏掉
8、之前就将它更换下来,也许可以减少因出次品而造成的损失。为此,它更换下来,也许可以减少因出次品而造成的损失。为此,我们做了这样一个实验,每隔一小时,测量一次刀具的厚我们做了这样一个实验,每隔一小时,测量一次刀具的厚度,得到后面表格中的数据,其中度,得到后面表格中的数据,其中 :刀具使用时间(单位:小时):刀具使用时间(单位:小时) :刀具厚度(单位:毫米)。:刀具厚度(单位:毫米)。 Xi01234567Yj27.026.826.526.326.125.725.324.8经拟合,我们可得经验公式经拟合,我们可得经验公式为为 ,其图形见图,其图形见图2-112-11。假如我们发现在刀具。假如我们发
9、现在刀具的厚度为的厚度为10mm10mm时损坏的概率极大,那么我时损坏的概率极大,那么我们只需令们只需令 ,得,得 ,即当刀具,即当刀具使用了近使用了近5656个小时之后,刀具的厚度将变为个小时之后,刀具的厚度将变为10mm10mm。因此我们可以考虑使用刀具因此我们可以考虑使用刀具5555或或5656个小时后更新个小时后更新刀具(注:这里我们没有考虑更换刀具的费用。刀具(注:这里我们没有考虑更换刀具的费用。如果刀具较为昂贵,还应求解一个优化问题),如果刀具较为昂贵,还应求解一个优化问题),已确定怎样做可以使总费用最省。已确定怎样做可以使总费用最省。图图3-23-2例例2 2 (地高辛的使用)(
10、地高辛的使用) 地高辛是用来治疗心脏病的一种药物。医生在开处方地高辛是用来治疗心脏病的一种药物。医生在开处方时必须写明用药量,要便保持血液中地高辛的浓度,使之时必须写明用药量,要便保持血液中地高辛的浓度,使之既高于有效水平以保持药效,又不至于超过安全用药水平既高于有效水平以保持药效,又不至于超过安全用药水平而导致危险,为此,医生必须研究地高辛在血液中的衰减而导致危险,为此,医生必须研究地高辛在血液中的衰减率。假定地高辛在血液中的初始剂量为率。假定地高辛在血液中的初始剂量为0.5mg0.5mg(毫克),(毫克),经过检测得到下表的数据如下:经过检测得到下表的数据如下: 表表3 3X X0 01
11、12 23 34 45 56 67 78 8Y Y 0.5000.5000.3450.3450.2380.2380.1640.1640.1130.1130.0780.0780.0540.0540.0370.0370.0260.026 其中其中x x表示使用初始剂量之后的天数,而则表示某特表示使用初始剂量之后的天数,而则表示某特定病人血液中剩余的地高辛含量。根据表中的数据,我们定病人血液中剩余的地高辛含量。根据表中的数据,我们想建立想建立y y与之与之x x间的关系。间的关系。 将上述数据点画在将上述数据点画在x-yx-y平面上,(如图平面上,(如图2-122-12所示)显所示)显然这些点并不在
12、任何一条直线的附近,不能使用我们前述然这些点并不在任何一条直线的附近,不能使用我们前述的最小二乘法,但根据经验,这些数据好像在一条指数函的最小二乘法,但根据经验,这些数据好像在一条指数函数图形的附近,因此我们考虑是否用指数函数来拟合数图形的附近,因此我们考虑是否用指数函数来拟合y y与与x x之间的关系之间的关系 对对y y取对数得取对数得 对照表:对照表: 表表4 4 0 01 12 23 34 45 56 67 78 8-0.693-0.693-1.064-1.064-1.435-1.435-1.808-1.808-2.180-2.180-2.551-2.551-2.919-2.919-3
13、.297-3.297-3.650-3.650图图3-33-3 再将数据画在再将数据画在x xy y平面上,如图平面上,如图2-132-13所示,所示,这次你就会发现这些点几乎就分布在一条直线的这次你就会发现这些点几乎就分布在一条直线的附近了,令这条直线的方程为附近了,令这条直线的方程为 ,并用最,并用最小二乘法求得小二乘法求得 , , 故可令故可令 , ,即即 ,此,此即我们希望得到的关系式。此方程图形与原散点即我们希望得到的关系式。此方程图形与原散点图的对照图可见图图的对照图可见图2-142-14。若地高辛的有效水平为。若地高辛的有效水平为0.0055mg,0.0055mg,令令0.0055
14、0.0055得得12.1612.16。因此我们考虑服药。因此我们考虑服药1212天之后补充药物。天之后补充药物。图图3-43-4图图3-53-5 最小二乘法的使用需要对各种常用函数的图形有大致最小二乘法的使用需要对各种常用函数的图形有大致的了解,也需要一定的技巧,如例的了解,也需要一定的技巧,如例2.22.2中对中对y y取对数后取对数后x x与与 构成线性关系。有时,需要对构成线性关系。有时,需要对x x、y y均取对数值得到新的数均取对数值得到新的数据据 ;观察新的数据点是否满足线性关系,若满;观察新的数据点是否满足线性关系,若满足用最小二乘拟合为足用最小二乘拟合为 ,即,即 来拟合,来拟
15、合,此时此时y y是是x x的幂函数。有时也需要对、之一取倒数值或二者的幂函数。有时也需要对、之一取倒数值或二者均取倒数值得到新的数据均取倒数值得到新的数据 观察新的数据点是否近似满足线性关系,假如基本满观察新的数据点是否近似满足线性关系,假如基本满足再用线性函数拟合。足再用线性函数拟合。 我们希望建立一个我们希望建立一个 体重体重与与身高身高之间的关系式,不难看出两者之间的关系式,不难看出两者之间的关系不易通过机理的分析得出,不妨可以采取之间的关系不易通过机理的分析得出,不妨可以采取 统计统计方法方法,用数据来拟合出与实际情况较为相符的经验公式。,用数据来拟合出与实际情况较为相符的经验公式。
16、 为为此,我们先作一番抽样调查,测量了十五个不同高度的人的此,我们先作一番抽样调查,测量了十五个不同高度的人的体重,列成了体重,列成了 下表,在抽样时,各高度的人都需经适当挑选,下表,在抽样时,各高度的人都需经适当挑选,既不要太胖也不要太瘦。既不要太胖也不要太瘦。将表中的数画将表中的数画 到到h-w平面上,你会发现这些数据分布很接近某平面上,你会发现这些数据分布很接近某一指数曲线。为此,一指数曲线。为此, 对对h和和w均取对数,令均取对数,令x=lnh,y=lnw,将将(xi,yi)再画到再画到x-y平面中去(平面中去(i=1,15),),这次你会发现这这次你会发现这些点几乎就分布在一条直线附
17、近,令此直线的些点几乎就分布在一条直线附近,令此直线的 方程为方程为y=ax+b,用最小二乘法求用最小二乘法求 得得a2.3,b2.82,故可取故可取y=2.32x+2.84,即,即lnw=2.32lnh+2.84,故有故有w=17.1h2.327566595451体重体重 w(公斤)公斤)1.851.781.711.671.63身高身高 h(米)米)5048413527体重体重 w(公斤)公斤)1.601.551.511.351.26身高身高 h(米)米)2017151210体重体重 w(公斤)公斤)1.121.080.960.860.75身高身高 h(米)米)例例3 体重与身高的体重与身高
18、的 关系关系 比如,若比如,若 满足线性关系满足线性关系 ,则原先的变量,则原先的变量x x、y y满足双曲函数满足双曲函数 如果的数据点如果的数据点 明显地分布在一条抛物线附近,我明显地分布在一条抛物线附近,我们还可以用二次函数去拟合曲线,采用最小二乘法,我们们还可以用二次函数去拟合曲线,采用最小二乘法,我们类似可以导出求参数类似可以导出求参数a a 、 b b、c c的公式,但公式较为复杂,的公式,但公式较为复杂,好在现在许多数学软件中均有专用的最小二乘拟合命令,好在现在许多数学软件中均有专用的最小二乘拟合命令,利用这些命令,几乎可以拟合所有类型的函数,我们所做利用这些命令,几乎可以拟合所
19、有类型的函数,我们所做的只是输入数据点和想要的拟合函数类型表达式,马上就的只是输入数据点和想要的拟合函数类型表达式,马上就可以得到结果,这给我们带来了很大的便利。可以得到结果,这给我们带来了很大的便利。(插值法)(插值法) 在使用最小二乘法时,我们并未要求得到的拟合曲线在使用最小二乘法时,我们并未要求得到的拟合曲线一定要经过所有的样本点,而只是要求总偏差最小。然而,一定要经过所有的样本点,而只是要求总偏差最小。然而,当实际问题(如某地区人口统计)要求拟合曲线必须经过当实际问题(如某地区人口统计)要求拟合曲线必须经过样本点时,我们则一般选取多项式函数让其通过这些点,样本点时,我们则一般选取多项式
20、函数让其通过这些点,但在样本点数量较多时,这样的曲线有可能弯曲得太多,但在样本点数量较多时,这样的曲线有可能弯曲得太多,解决的方法就是将样本点就近分组,对每一分组用较低次解决的方法就是将样本点就近分组,对每一分组用较低次数的多项式来近似表示,即使用分段插值法。普通插值法数的多项式来近似表示,即使用分段插值法。普通插值法的使用有可能使曲线在连接点处出现尖角,导致数学上的的使用有可能使曲线在连接点处出现尖角,导致数学上的不可导(不光滑)现象。根据实际问题的不同需要,可采不可导(不光滑)现象。根据实际问题的不同需要,可采用只要求过样本点的拉格朗日插值法、牛顿插值法等,也用只要求过样本点的拉格朗日插值法、牛顿插值法等,也可以采用既要求过插值点(即样本点)又对插值点处的导可以采用既要求过插值点(即样本点)又对插值点处的导数有所要求的样条(数有所要求的样条(SplineSpline)插值,甚至还有对插值曲线)插值,甚至还有对插值曲线的凹凸性也有要求的的凹凸性也有要求的B B样条插值法。样条插值法。 本书不准备详细介绍这些细致的插值方法,只是提请本书不准备详细介绍这些细致的插值方法,只是提请读者注意,在建立经验模型时,插值法也是可以使用的数读者注意,在建立经验模型时,插值法也是可以使用的数学工具之一。对插值法感兴趣的读者可以查阅相关书籍。学工具之一。对插值法感兴趣的读者可以查阅相关书籍。