数据处理方法

上传人:206****923 文档编号:51944569 上传时间:2018-08-17 格式:PPT 页数:40 大小:522KB
返回 下载 相关 举报
数据处理方法_第1页
第1页 / 共40页
数据处理方法_第2页
第2页 / 共40页
数据处理方法_第3页
第3页 / 共40页
数据处理方法_第4页
第4页 / 共40页
数据处理方法_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《数据处理方法》由会员分享,可在线阅读,更多相关《数据处理方法(40页珍藏版)》请在金锄头文库上搜索。

1、常用实验数据处理方法简介中国人民大学环境学院 张晓军一、数据处理方法综述 实验数据处理的本质:给定一组相互独立 的自变量x1,x2,x3.(xi均为n维向量)和 因变量y(n维向量),找出一个“最佳”的 映射,来刻画自变量和因变量之间的关系 。 关于“最佳”的两种理解:逼近和插值。一、数据处理方法综述 实验数据处理方法的分类: 按照自变量的个数,可分为一元和多元两 大类; 按照映射(函数)形式,可分为线性和非 线性两大类。 于是一共有2*2 = 4大类。二、线性方法 考虑到线性方法已经规定了函数形式为线 性,故在线性方法中,“最佳”的判据只能是 逼近。 按照自变量个数,分为一元线性回归和多 元

2、线性回归。二、线性方法 多元线性回归模型:(1)(2)令其中 为随机误差, , 均为实际问题 的解释变量,是已知函数。 假设作了n次试验得到n组观测值为:二、线性方法代入(2)中可得(3)(其中 为第i次试验时随机误差)该模型关于回归系数 是线性的,u为 一般向量,若用矩阵形式,(3)变为:二、线性方法即二、线性方法其中X是模型设计矩阵,Y与 是随机向量且 , (I为n阶单位阵)是不可观测的随机误差向量, 是回归系数构成 的向量,是未知、待定的常数向量。二、线性方法选取 的一个估计值 使随机误差 的平方和 达到最小二、线性方法 由上式对 求导(向量函数的求导),可 得:由上式(正规方程组)记系

3、数矩阵 ,常数矩阵如果 存在,称其为相关矩阵二、线性方法1.可以证明:对任意给定的X,Y,正规方程组总有 解,虽然当X不满秩时,其解不唯一,但对任意一 组解 都能是残差平方和最小,即 2.当X满秩时,即 则正规方程组的解为 ,即为回归系 数的估计值3.性质二、线性方法 显著性检验与拟合性检验。 主要是检验模型是否一定与解释变量有密 切的关系。 在模型的检验显著的情况下,需要进一步 地做拟合性检验,目的是检验是否一定为 (2)所给的形式,即是否还存在其他的影 响因素没有考虑到。三、非线性方法 理论上来说,对于需要处理的数据,如果 已知所需拟合的函数的形式,那么通常都 可以通过变量替换化成线性方式

4、求解。 那么,为什么要提出非线性方法呢?三、非线性方法 对于非线性方法,与线性方法类似,同样 可以按照自变量的个数分为一元非线性回 归(曲线拟合)和多元非线性回归(曲面 拟合)。(一)曲线拟合 对于曲线拟合,其“最佳”的理解可以有插值 和逼近两种方式。 若按照插值来理解,那么就是数值计算 中的插值法。 若按照逼近来理解,那么就是非线性规 划中的一种特殊的无约束最优化问题 非线性最小二乘法。插值法 Lagrange插值(含线性插值、抛物插值、n 次Lagrange插值公式); 牛顿(Newton)插值及余项、差商的定义 与性质; 埃尔米特(Hermite)插值公式及余项; 等距节点的多项式插值、

5、分段低次多项式 插值、三次样条插值。插值法 插值唯一性定理 证明:利用范德蒙行列式定理:(唯一性) 满足 的 n 阶插值多项式是唯一存在的。插值法 一、解方程组法: 二、基函数法:一种既能避免解方程组, 又能适合于计算机求解的方法,下面将具 体介绍。拉格朗日插值公式 拉格朗日(Lagrange)插值公式的基本思 想是,把pn(x)的构造问题转化为n+1个插 值基函数li(x)(i=0,1,n)的构造。 线性插值函数 抛物插值函数 N次插值函数 一次Lagrange插值多项式 由直线两点式可知,通过A,B的直线方程为 它也可变形为 显然有一次Lagrange插值多项式 记 可以看出: 称 为节点

6、 , 的线性插值 基函数。一次Lagrange插值多项式 线性插值基函数的特点: 节点值; 均为一次函数。 注意她们的特点对下面的推广很重要。二次Lagrange插值多项式 由基函数方法得: 其中:N次Lagrange插值多项式 我们看到,两个插值点可求出一次插值多 项式,而三个插值点可求出二次插值多项 式。从而,当插值点增加到n+1个时,我 们可以利用Lagrange插值方法写出n次插 值多项式。N次Lagrange插值多项式 构造各个插值节点上的基函数 满足如下条件:100001000001N次Lagrange插值多项式 因此令: 又由 ,得:N次Lagrange插值多项式 从而得n 阶拉

7、格朗日(Lagrange)插值公 式:Newton插值 Lagrange插值虽然易算,但若要增加一个 节点时,全部基函数都需要重新计算。 Newton插值的承袭性 增加一个节点后:Hermite插值 在实际问题中,对所构造的插值多项式, 不仅要求函数值重合,而且要求若干阶导 数也重合。 把此类插值多项式称为埃米尔特( Hermite)插值多项式或称带导数的插值 多项式,记为H (x)。 分段插值 高次插值的龙格现象 分段插值。所谓分段插值,就是将被插值 函数逐段多项式化。非线性最小二乘法 从本质上看,非线性最小二乘法就是一种 特殊的无约束最优化问题,因此,所有 非线性规划中关于无约束最优化问题

8、的 算法,理论上都可以直接应用到非线性最 小二乘法问题中。 最速下降法,牛顿法,修正牛顿法,共轭 梯度法,变度量法,Powell方法等一系列 算法都可以用来解非线性最小二乘问题。非线性最小二乘法 但是,由于非线性最小二乘问题的特殊性 ,可以有一些更加行之有效的方法来解。 包括GaussNewton法,Levenberg Marquartdt法等。 仅介绍GaussNewton法。GaussNewton法 Newton法:牛顿法基本思想:利用目标函 数f(x)的二次泰勒展开式,并将其最小化。GaussNewton法(二次近似).如果二阶海赛阵正定,那么存在最小点(方法同上)GaussNewton

9、法说明:实际应用中,迭代方向通过解方程GaussNewton法 GaussNewton法 由于非线性最小二乘问题的特殊性,f(x)的 梯度与黑塞矩阵有更为简洁的表达形式: 如下: 即为Gauss-Newton法。GaussNewton法 GaussNewton法的收敛性: 距离初值偏差大时,收敛效果并不好。 d是下降方向,但仍不能保证f(x)依次减 小。 可以参考修正Newton法,加入一维搜索策 略。(二)曲面拟合 对于“最佳”的理解:逼近 与多元线性回归在原理和形式上较为相似 。根据拟合的曲面在取样处的值与实际值 之差的平方和达到最小求得。 基于最小二乘原理。(二)曲面拟合 详见基于最小二乘的曲面拟合算法研究 。 参考多元线性回归部分的内容,则比较容 易理解。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号