1-2资料预处理和时序分析方法

上传人:简****9 文档编号:111718433 上传时间:2019-11-03 格式:PPT 页数:37 大小:710KB
返回 下载 相关 举报
1-2资料预处理和时序分析方法_第1页
第1页 / 共37页
1-2资料预处理和时序分析方法_第2页
第2页 / 共37页
1-2资料预处理和时序分析方法_第3页
第3页 / 共37页
1-2资料预处理和时序分析方法_第4页
第4页 / 共37页
1-2资料预处理和时序分析方法_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《1-2资料预处理和时序分析方法》由会员分享,可在线阅读,更多相关《1-2资料预处理和时序分析方法(37页珍藏版)》请在金锄头文库上搜索。

1、第一篇 海洋要素资料获取与常规处理方法,第一章 资料获取 第二章 数据处理和表示 第三章 资料的预处理 第四章 时间序列典型分析方法,2019/11/3,2,第三章 资料的预处理,3.1 序列的预处理 平滑与滤波 3.2 空间场资料的客观分析法 一、客观分析的概念 二、客观分析常用的插值方法 三、逐步订正客观分析法,2019/11/3,3,数值计算: 网格化小扰动(短波) 易导致非线性计算不稳定; 资料分析:误差&干扰 (短波),3.1 序列的预处理:平滑与滤波,消除方法 (1)把物理量场用波谱方法展开,舍弃不需要的波,把其他波合成以代替原来的场,运算量较大。 (2)通过平滑运算,用其计算结果

2、代替原来的物理量场。,空间场:1.一维的情形 2.二维的情形 3.波带的过滤 时间序列: 一维平滑,2019/11/3,4,1.一维空间数据的平滑,初始值,平滑值,三点加权平均,对2倍网格距的波能彻底滤去。但对波长较长的波,如=10x,,则R0.9,衰减不大,对于某一波长L0以下的波,能较彻底地滤去,而较长的波则无大变化,可采用不同S值,连续进行平滑运算。,2019/11/3,5,2.二维空间场的平滑,衰减系数,五点平滑,2019/11/3,6,3.波带的过滤(离散波长),要滤去的不仅是一个波,而是一个波带,如波长为2x和3x的波,这时2x,3x的波都滤去了,但对4x的波(R21/6),衰减得

3、太厉害,如果既要滤去波长为3x以下的波,又要保留4x以上的波,则可采用恢复波幅的方法, 进行四次平滑,对4x波,R45/12,比R2的情形恢复得多了,2019/11/3,7,4.时间序列平滑:一维平滑,平滑后使波幅减小,但不影响f的位相。当T=2t时,R=0;T=4t时,R=0.5,这种方法可滤去由于蛙跳格式产生的周期为2t左右的计算波,并消减高频波,2019/11/3,8,实际资料:离散的、不规则的观测资料 需要的资料:规则的网格点资料, 数值模拟的初始场或验证场、诊断分析的背景场。,3.2 空间场资料的客观分析法,通过某种算法将不规则的原始数据换算到规则的经纬网格点上的方法称之为客观分析方

4、法。,一、客观分析的概念,客观分析方法与数学插值的差异,插值要求数据量足够大,且测站分布要较均匀,一般的插值方法在数据稀少的条件下应用是不可能的。 插值方法对数据的反应很敏感,个别错误数据会造成较大范围的偏差。 客观分析要以一定的物理依据为出发点。,从数学的角度出发,客观分析可以看成是一个插值问题,但又不能完全纯粹的当数学插值问题来处理,二者之间存在一定的差异。,Kriging插值、反距离加权、Delaunay三角剖分线性插值、双谐样条插值和Cressman插值等空间内插方法,二、常用的客观分析方法,改进的多项式法:利用最小二乘法求得插值多项式的系数,这种方法要求数据量较多且均匀,同时计算量也

5、较大 多元最优插值法:用统计方法在均方误差最小意义下的最优线性插值,适用于三维多因素的客观分析 逐步订正法:以观测数据间的统计特性为依据的一种方法,计算量很小,数据量和分布状态对方法本身没有什么影响,可以适用于海洋数据的现状,三、客观分析方法常用的插值函数,2019/11/3,11,Kriging法是从变量相关性和变异性出发,在有限区域内对空间变量进行无偏、最优估计的一种统计方法; 从插值角度上讲,Kriging法以空间结构分析为基础,充分利用数据空间场的性质,在插值过程中对空间数据求线性最优,可以反映空间场的各向异性。 该法的最佳适用条件是空间变量存在着空间相关性。 主要步骤是: 1) 对空

6、间场进行结构分析。在充分了解空间数据场性质的前提下,建立空间变量的协方差函数,提出变异函数模型(常用的有球面、指数、高斯、阻尼正弦、线形等模型); 2) 在该模型的基础上进行克里格计算,求得距离相关量。 优点在于它基于一些可验证的统计假设,具有坚实的理论基础。因此,Kriging方法产生的格点的变量的估计量是最佳的,所有的估计量都依赖于可获得的观测值,这些估计量的平均误差最小。另外,Kriging方法提供的方差误差分析的表达式可以表示每一个格点上变量的估计精度,而且也不会产生回归分析的边界效应。 缺点是复杂,计算量大,变异函数需要根据经验人为选定。,1、Kriging插值,2019/11/3,

7、12,2、加权平均插值,加权平均的普适公式:,权重W的三种形式:,Cressman插值 Segal 和 Pielke(1981)客观分析方法中采用的形式 Barnes(1964)提出,2019/11/3,13,3种形式权重的特性(取R=100 km) :,2019/11/3,14,反距离加权法 幂次参数控制着权重系数随距离增加的衰减程度。,Z 是估计值,Zi 是第 i 个样本;Di 是距离,p 是幂次,它显著影响内插的结果,其选择标准是使平均绝对误差最小。当采样点与网格点重合时,该网格点被赋予和观测点一致的值,因此这是一个准确插值。它的特征之一是会在网格区域内产生围绕观测点位置的“靶心”。,的

8、一般形式反距离加权法,四、基于Cressman插值函数的逐步订正客观分析方法,物理依据:一个站点的物理量变化值与其附近站点的物理量变化值相关较好,距离越远,二者相关越差,到一定距离处相关为0。 主要思路:没有观测资料站点上的物理量变化值应由观测点的物理量变化值和与距离有关的权重来决定。权重函数采用Cressman插值函数。 具体做法:先给定第一猜测场(预备场、背景场),然后用实际观测场逐步修正第一猜测场,直到订正后的场逼近观测记录为止。,逐步订正实际上是一种反复加权修正的方法。 一次逐步订正的作法是:,先给定第一猜测场,然后用实际观测场逐步修正第一猜测场,直到订正后的场逼近观测记录为止。,其中

9、, 表示变量,上标new, old, obs, k分别表示订正后、订正前、观测、台站,下标表示空间格点; 表示第k个台站对格点(i,j)的订正权重系数,N表示台站总数。 , 是观测误差, 是背景误差(诊断地面风场误差)。 表示台站观测值, 由 插值到观测点上。,详细讲解(一次逐步订正):,Step1: 给定第一猜测场 ,用Cressman/线性插值方法将规则格点 值插到观测点上,得到 。,R=Rgrid,Step2: 在观测点找出观测值(黑点)与由规则格点得到“观测值”(蓝点)的差距,R=Robs,Step3:用Cressman方法将差距值 (绿点) 插到规则网格上(得到蓝点),关于,必是小数

10、,一般取1/11,如果有充足统计数据,它是一个场。,观测误差/背景误差,重复刚才的过程,,一般重复34次 Rgrid依次从大到小变化,而Robs一般不变化! 当每完成一次订正后,获得一个物理量的场检验在观测点上的误差是否满足要求。否则,将Rgrid缩小,修正权函数后,再进行下一次订正。经过n次订正后,观测点上的观测值与订正后的值满足精度要求,认为没有观测资料的网格点的订正值也大致符合实际的物理量场,逐步订正结束,给出最后的客观场。,2019/11/3,22,第四章 时间序列典型分析方法,海洋水文要素的时间序列的处理方法包括很多,如付氏分析、调和分析、谱分析、小波分析、数字滤波等。,4.2 功率

11、谱分析 4.1 随机动态分析方法,2019/11/3,23,4.2 功率谱分析,把时间序列分成若干频率分量的合成,用于提取要素变化的显著周期。 常用的有单因子的自谱分析、两个变量之间的交叉谱分析和矢量谱分析等。,海洋中的时间序列总是离散的而且长度是有限的,即T=Nt 。离散的功率谱值可由Fourier变换的形式给出,频率 fk 被限定在Nyquist频率间隔之间,即-fN fk fN,一、自谱分析,单侧谱 双侧谱,4个月,6个月,12个月,35个月,2019/11/3,25,流或风矢量时间序列的矢量谱矢量分解成两个垂直方向上的分量,如东分量u和北分量v(或纬、经向分量) 把特定频率的流矢量分解

12、成这样两个分量:顺时针旋转的振幅为A-、相对相角为-的分量和逆时针旋转的振幅为A+、相对相角为+的分量。 优点: 1) 可以揭示特定频率上波动场的重要特征;诸如地形剧烈变化处的海流、风生的大洋内区运动、全日周期的陆架波以一些范围较小的振荡流动; 2) 许多情况下,旋转分量的某个分量(通常,北半球的顺时针分量,南半球的逆时针分量)占优。如,北半球的惯性运动几乎都是顺时针旋转,因此在多数应用中逆时针分量可以忽略。,二、旋转矢量谱分析,2019/11/3,26,两个相反方向旋转的圆矢量的矢量和会导致合成矢量的倾斜,构成一个封闭的椭圆。椭圆的偏心率是由两个分量的相对振幅决定的。某个分量为零时,频率的运

13、动将退化成一个方向的运动,如果两个极向分量幅度相同,那么运动将变成往复式运动。,两个旋转方向相反的旋转矢量(a、b)合成的流椭圆 (主轴方向为正东向逆时针旋转),2019/11/3,27,每一个频率分量都是椭圆形式:长半轴 、短半轴 、椭圆的倾角、矢量出现最大值(即沿椭圆长轴)的时刻。,实线和虚线分别对应着顺时针和逆时针旋转的谱值 全日和半日处有两个谱峰。半日周期处顺时针旋转运动占优,北冰洋Beaufot海40m深度上海流观测资料的旋转谱,2019/11/3,28,旋转系数 r =-1对应着顺时针旋转,r=0为不旋转, r=1为逆时针旋转。,旋转系数(a,全日分潮;b, 半日分潮) (Alle

14、n 和 Thomson, 1993),流动的旋转特性随着位置、深度和时间而变化,2019/11/3,29,三、交叉相关系数 (相关分析),交叉相关函数给出的是时间域里两个序列的相关程度。,X的离差平方和:,Y的离差平方和 :,X、Y的离差乘积和:,相关系数 r:,2019/11/3,30,Y(t)观测值;T(t)趋势项;P(t)周期项;X(t)剩余随机序列;(t)白噪声序列。,4.1 随机动态分析方法,随机动态分析的目的:找出序列中确定性部分和随机性部分的具体表达形式,可对原始数据进行分析、拟合、预报。,对寻找短序列的周期,最大熵谱方法更能显示出优越性,在低频段的周期分辨上,最大熵谱方法也较一

15、般的谱方法更为准确。,确定性部分模型,趋势部分T(t) :线性拟合 周期性部分P(t): 利用功率谱和最大熵谱法寻找周期; 周期显著性检验:F-检验,考虑到趋势性部分和周期性部分相互影响,将线性趋势和周期求出后,将原始数据中的周期部分去掉,求出剩余数据中的趋势项,将这一趋势项代回原始数据中,从中去掉该趋势项,这样得到的数据将比上一次的数据更接近平稳的要求,对这一序列进行周期分析,从而可以得到较上次更理想的周期。这种过程可以继续下去,直到求周期时的序列通过平稳性检验。,2019/11/3,32,残差序列的检验,平稳性,正态性,峰度系数,偏度系数,宽平稳序列 平稳性:均值和方差为常数,协方差函数只

16、与时间间隔有关,通常只有正态序列才能用时间序列的线性模型去拟合;而要建立ARMA模型必须满足正态性要求。,剩余随机序列模型,独立性,模型残量的自相关检验法,2019/11/3,34,设y与x1,x2,xm变量存在相关关系,且m个变量之间也不是彼此独立的。现在我们要研究其中某个变量xi与y的相关关系,应先分别去掉xi以外的其它m-1个变量对xi的影响,以及m-1个变量对y的影响,然后按简单相关系数的定义来研究xi与y之间的相关关系,称为偏相关系数,自相关系数和偏相关系数的拖尾和截尾性质,高阶AR(P)序列能近似描述ARMA序列,随机序列模型初步识别,拖尾是自相关系数或者偏相关系数趋向于0,这个趋向过程有不同的表现形式,有几何型的衰减为0,有正弦波式的衰减;截尾是指从

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号