关于提高回归模型准确性的研究

上传人:龙*** 文档编号:122080332 上传时间:2020-02-29 格式:DOC 页数:18 大小:391KB
返回 下载 相关 举报
关于提高回归模型准确性的研究_第1页
第1页 / 共18页
关于提高回归模型准确性的研究_第2页
第2页 / 共18页
关于提高回归模型准确性的研究_第3页
第3页 / 共18页
关于提高回归模型准确性的研究_第4页
第4页 / 共18页
关于提高回归模型准确性的研究_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《关于提高回归模型准确性的研究》由会员分享,可在线阅读,更多相关《关于提高回归模型准确性的研究(18页珍藏版)》请在金锄头文库上搜索。

1、关于提高回归模型准确性的研究鉴于相同季节时段气溶胶颗粒物的物理特性和化学特性有相似性,而且考虑到气象要素对雷达观测值的影响,为了提高回归模型的准确性,我们可以对一组数据进行回归分析得到回归模型并用于其他年份相同季节时段内颗粒物体积浓度和有效粒子半径的反演。颗粒物的粒径随着颜色比的增加而增加,而形状的规则程度随着退偏振比的增加而降低,所以为了提高回归模型的准确性,我们在建立回归模型时可以将颗粒物的大小和形状这两个因素考虑进去,把颜色比或退偏振比划分为不同的区间,对颜色比(退偏振比)在同一区间内的部分数据进行多元回归分析得出回归模型,然后将同一区间内其他数据代入回归模型中反演出颗粒物体积浓度和有效

2、粒子半径,并与太阳光度计测得的数据进行对比分析。3.1 不同月份的回归模型本文中,我们分别选用1月、2月、10月、11月、12月的一部分数据进行统计回归分析得出回归模型,然后将相应月份的其他数据分别代入回归模型反演颗粒物体积浓度和有效粒子半径,再与太阳光度计所测得的数据进行对比。选取12月的50组数据进行偏最小二乘法回归分析后得到颗粒物体积浓度的回归模型。在剩余数据中选取五十组数据代入回归模型中计算出体积浓度n,与太阳光度计测得的体积浓度进行对比分析后结果如图3.1.1所示: 图3.1.1 上图中经回归模型反演得到的颗粒物体积浓度n与太阳光度计测得的体积浓度的线性为0.943,图中大部分数据比

3、较集中且横纵坐标基本无差异。除一部分数值较大的数据反演结果不理想,其他数据反演结果较好。用同样的方法得到的有效粒子半径的对比分析结果如图3.1.2所示: 图3.1.2上图显示结果不太理想,一部分经反演得到的粒子有效半径与太阳光度计所测得的粒子有效半径相比较偏差较大,所以将样本容量改为100,再次用偏最小二乘法进行回归分析。在剩余数据中选取100组数据代入相应的回归模型中,计算出有效粒子半径,并与太阳光度计测得的有效粒子半径进行对比分析。 图3.1.3如图3.1.3所示,选取样本容量为100时所得到的回归模型反演出的有效粒子半径与太阳光度计测得的数据较接近,大概是因为前50组样本有效粒子半径在各

4、数域区间内分布不均匀,使反演结果与太阳光度计测量数据相比较差异大。综上所述,我们得到12月份的回归模型如下式:n=0.014+0.196x1+0.639x2-3.824x3re=0.371-0.377x1+6.713x2-0.541x3(其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。)取1月的50组数据进行偏最小二乘法回归分析,得到颗粒物体积浓度函数表达式和粒子有效半径的回归模型,在剩余数据中取五十组数据代入回归模型中,与太阳光度计测得的相应的数据比较分析得到的结果如图3.1.5所示: 图3.1.4由上图可以看出无论是对颗粒物体积浓度还是对粒子有效半径的反演都是比较好的,除

5、了个别数据偏差较大,大部分点的横坐标和纵坐标相差不大。得出1月的回归模型如下式:n=-0.079+0.119x1+1.939x2-0.063x3re=0.187-0.371x1+6.019x2-3.676x3(其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。) 图3.1.5用同样的方法对2月的数据进行处理,得到的结果如图3.1.5所示。上图中对颗粒物体积浓度的反演结果较好,而对有效粒子半径的反演结果较差,部分数据反演结果与实际值相比偏小。得出2月的回归模型如下式:n=0.014-0.018x1+1.348x2+16.052x3re=0.654-0.413x1+2.842x2+

6、17.521x3(其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。) 图3.1.6用同样的方法对10月的数据进行处理,得出的结果如图3.1.6所示。上图中对颗粒物体积浓度的反演一般,横纵坐标差异较为明显;而对有效粒子半径的反演较好,误差较小。得出10月份的回归模型如下式:n=-0.023+0.067x1+1.040x2+4.090x3re=0.176+0.035x1+2.953x2+10.892x3(其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。) 图3.1.7图3.1.7为11月颗粒物体积浓度以及有效粒子半径的对比分析图,从图中可以看出对颗粒物体积浓度的

7、反演较好,除个别数据偏差较大外,大部分数据都比较集中;而对有效粒子半径的反演较差,部分数据反演结果偏小。 得出11月份的回归模型如下式: n=0.046+0.075x1+0.607x2-4.994x3 re=0.322-0.049x1+0.603x2+17.971x3(其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。)3.2 不同颜色比区间的回归模型将2009年10月至2011年3月的激光雷达数据的颜色比划分为00.5、0.51.0、1.0三个区间。从颜色比在00.5之间的激光雷达数据中取出50个数据进行回归分析,得出回归模型后代入同一颜色比区间内的其他50组数据对颗粒物体积

8、浓度和粒子有效半径进行反演,得出结果后与太阳光度计测得的数据进行比较分析,最终得到回归模型。用同样的方法也可以得到颜色比区间为0.51.0以及颜色比大于1.0时的回归模型。图3.2.1为当颜色比在00.5之间时,用回归模型反演的颗粒物体积浓度和有效粒子半径与太阳光度计测得的数据比较分析得出的结果。 图3.2.1 从上图中可以看出颗粒物体积浓度的反演结果较好,点较集中且除了个别点外大多数点的横纵坐标相差不大,而有效粒子半径的反演结果一般,虽然在回归分析中我们尝试改变样本容量来提高回归模型的准确性,但得出的回归模型的准确性并没有随着样本容量的增加而提高。在对颜色比进行升序处理后,由于在此颜色比区间

9、内的数据较少且前几组数据之间颜色比递增快,使回归分析中选择的样本数据的颜色比跨度大不集中,这种情况增加了建立回归模型的难度且降低了反演结果的准确性。得出颜色比00.5的回归模型如下式:n=-0.015+0.061x1+1.001x2-0.386x3re=0.225+0.814x1+1.177x2+0.541x3 (其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。) 从颜色比为0.51.0的区间中选取部分数据进行回归分析得出回归模型后,再将这一颜色比区间内的其余数据代入回归模型中反演出颗粒物体积浓度与有效粒子半径,与相应的太阳光度计测得的结果进行对比得到的结果如图3.2.2所示

10、: 图3.2.2上图中对颗粒物体积浓度和有效粒子半径的反演结果都比较好,在两幅图中点的分布都较为集中且大部分数据横纵坐标偏差较小。得出颜色比0.51.0的回归模型如下式:n=0.081-0.179x1+1.684x2+0.283x3re=-2.187+3.723x1+4.660x2+2.083x3 (其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。) 图3.2.3图3.2.3为颜色比大于1时回归模型得出的结果与太阳光度计测得的数据的比较分析图。从图中可以看出除了对一部分颗粒物体积浓度较大的数据的反演结果不太理想,其他大多数数据横纵坐标偏差不大;在反演有效粒子半径时除了个别数据

11、的反演结果与观测值差异较大,其他数据的横纵坐标差异不大。得出颜色比大于1的回归模型如下式:n=0.034-0.245x1+3.106x2+1.672x3re=0.903-1.087x1+4.734x2+7.960x3 (其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。)3.2 不同退偏比区间的回归模型我们将颜色比划分为00.1和0.1两个区间,分别对这两个区间内的数据进行回归分析。对2009年10月至2011年3月的数据进行退偏比排序后,发现大部分数据集中在退偏比为00.1的区间内,所以我们抽取两组样本进行回归分析,得出回归模型后分别代入50组数据对颗粒物体积浓度和有效粒子半

12、径进行反演,再与太阳光度计所测得的数据进行对比。 图3.3.1图3.3.1为退偏比区间为00.1时,通过处理第一组样本数据得出回归模型,再代入相应退偏比区间内的其他数据对颗粒物体积浓度和有效粒子半径进行反演,得出结果后与太阳光度计测得数据的对比分析图。从图中可以看出无论是对颗粒物体积浓度的反演还是有效粒子半径的反演,除个别数据误差较大外大部分数据的反演结果还是比较好的。得出退偏比00.1的回归模型如下式:n=-0.048+0.166x1+0.870x2+0.541x3re=0.390-0.639x1+11.741x2-4.243x3 (其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散

13、射系数。) 用相同的方法对第二组样本数据进行处理后得到的结果如图3.3.2所示: 图3.3.2从图中可以看出对颗粒物体积浓度的反演不太理想,部分数据比较离散,而对有效粒子半径的反演结果较好,除了个别数据误差较大,大部分数据都比较集中且横纵坐标差异不大。得出退偏比00.1的回归模型如下式:n=0.023+0.152x1-0.277x2+0.301x3re=0.994-0.521x1-4.654x2-0.475x3 (其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。) 图3.3.3 图3.3.3为退偏比区间0.1时,回归模型得到的结果与太阳光度计测得数据的对比分析图,从图中可以看出,在对颗粒物体积浓度的反演结果中有两组数据误差较大,而其他数据反演结果较好。在反演有效粒子半径时除少数数据横纵坐标偏差较大,大部分数据都较为集中且误差小。得出退偏比大于0.1的回归模型如下式:n=0.033-0.042x1+1.305x2+2.379x3re=-0.593-0.748x1+15.893x2+4.040x3 (其中x1、x2和x3分别代表颜色比、退偏正比以及消光后向散射系数。)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 大学论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号