高分二号数据的城市生态用地分类方法探讨

资源描述

《高分二号数据的城市生态用地分类方法探讨》由会员分享，可在线阅读，更多相关《高分二号数据的城市生态用地分类方法探讨（10页珍藏版）》请在金锄头文库上搜索。

1、高分二号数据的城市生态用地分类方法探讨王芳杨武年邓晓宇任金铜成都理工大学地学空间信息技术国土资源部重点实验室内江师范学院地理与资源科学学院摘要：针对传统分类法分类精度低、速度慢等问题, 同时也为了探索国产卫星高分二号遥感数据在城市生态用地分类中的方法及效果, 及时获取其生态用地信息, 该文以四川省内江市隆昌县城区为研究范围, 提出了一种辅以影像光谱特征和纹理特征信息的随机森林分类方法。该方法提取城市生态用地信息, 并将其分类结果与传统的支持向量机分类、最大似然分类进行对比, 结果表明, 新方法具有更高的分类精度和更快的分类速度, 更适合高分辨率、多特征参数、大面积的高分二号遥

2、感影像城市生态用地分类。关键词：高分二号; 随机森林; 生态用地; 分类方法; 作者简介：王芳 (1983) , 女, 河南周口人, 讲师, 博士, 主要研究方向为3S 技术与数字国土研究.E-mail:作者简介：杨武年, 教授, E-mail:收稿日期：2017-01-19基金：国家自然基金项目 (41372340, 41671432) Discussion on urban ecological land classification method based on GF-2 dataWANG Fang YANG Wunian Deng Xiaoyu Ren Jintong Key La

3、boratory of Geo-spatial Information Technology , Ministry of Land and Resources of the P.R.C., University of Technology; Abstract： Aiming at the problems of low precision and slow speed of traditional classification, in order to explore the method and effect of domestic satellite high grade remote s

4、ensing data in urban ecological land classification, and obtain its ecological land information in time, this paper puts forward a random forest classification method based on the urban area of Longchang county, Sichuan province, supplemented by image spectral feature and texture feature information

5、. This method extracts urban ecological land information, and compares the classification results with the traditional support vector machine classification and maximum likelihood classification. The results show that the new method has higher classification accuracy and faster classification speed,

6、 more suitable for high resolution, multi-feature parameters, large area of urban ecological land classification.Keyword： GF-2; random forest (RF) ; urban ecological land; classification method; Received： 2017-01-190 引言随着经济快速发展, 我国确立了生态文明发展目标和新型城镇化发展战略, 如何在保障城市生态需求的同时, 实现环境与城市化发展的和谐共赢, 是目前亟待解决的问题1。在

7、此背景下, 获取城市生态用地准确详细信息, 无论对城市景观生态系统建设还是对城市土地管理分析来说, 都具有重大意义2。2014年 8 月 19 日, 高分二号 (GF-2) 卫星发射成功, 星下点空间分辨率可达 0.8 m, 标志着我国遥感卫星进入了亚米级“高分时代”。GF-2 数据以其更丰富的空间信息和更明显的纹理特征在进一步扩展城市生态用地分类数据源的同时, 也提高了其分类精度。国内外专家学者在过去几十年一直专注于遥感数据分类技术和方法研究, 从监督与非监督分类到应用广泛的支持向量机、神经网络与专家决策系统等3。但由于传统分类方法精度低、数据冗余等缺点存在, 很多学者探索了集成学习与多分类

8、器系统, 并将其引入分类。随机森林 (random forests, RF) 是近年来集成分类中应用较广泛的一种, 在三多 (多光谱、多时相、多源) 、高光谱及高分辨率遥感数据分类中, 随机森林具有速度快、精度高及稳定性好等优点4-8。当前, 国产卫星数据应用于城市遥感是新的探索, 且基于 GF-2 遥感数据应用于城市遥感的研究较少, 其在城市生态用地分类的实际效果有待深入探索和验证。基于 GF-2 数据, 采用加入光谱和纹理特征 RF 分类方法提取研究区生态用地, 参照经验, 将其分为 5 种类型2, 即植被、建筑物、道路、水体和裸地, 将分类结果与传统支持向量机 (support vect

9、or machine, SVM) 分类与最大似然分类 (maximum likelihood, ML) 进行对比分析, 探讨该分类方法在高分辨率国产卫星分类中的可行度, 以期推进 GF-2 数据分类新方法的产生, 扩展其在城市遥感中的应用, 为解决生态用地规划建设、土地管理等方面做出贡献。1 研究方法与原理1.1 随机森林算法原理随机森林最先由布赖曼 (Breiman) 于 2001 年提出9-10, 它是基于多个决策树集成分类器。其核心是由随机化变量 (列) 和数据 (行) 生成很多分类树, 再对分类树的结果进行汇总。随机森林对多元线性公式不敏感, 对于缺失数据和非平衡数据性能比较稳健, 可

10、对多达几千个解释变量作用进行较好地预测, 是目前最好算法之一。具体实现过程如下: (1) 采用自举法重采样技术从原始训练集 N 中抽取 n 个样本, 作为决策树的输入样本; (2) 在每棵树每个节点处, 从特征变量 M 中随机抽取 m 个样本作为预测变量, 然后从中选择最具分类能力的变量, 变量分类的阈值决定于每一个分类点; (3) 每棵树最大限度生长, 不作任何修剪; (4) 将生成的分类树构成随机森林, 对新数据采用随机森林分类器进行判别与分类, 分类结果由投票而定。利用 RF 对遥感影像分类, 训练样本一定时, 影响分类精度的主要因素有两个: (1) 决策树数量, 该值决定了随机森林投票

11、数和准确度。 (2) 生成每棵决策树随机选取的属性特征数, 该值大小关系到构建出的决策树能力强弱以及决策树之间的相关性。随机森林的优点为: (1) 两个随机性的引入使随机森林不易陷入过拟合, 且有很好的抗噪性; (2) 可以处理高维度数据, 无需特征选择, 对数据集适应能力强, 且数据集无需规范化; (3) 可生成一个 Proximities 矩阵, 度量样本间相似性; (4) 在随机森林创建时, 对产生的误差进行无偏估计; (5) 训练速度快, 可以得到变量重要性排序 (基于 OOB 误分率的增加量和基于分裂时 GINI 下的降量) ; (6) 训练过程中能检测到特征变量间的互相影响; (7

12、) 容易做成并行化方法, 对于缺失数据和非平衡的数据性能比较稳健。1.2 支持向量机分类算法原理文献11于 1995 年提出支持向量机, 它是基于统计学习理论 VC 维理论和结构风险模型最小原理的机器学习方法, 其基本思想是采用非线性变换方法, 使输入空间转换到高维空间, 使样本线性可分, 再求得最佳分类面。选取适当核函数是 SVM 的关键。线性核函数、多项式核函数、Sigmoid 核函数、径向基核函数和复合核函数是常用核函数。研究表明12, 径向基核函数分类精度最高。SVM 能通过有限样本信息在学习精度和效果之间寻求最佳平衡来获取最优推广性。SVM 方法经改进后, 在处理小样本、非线性问题及

13、高维模式识别中, 具有独特优势, 在遥感影像处理领域应用广泛, 如高光谱与土地利用类型分类、图像融合等。SVM 寻求最佳分类面理念与 RF 边缘最大化思想具有相似性。1.3 最大似然法分类算法原理最大似然法是常用的监督分类方法, 其基本思想是统计模式识别理论13。它根据每个像元相对于各类的似然度, 将该像元分到最大似然度的类别中。最大似然法假定训练区地物光谱特征和自然界大部分随机现象一样, 以正态分布为前提, 按贝叶斯判别准则, 利用统计方法训练样本来构建非线性判定原则, 根据训练区特征参数求出概率密度函数进行分类。ML 在样本增大时收敛性较好, 与其他方法相比, 具有操作简单、计算迅速, 在

14、遥感分类中应用广泛11-12等特点。ML 方法使待分类数据与各类样本空间统计中心尽可能接近, 这与 RF 边缘最大化思想有根本区别。2 测试数据与实验2.1 研究区概况与数据源隆昌县位于四川盆地东南部、川渝交界处、内江市最南端。该区地处川东褶皱带向西南延伸尾部, 地势起伏不大, 呈北高南低趋势。境内有平坝、浅丘、高丘、低山 4 种地貌类型, 该区属亚热带湿润季风区, 气候温和、降雨量充足、光热充沛、无霜期长。研究区位于隆昌县城区, 经纬度范围为 10515E10519E, 2920N2922N, 面积为 6.10 km (见图 1) 。本研究以 GF-2 影像为主要数据源, 该影像数据包括 4

15、个多光谱波段, 分辨率为4 m, 一个全色波段, 分辨率为 1 m, 获取时间为 2015 年 7 月 12 日;其他数据包括分辨率为 30 m 的 DEM 数据、2015 年 7 月实地调查数据和同年土地利用数据。图 1 研究区示意图 Fig.1 GF-2 Image of the Study Area 下载原图2.2 软件平台与数据预处理本研究利用 ENVI 和 En Map-Box 软件对数据进行处理, En Map-Box 是基于 IDL语言开发的遥感处理工具箱, 可免费获取。它集成了很多机器学习分类算法, 可对遥感数据进行分类、回归分析和精度评定。利用 ENVI 软件对 GF-2

16、影像进行预处理, 使用 RPC 文件和 DEM 数据分别对多光谱及全色影像进行正射纠正、再进行几何配准;采用 Gram-Schmidt 方法进行图像融合, 融合后分辨率为 1 m;最后进行快速大气校正。根据遥感影像特点和研究目标, 结合实际调查数据及2015 年土地利用数据, 参考相关研究, 将生态用地类型分为建筑用地、道路、水体、植被及裸土 5 类。2.3 辅以特征信息 RF 分类方法2.3.1 特征变量提取实验为提高 RF 分类精度, 在原始影像和研究区特征基础上, 提取特征参数对原始影像波段进行扩充, 构建多源特征影像数据。这些特征参数包括光谱和纹理特征, 其中, 光谱特征主要有植被指数、波段灰度值、亮度等。纹理信息提取方法有4 种, 即统计分析法、结构法、信号处理及模型法14-15。灰度共生矩阵是统计分析法的一种, 对于影像灰度统计特征具有较好体现。研究表明4-6, 加入纹理信息对提高遥感数据分类精

展开阅读全文