wordenvi遥感图像监视分类监视分类,又称训练分类法,用被确认类别的样本像元去识别其他未知类别像元的过程它就是在分类之前通过目视判读和野外调查,对遥感图像上某些样区中影像地物的类别属性有了先验知识,对每一种类别选取一定数量的训练样本,计算机计算每种训练样区的统计或其他信息,同时用这些种子类别对判决函数进展训练,使其符合于对各种子类别分类的要求,随后用训练好的判决函数去对其他待分数据进展分类使每个像元和训练样本作比拟,按不同的规如此将其划分到和其最相似的样本类,以此完成对整个图像的分类遥感影像的监视分类一般包括以下6个步骤,如如下图所示:详细操作步骤第一步:类别定义/特征判别根据分类目的、影像数据自身的特征和分类区收集的信息确定分类系统;对影像进展特征判断,评价图像质量,决定是否需要进展影像增强等预处理这个过程主要是一个目视查看的过程,为后面样本的选择打下根底启动ENVI5.1,打开待分类数据:can_tmr.img以R:TM Band 5,G: TM Band 4,B:TM Band 3波段组合显示通过目视可分辨六类地物:林地、草地/灌木、耕地、裸地、沙地、其他六类第二步:样本选择〔1〕在图层管理器Layer Manager中,can_tmr.img图层上右键,选择"New Region Of Interest",打开Region of Interest (ROI) Tool面板,下面学习利用选择样本。
1〕在Region of Interest (ROI) Tool面板上,设置以下参数:ROI Name:林地ROI Color:2〕默认ROIs绘制类型为多边形,在影像上区分林地区域并单击鼠标左键开始绘制多边形样本,一个多边形绘制完毕后,双击鼠标左键或者点击鼠标右键,选择plete and Accept Polygon,完成一个多边形样本的选择;3〕同样方法,在图像别的区域绘制其他样本,样本尽量均匀分布在整个图像上;4〕这样就为林地选好了训练样本注:1、如果要对某个样本进展编辑,可将鼠标移到样本上点击右键,选择Edit record是修改样本,点击Delete record是删除样本2、一个样本ROI里面可以包含n个多边形或者其他形状的记录〔record〕3、如果不小心关闭了Region of Interest (ROI) Tool面板,可在图层管理器Layer Manager上的某一类样本〔感兴趣区〕双击鼠标〔2〕在图像上右键选择New ROI,或者在Region of Interest (ROI) Tool面板上,选择工具重复"林地"样本选择的方法,分别为草地/灌木、耕地、裸地、沙地、其他5类选择样本;〔3〕如如下图为选好好的样本。
〔4〕计算样本的可别离性在Region of Interest (ROI) Tool面板上,选择Option>pute ROI Separability,在Choose ROIs面板,将几类样本都打勾,点击OK;〔5〕表示各个样本类型之间的可别离性,用Jeffries-Matusita, Transformed Divergence参数表示,这两个参数的值在0~2.0之间,大于1.9说明样本之间可别离性好,属于合格样本;小于1.8,需要编辑样本或者重新选择样本;小于1,考虑将两类样本合成一类样本注:1、在图层管理器Layer Manager中,可以选择需要修改的训练样本2、在Region of Interest (ROI) Tool面板上,选择Options > Merge (Union/Intersection) ROIs,在Merge ROIs面板中,选择需要合并的类别,勾选Delete Input ROIs 图2.4 Merge ROIs面板〔6〕在图层管理器中,选择Region of interest ,点击右键,save as,保存为.xml格式的样本文件注:1、早期版本的感兴趣文件格式为.roi,新版本的为.xml,新版本完全兼容.roi文件,在Region of Interest (ROI) Tool面板上,选择File>Open打开.xml或.roi文件。
2、新版本的.xml样本文件〔感兴趣区文件〕可以通过,File>Export>Export to Classic菜单保存为.roi文件第三步:分类器选择根据分类的复杂度、精度需求等确定哪一种分类器目前ENVI的监视分类可分为基于传统统计分析学的,包括平行六面体、最小距离、马氏距离、最大似然,基于神经网络的,基于模式识别,包括支持向量机、模糊分类等,针对高光谱有波谱角〔SAM〕,光谱信息散度,二进制编码下面是几种分类器的简单描述· 平行六面体〔Parallelepiped〕根据训练样本的亮度值形成一个n维的平行六面体数据空间,其他像元的光谱值如果落在平行六面体任何一个训练样本所对应的区域,就被划分其对应的类别中· 最小距离〔Minimum Distance〕利用训练样本数据计算出每一类的均值向量和标准差向量,然后以均值向量作为该类在特征空间中的中心位置,计算输入图像中每个像元到各类中心的距离,到哪一类中心的距离最小,该像元就归入到哪一类· 马氏距离〔Mahalanobis Distance〕计算输入图像到各训练样本的协方差距离〔一种有效的计算两个未知样本集的相似度的方法〕,最终技术协方差距离最小的,即为此类别。
· 最大似然〔Maximum Likelihood〕假设每一个波段的每一类统计都呈正态分布,计算给定像元属于某一训练样本的似然度,像元最终被归并到似然度最大的一类当中· 神经网络〔Neural Net〕指用计算机模拟人脑的结构,用许多小的处理单元模拟生物的神经元,用算法实现人脑的识别、记忆、思考过程· 支持向量机〔Support Vector Machine〕支持向量机分类〔Support Vector Machine或SVM〕是一种建立在统计学习理论〔Statistical Learning Theory或SLT〕根底上的机器学习方法SVM可以自动寻找那些对分类有较大区分能力的支持向量,由此构造出分类器,可以将类与类之间的间隔最大化,因而有较好的推广性和较高的分类准确率· 波谱角〔Spectral Angle Mapper〕它是在N维空间将像元与参照波谱进展匹配,通过计算波谱间的相似度,之后对波谱之间相似度进展角度的比照,较小的角度表示更大的相似度影像分类基于传统统计分析的分类方法参数设置比拟简单,在Toolbox/Classification/Supervised Classification能找到相应的分类方法。
这里选择支持向量机分类方法在toolbox中选择/Classification/Supervised Classification/Support Vector Machine Classification,选择待分类影像,点击OK,按照默认设置参数输出分类结果图2.5 支持向量机分类器参数设置图2.6 支持向量机分类结果第五步:分类后处理包括更改类别颜色、分类后统计、小斑块处理、栅矢转换等,这局部专门有一节课讲解在此不做表示第六步:精度验证对分类结果进展评价,确定分类的精度和可靠性有两种方式用于精度验证:一是混淆矩阵,二是ROC曲线,比拟常用的为混淆矩阵,ROC曲线可以用图形的方式表达分类精度,比拟抽象真实参考源可以使用两种方式:一是标准的分类图,二是选择的感兴趣区〔验证样本区〕两种方式的选择都可以通过主菜单->Classification->Post Classification->Confusion Matrix或者ROC Curves来选择真实的感兴趣区验证样本的选择可以是在高分辨率影像上选择,也可以是野外实地调查获取,原如此是获取的类别参考源的真实性由于没有更高分辨率的数据源,本例中就把原分类的TM影像当作是高分辨率影像,在上面进展目视解译得到真实参考源。
〔1〕在Data Manager中,分类样本上右键选择Close,将分类样本从软件中移除〔2〕直接利用ROI工具,跟分类样本选择的方法一样,即重复第二步,在TM图上选择6类验证样本注:可直接File>open,打开can_tm-验证样本.roi〔3〕在Toolbox中,选择/Classification/Post Classification/Confusion Matrix Using Ground Truth ROIs,选择分类结果,软件会根据分类代码自动匹配,如不正确可以手动更改点击OK后选择报表的表示方法〔像素和百分比〕,点击OK,就可以得到精度报表图2.8 验证操作面板下面对混淆矩阵中的几项评价指标进展说明:· 总体分类精度等于被正确分类的像元总和除以总像元数被正确分类的像元数目沿着混淆矩阵的对角线分布,总像元数等于所有真实参考源的像元总数,如本次精度分类精度表中的Overall Accuracy = (1849/2346) 78.8150%· Kappa系数它是通过把所有真实参考的像元总数〔N〕乘以混淆矩阵对角线〔XKK〕的和,再减去某一类中真实参考像元数与该类中被分类像元总数之积之后,再除以像元总数的平方减去某一类中真实参考像元总数与该类中被分类像元总数之积对所有类别求和的结果。
Kappa计算公式· 错分误差指被分为用户感兴趣的类,而实际属于另一类的像元,它显示在混淆矩阵里面本例中,林地有419个真实参考像元,其中正确分类265,12个是其他类别错分为林地〔混淆矩阵中林地一行其他类的总和〕,那么其错分误差为12/419=2.9%· 漏分误差指本身属于地表真实分类,当没有被分类器分到相应类别中的像元数如在本例中的耕地类,有真实参考像元465个,其中462个正确分类,其余3个被错分为其余类〔混淆矩阵中耕地类中一列里其他类的总和〕,漏分误差为3/465=0.6%· 制图精度是指分类器将整个影像的像元正确分为A类的像元数〔对角线值〕与A类真实参考总数〔混淆矩阵中A类列的总和〕的比率如本例中林地有419个真实参考像元,其中265个正确分类,因此林地的制图精度是265/419=63.25%· 用户精度是指正确分到A类的像元总数〔对角线值〕与分类器将整个影像的像元分为A类的像元总数〔混淆矩阵中A类行的总和〕比率如本例中林地有265个正确分类,总共划分为林地的有277,所以林地的用户精度是265/277=95.67%注:监视分类中的样本选择和分类器的选择比拟关键在样本选择时,为了更加清楚的查看地物类型,可以适当的对图像做一些增强处理,如主成分分析、最小噪声变换、波段组合等操作,便于样本的选择;分类器的选择需要根据数据源和影像的质量来选择,比如支持向量机对高分辨率、四个波段的影像效果比拟好。
非监视分类非监视分类:也称为聚类分析或点群分类在多光谱图像中搜寻、定义其自然相似光谱集群的过程它不必对影像地物获取先验知识,仅依靠影像上不同类地物光谱(或纹理) 信息进展特征提取,再统计特征的差异来达到分类的目的,最后对已分出的各个类别的实际属性进展确认目前比拟常见也较为成熟的是ISODATA、K-Mean和链状方法等遥感影像的非监视分类一般包括以下6个步骤:图16 非监视分类操作流程 目前非监视分类器比拟常用的是ISODATA、K-Mean和链状方法ENVI包括了ISODATA和K-Mean方法1、影像分析大体上判断主要地物的类别数量一般监视。