空间数据分析－金锄头文库

资源描述

《空间数据分析》由会员分享，可在线阅读，更多相关《空间数据分析（184页珍藏版）》请在金锄头文库上搜索。

1、第五章第五章空间数据分析空间数据分析l空间数据分析，也称空间分析，是分析空间数据的技术的通称l空间数据的空间特征分析：从空间对象的形态、位置、关系等角度去分析空间数据，从中获取空间信息和规律l属性特征分析：着重研究空间对象的属性特征点点线线面面一、空间对象的特征值一、几何形态一、几何形态点-线-面-体4类空间对象各自具有不同的几何形态，可以用评价指标来衡量：点：坐标，高程（或其他要素值）线：长度，方向，曲率面：面积，形状，边界长度，朝向体：体积，坡度，坡向，剖面1.1.长度长度矢量数据：点对坐标（x,y）或（x,y,z）的序列在不考虑比例尺的情况下，线长度的计算公式为：栅格数据：线状地物

2、的长度就是累加地物骨架线通过的格网数目，骨架线采用8方向连接，当连接方向为对角线方向时，还要乘以。2.曲率曲率：就是针对曲线上某个点的切线方向角对弧长的转动率，通过微分来定义，表明曲线偏离直线的程度。数学上表明曲线在某一点的弯曲程度的数值。曲率越大，表示曲线的弯曲程度越大。曲率的倒数就是曲率半径。 3.面积矢量数据：面状地物是以其轮毂边界弧段构成的多边形表示的，对于没有空洞的简单多边形，设面状物体的轮廓边界由一个点的序列P1 (x1 , y1), P2 ( x2, y2 ), ，Pn (xn, yn)表示，其面积为:SS1S2有环岛的有环岛的面状地物面状地物面积计算面积计算面积面积4.形状目

3、标物的外观是多变的，很难找到一个准确的量对其进行描述。基本考虑：空间完整性、多边形形状特征空间完整性、多边形形状特征。当把城市作为单个面状目标看待时，可以直接使用面状目标的形状系数，如形状率、圆形率、紧凑度等,这些指标计算较简单，但只反映一个抽象的形状；当把城市作为面状目标的集合看待时，可以使用放射状放射状指数、标准面积指数指数、标准面积指数等形状系数，这些指标计算较复杂，但反映了城市内部的具体联系。在多数指标中，都以圆形作为城市的标准形状。形状比=A/L2 其中，A为区域面积，L为区域最长轴的长度。该指标能反映城市的带状特征，城市的带状特征越明显则形状比越小。显然，如果城市为狭长带状分布，

4、其长轴两端的联系是不便捷的。1）形状比(FORMRATIO)伸延率=L/ L 式中，L为区域最长轴长度，L为区域最短轴长度。该指标反映城市的带状延伸程度，带状延伸越明显则延伸率越大，反映城市的离散程度越大。 2）伸延率(ELONGATIONRATIO)紧凑度有三个不同的计算公式。公式1：紧凑度=其中，A为面积，P为周长。该指标反映城市的紧凑程度，其中圆形区域被认为最紧凑，紧凑度为1。其它形状的区域，其离散程度越大则紧凑度越低。3）紧凑度(COMPACTNESSRATIO)圆U=1U1紧缩型其中，A为区域面积，A为该区域最小外接圆面积。该指标同样认为圆形区域最紧凑，其紧凑度为1。在计算中采用

5、最小外接圆面积作为衡量城市形状的标准。公式2：紧凑度指数=A/A其中，L为最长轴长度，A为区域面积。该指标也认为圆形为标准形状，但它只考虑最长轴长度，只能概略地反映城市形状。公式3：紧凑度=1.273A/L2放射状指数有两个不同的计算公式，较常使用的计算公式为：放射状指数= 式中，di 是城市中心到第i地段或小区中心的距离，n为地段或小区数量。这一指标不单纯是从抽象的形状入手，而是综合了城市内部各小区的位置特征。通过距离（可以结合时间、阻力等线路因素）反映城市中心与区内各部分之间的具体联系。4）放射状指数(RADIALSHAPEINDEX)式中：S为标准面积指数；A为区域面积；As为与区

6、域面积相等的等边三角形面积。标准面积指数能反映城市形状的破碎程度。城市形状越破碎，则其与等边三角形的交集越小而并集越大，所以其比值越小。不过，通常认为圆才是真正的紧凑形状，而并不是等边三角形。5）标准面积指数5.坡度和坡向坡度：水平面与局部地表之间夹角的正切值，包含斜度（高度变化的最大值比率，常称为坡度）和坡向（变化比率最大值的方向）u影响到地区的稳定度及水流速度；u坡度的缓急可以从等高线的疏密程度判知；(1)等高线较疏的地区，地势较平坦；(2)等高线较密集的地区，则地势较陡峭；(3)当许多等高线密集在一起时，则表示该地为悬崖峭壁。坡度的表示方法有百分比法、度数法、密位法和分数法四种，其中以百

7、分比法和度数法较为常用。(1) 百分比法表示坡度最为常用的方法，即两点的高程差与其水平距离的百分比，其计算公式如下：坡度 (高程差/水平距离)100%(2) 度数法用度数来表示坡度，利用反三角函数计算而得，其公式如下：tan(坡度) 高程差/水平距离所以(坡度) tan-1 (高程差/水平距离)6.剖面积地形剖面图，可以以线带面概括研究区域的地势、地质和水文特征等。二、空间分布1.空间分布类型空间分布反映的是同类空间事物的群体定位信息，特定分布区域中的分布对象是单一性质的。空间对象按空间实体的几何形态划分为点、线、面，不同的空间分布对象具有不同的空间分布特征，并且具有各自相应的空间分布参数

8、，下面分别对点、线、面的不同空间分布及其描述参数进行讨论。分布区域点线面离散连续离散连续离散连续线江河里的船只，公路上的汽车，路旁分布的加油站街道两旁的林荫树河流上的防护堤坝，城市街道的林荫道、公汽路线面城镇的分布，火山的分布降水河网，交通网，地图上的边界线污染的扩散大气运动湖泊的分布，居民区中楼房的分布人口普查区域，行政区划2.分布密度指单位分布区域内的分布对象的数量，是两个比率尺度数据的比值。举例：1.某地区汽车加油站的密度加油站数/总公里路程2.某地区森林覆盖率森林面积/地区总面积3.某省人口密度人口数/该省总面积4.某地区交通网密度交通网总长度/区域总面积5.城市商业网点密度商业网点数

9、/城区总面积6.某河流沿岸防护堤建筑比率防护堤总长度/河岸总长度3.质心质心可概略表示分布总体的位置,是目标保持均匀分布的平衡点，可通过对目标坐标值加权平均求得。计算公式：设pi(i=1,2,n)的权重分别为W(Pi),则：其中：xi,yi为i个离散点的坐标 n为目标个数4.点模式点模式的空间分布是一种比较常见的状态，如不同区域内的人口、房屋、城市分布，油田区的油井分布等。通常，点模式的描述参数有分布密度、分布中心、分布轴线、离散度等。均匀分布随机分布聚集分布三种点模式点群类型指标均一点模式是根据均一的子区域之间的关系定义的，这种子区域称为较大区域的样方。如果每个均一的样方包含相同数量的

10、点对象，则整个研究区分布具有均一性，这种检验分布性的标准型方法称为样方分析，即假设每个子区域存在的对象数量大致相等，那么可以计算所有数据点个数与子区域个数的比值，得到每个子区域内平均对象的个数，只要它具备均一分布的特征，这个数值就是期望分布值。用简单的x2数学检验法对这些数据进行估计，其公式表示为Q每个样方中实际观测到的点数；E每个样方中期望的分布值。1）样方的统计量X2最近邻分析是一种分析点位置关系的点模式分析法，通常分为顺序法和区域法两种方法。无论是哪种方法，它分析过程的中心思想都是先测出每点与其最近点间的距离，然后将量测值与所测距离的均值进行比较。这种统计方法仅涉及计算每对最近点间距离的

11、平均值，平均最近邻距离提供了空间分布中点之间距离的量度或点之间的距离指数。由于点对象之间距离太近会发生冲突，因此，最近邻分析在动物个体与种群的活动习性研究中具有很高的利用价值，如猴子是一种群居动物，不同群组的猴子都有自己的活动范围，它们的空间绝不允许其他猴群的侵犯；老虎、狮子这些个体活动的猛兽，也都拥有自己的生活区域，它们在这一定的范围内猎食、休息，而不会去侵犯其他同类的活动范围，也绝不允许被别人干扰。2）最近邻指数R5.网络测度指标对于任何一个网络图，都存在着三种共同的基础指标：连线（边或弧）数目m；结点（顶点）数目n；网络中亚图的数目p。由它们可以产生如下几个更为一般性的测度指标：p

12、指数p回路数kp指数p指数指数实际回路数与网络内可能存在的最大回路数之间的比率。网络内可能存在的最大回路数目为连线的最大可能数目减去最低限度连接的连线数目，即所以，指数为指数也可以用百分率表示1）指数指数的变化范围，一般介于0，1区间， 0意味着网络中不存在回路； 1，说明网络中已达到最大限度的回路数目。对于非平面网络，其指数为指数线点率，是网络内每一个节点的平均连线数目。 =0，表示无网络存在；网络的复杂性增加，则值也增大。没有孤立点存在的网络，连线数目为n- p,则指数为如果地理网络不包含次级亚图，即P1，则其最低限度连接的指数值为。 2）指数指数网络内连线的实际数目与连线可能存

13、在的最大数目之间的比率，对于平面网络，其计算公式为：指数是测度网络连通性的一种指标，其数值变化范围为0，1。 0，表示网络内无连线，只有孤立点存在；1，则表示网络内每一个节点都存在与其它所有节点相连的连线。指数也可以用百分比表示3) 指数指数二、空间关系分析u邻近度分析u网络分析u叠置分析1.邻近度分析邻近度（Proximity）描述了地理空间中两个地物距离相近的程度度，其确定是空间分析的一个重要手段。交通沿线或河流沿线的地物有其独特的重要性，公共设施的服务半径，大型水库建设引起的搬迁，铁路、公路以及航运河道对其所穿过区域经济的发展的重要性等，军是一个邻近度问题。缓冲区分析是解决邻近度问题的

14、空间分析工具之一。1）距离2）缓冲区分析缓冲区是指为了识别某一地理实体或空间物体对其周围地物的影响度而在其周围建立的具有一定宽度的带状区域。缓冲区分析则是对一组或一类地物按缓冲的距离条件，建立缓冲区多边形，然后将这一图层与需要进行缓冲区分析的图层进行叠置分析，得到所需结果的一种空间分析方法。缓冲区分析适用于点、线或面对象，如点状的居民点、线状的河流和面状的作物区等。邻域半径R即缓冲距离（宽度），是缓冲区分析的主要数量指标，可以是常数或变量。空间对象还可以生成多个缓冲带。（a）不同宽度缓冲区干流支流（b）环状缓冲区（a）单点形成的缓冲区（b）点群形成的缓冲区（c）分级点形成的缓冲区点形成

15、的缓冲区形式点要素的缓冲区矢量数据缓冲区的建立方法线要素的缓冲区线形成的缓冲区形式（a）单线形成的缓冲区（b）多线形成的缓冲区（c）分级线形成的缓冲区面要素的缓冲区面形成的缓冲区形式（a）单一面形成的缓冲区（b）多个面形成的缓冲区（c）分级面形成的缓冲区栅格数据的缓冲区分析通常称为推移或扩散（Spread），推移或扩散实际上是模拟主体对邻近对象的作用过程，物体在主体的作用下沿着一定的阻力表面移动或扩散，距离主体越远所受到的作用力越弱。栅格数据缓冲区的建立方法缓冲区实现有两种基本算法：矢量方法和栅格方法。矢量方法使用较广，产生时间较长，相对比较成熟，具体的几何算法是中心线扩张法，又称加

16、宽线法或图形加粗法，通过以中心轴线为核心做平行曲线，生成缓冲区边线，再对生成边线求交、合并，最终生成缓冲区边界。栅格方法以数学形态学扩张算法为代表，采用由实体栅格和八方向位移L得到的n方向栅格像元与原图作布尔运算来完成，由于栅格数据量很大，特别是上述算法运算量级很大，当L较大时实施有一定困难，且距离精度也尚待提高。2.网络分析网络分析是通过研究网络的状态以及模拟和分析资源在网络上的流动和分配情况，对网络结构及其资源等的优化问题进行研究的一种空间分析方法。网络分析的理论基础是图论和运筹学。在地理信息系统中，网络分析功能依据图论和运筹学原理，在计算机系统软硬件的支持下，将与网络有关的实际问题抽象

17、化、模型化、可操作化，根据网络元素的拓扑关系（线性实体之间、线性实体与结点之间、结点与结点之间的连结、连通关系），通过考察网络元素的空间、属性数据，对网络的性能特征进行多方面的分析计算，从而为制定系统的优化途径和方案提供科学决策的依据，最终达到使系统运行最优的目标。网络模型在城市之间建立通讯网络，使其中任意两个城市之间都在城市之间建立通讯网络，使其中任意两个城市之间都有直接或间接的通讯联系，假设已知每两个城市之间通讯线有直接或间接的通讯联系，假设已知每两个城市之间通讯线路的成本，要求找出一个成本最低的通讯网络。路的成本，要求找出一个成本最低的通讯网络。31城市城市1城市城市2679城市城市3

18、城市城市4城市城市576548（a）通讯网络问题中的数据（b）一个最小成本通讯网络用图形描述通讯网络问题31城市城市1城市城市26城市城市3城市城市4城市城市54（1 1）图）图图论中的“图”是指由点集合V和V中点与点之间的连线的集合E构成的二元组（V, E）。V 中的元素称为结点，E 中的元素称为边。图论中所研究的图是由实际问题抽象出来的逻辑关系图，图中点和线的位置与曲直无关紧要，点的多少和每条线是连接哪些点才是关键。图的结构ABCDe3e4e5e1e2e6e7两个端点重合的边称为环。如果有两条边的端点是同一对顶点，则称这两条边为重边既没有环也没有重边的图，称为简单图。如果图中的边是有向的，

19、则称为有向图，其中的边叫做弧在无向图中，首尾相接的一串边的集合叫做路。在有向图中，顺向的首尾相接的一串边的集合叫做有向路如果一个图中，任意两个结点之间都存在一个路，则称之为连通图。起点和终点为同一个结点的路称为回路（或圈）。如果一个连通图中不存在任何回路，则称为树。任意一个连通图，去掉一些边后形成的树叫做连通图的生成树。 u给定一个图，图中的每一条边赋以一个实数，称这种数为边的权数，称这种图为赋权图。u赋以权数的有向图称为赋权有向图，也可称之为网络。u根据需要赋权有向图中的一条边，必要时可以赋以多个权值，另外也可以给结点赋权，称为点权网络，相对于点权网络，给边赋权的网络称为边权网络。u在机器实

20、现中，邻接矩阵表示法、关联矩阵表示法、邻接表表示法是用来描述图与网络常用的方法。V2V0V1100V3V5V46020301010505带权的有向图邻接矩阵邻接矩阵用来表示图中任意两点间的邻接关系及其权值。如果两点间有一条弧，则邻接矩阵中对应的元素为 1；否则为 0（也可用表示两点间无任何连接关系），邻接矩阵为对称矩阵。对于加权图的邻接矩阵表示，一条弧所对应的元素不再是1，而是相应的权值。 24（a）有向图153（b）邻接矩阵0110000010010000010100110有向图及其邻接矩阵（2 2）邻接矩阵与）邻接矩阵与关联矩阵关联矩阵关联矩阵关联矩阵中，每行对应图的一个节点，每列对

21、应图的一条弧。如果一个节点是一条弧的起点，则关联矩阵中对应的元素为1；如果一个节点是一条弧的终点，则关联矩阵中对应的元素为1；如果一个节点与一条弧不关联，则关联矩阵中对应的元素为0。24（a）有向图153有向图及其关联矩阵1-100010-100010-100-110000-1100001-100-101000-11（b）关联矩阵图的邻接表是图中所有节点邻接表的集合。24（a）有向图153有向图及其邻接表04212345860426303093035074（b）邻接表网络数据结构的基本组成部分和属性1、链（Link）网络中流动的管线如街道、河流、水管，其状态属性包括阻力和需求。2、结点（No

22、de）网络中链的结点，如港口、车站等，其状态属性包括阻力和需求等。障碍（Barrier），禁止网络上流动的点。拐点（Turn），出现在网络中的分割点上，其状态有属性和阻力，如拐弯的时间和限制（如在8点到18点不允许左拐）。中心（Center），是接受或分配资源的位置，如水库、商业中心，电站等，其状态包括资源容量（如总量），阻力限额（中心到链的最大距离或时间）。站点（Stop），在路径选择中资源增减的结点，如库房、车站等，其状态属性有资源需求，如产品数量。结点中的特殊类型p路径分析路径分析是GIS中最基本的功能，其核心是对最佳路径的求解。从网络模型的角度看，最佳路径的求解是在指定网络的两个结点

23、之间找一条阻碍强度最小的路径。另一种路径分析功能是求解最佳游历方案，又分为弧段最佳游历方案求解和结点最佳游历方案求解两种。p连通分析现实中常需要知道从某一结点或边出发能够到达的全部结点或边，这一类问题称为连通分量求解；另一类连通分析问题是求解最少费用连通方案，即在耗费最小的情况下使全部结点相互连通。网络分析功能p动态分段动态分段技术是GIS网络分析中一种基于网络线的动态分析、显示和绘图技术。通过建立一种比“弧段结点”数据模型高级的“动态段动态结点”模型，来实现根据不同的属性按照某种度量标准对线性要素进行相对位置的划分。 p地址匹配地址匹配实质是对地理位置的查询，涉及到地址的编码。地址匹配与其他

24、网络分析功能结合起来，可以满足实际工作中复杂的分析要求。（3）最短路径分析最佳路径分析也称最优路径分析，以最短路径分析为主。这里“最佳”包含很多含义，不仅指一般地理意义上的距离最短，还可以是成本最少、耗费时间最短、资源流量（容量）最大、线路利用率最高等标准。很多网络相关问题，如最可靠路径问题、最大容量路径问题、易达性评价问题和各种路径分配问题均可纳入最佳路径问题的范畴之中。无论判断标准和实际问题中的约束条件如何变化，其核心实现方法都是最短路径算法。最短路径问题从算法研究的角度考虑最短路径问题通常可归纳为两大类：一类是所有点对之间的最短路径，另一类是单源点间的最短路径问题。不但求出起点到终点的

25、最短路径及其长度，而且求出了起点到图中其他各个顶点的最短路径及长度。Dijkstra算法abcd125610fe1143SS令令S=a, b, f，则，则S=c, d, e，求求d(a, S)？（4）中心选址问题）中心选址问题中心点选址问题中，最佳选址位置的判定标准，中心点选址问题中，最佳选址位置的判定标准，是使其所在的顶点与图中其它顶点之间的是使其所在的顶点与图中其它顶点之间的最大距离最大距离达达到最小，或者使其所在的顶点到图中其它顶点之间的到最小，或者使其所在的顶点到图中其它顶点之间的距离之和距离之和达到最小。达到最小。这个选址问题实际上就是求网络图的中心点问题。这个选址问题实际上就

26、是求网络图的中心点问题。这类选址问题适宜于医院、消防站等服务设施的布局这类选址问题适宜于医院、消防站等服务设施的布局问题。问题。 v6v8v1v7v5v4v2v389363253757中心选址问题的实例例例如如，某某县县要要在在其其所所辖辖的的8 8个个乡乡镇镇之之一一修修建建一一个个消消防防站站，为为8 8个个乡乡镇镇服服务务，要要求求消消防防站站至至最最远远乡乡镇镇的的距距离离达达到到最最小小。假假设设该该8 8个个乡乡镇镇之之间间的的交交通通网网络络被被抽抽象象为为无无向向赋赋权权连连通通图图，权权值值为为乡乡镇镇之之间间的的距距离离。下下面面求求解解消消防防站站应应设设在在哪哪个个乡乡

27、镇镇，即哪个顶点？即哪个顶点？首先，用首先，用首先，用首先，用DijkstraDijkstraDijkstraDijkstra算法计算出算法计算出算法计算出算法计算出每一个顶点每一个顶点每一个顶点每一个顶点v v v vi i i i至其它各顶点至其它各顶点至其它各顶点至其它各顶点v v v vj j j j的最短路径长度的最短路径长度的最短路径长度的最短路径长度d d d dijijijij( ( ( (i i i i, , , , j j j j=1,2,=1,2,=1,2,=1,2,6),6),6),6)，写出距离矩阵：写出距离矩阵：写出距离矩阵：写出距离矩阵： 606191615256

28、5473其其其其次次次次，求求求求距距距距离离离离矩矩矩矩阵阵阵阵中中中中每每每每行行行行的的的的最最最最大大大大值值值值，即即即即各各各各个个个个顶顶顶顶点点点点的的的的最大服务距离，得最大服务距离，得最大服务距离，得最大服务距离，得e e e e( ( ( (v v v v1 1 1 1)=14, )=14, )=14, )=14, e e e e( ( ( (v v v v2 2 2 2)=15, )=15, )=15, )=15, e e e e( ( ( (v v v v3 3 3 3)=20, )=20, )=20, )=20, e e e e( ( ( (v v v v4 4 4

29、 4)=12, )=12, )=12, )=12, e e e e( ( ( (v v v v5 5 5 5)=15, )=15, )=15, )=15, e e e e( ( ( (v v v v6 6 6 6)=17, )=17, )=17, )=17, e e e e( ( ( (v v v v7 7 7 7)=12, )=12, )=12, )=12, e e e e( ( ( (v v v v8 8 8 8)=20)=20)=20)=20最最最最后后后后计计计计算算算算最最最最大大大大服服服服务务务务距距距距离离离离的的的的最最最最小小小小值值值值。显显显显然然然然，e e e e(

30、 ( ( (v v v v4 4 4 4) ) ) ) = = = = e e e e( ( ( (v v v v7 7 7 7) ) ) ) = = = = minminminmin e e e e( ( ( (v v v vi i i i)。所所所所以以以以，消消消消防防防防站站站站应应应应建建建建在在在在v v v v4 4 4 4或或或或v v v v7 7 7 7点所在的乡镇。点所在的乡镇。点所在的乡镇。点所在的乡镇。6061916152565473要求消防站至要求消防站至所有所有乡镇的距离达到最小：乡镇的距离达到最小：消防站应建在消防站应建在消防站应建在消防站应建在v v v v5

31、 5 5 5点所在的乡镇点所在的乡镇点所在的乡镇点所在的乡镇3.叠置分析大部分GIS软件以分层的方式组织地理景观，将地理景观按主题分层提取，同一地区的整个数据层集表达了该地区地理景观的内容。每个主题层可以用矢量结构的点线面图层文件表达，也可以用栅格结构的图层文件进行表达。叠置分析是GIS最常用的提取空间隐含信息的手段之一。该方法来源于传统的透明材料叠置。既将来自不同数据源的图纸绘于透明纸上，在透光桌上将其叠放在一起，然后用笔勾出感兴趣的部分。叠置分析是将两层或多层地图要素进行叠置产生一个新要素层的操作，其结果将原来要素分割成新的要素，新要素综合了原来两层或多层要素所具有的属性。也就是说，叠置分

32、析不仅生成了新的空间关系，还将输入数据层的属性联系起来产生了新的属性关系。叠置分析是对新要素的属性按一定的数学模型进行计算分析，进而产生用户需要的结果或回答用户提出的问题。点与多边形的叠置分析，实质是计算包含关系（包含分析），判断各个点的归属（落在哪个多边形内）。叠置的结果是为每点产生一个新的属性。例如，井位与规划区叠置，可找到包含每个井的区域。（1）点与多边形叠置在完成点与多边形几何关系计算后，还要进行属性信息处理。最简单的方式是将多边形属性信息叠置到其中的点上（或反之）。如有多点分布在同一多边形，则要采取一些特殊的规则。点与多边形的叠置通常不产生新的数据层，只是把属性信息叠置到原图层中，

33、然后通过属性查询间接获得点与多边形叠置的需要信息。pointnamepoly1农行取款机农行取款机A2建行取款机建行取款机B3农行取款机农行取款机C4商行取款机商行取款机CA AB BC C自自动动取取款款机机位位置置图图居居民民区区分分布布图图叠置图层叠置图层2 21 13 34 4polynamepointA进德小区进德小区1B阳光小区阳光小区2C花园小区花园小区3,4（2）线与多边形叠置u线与多边形的叠置，是线与多边形的叠置，是比较线上坐标与多边形坐标的比较线上坐标与多边形坐标的关系关系，判断线是否落在多边形内。，判断线是否落在多边形内。u叠置后每条线被它穿过的多边形打断成新弧段，要将叠

34、置后每条线被它穿过的多边形打断成新弧段，要将原线和多边形的属性信息一起赋给新弧段。原线和多边形的属性信息一起赋给新弧段。Line IDOld IDPoly11C22C32B43C53A63B124ABC123356政区图河流图新弧段图层123居居民民区区叠置叠置区区居民居民区区ID污染污染分级分级A1A1A2A2A3A3B1B1B3B3居民居民区区IDAB污染污染分级分级123叠叠置置图图污污染染分分级级图图（3 3）多边形的叠置）多边形的叠置AB123B1B3A1A2A3p原来多边形要素分割成新原来多边形要素分割成新要素，新要素综合了原来两要素，新要素综合了原来两层或多层的属性。层或多层的属

35、性。并操作（Union）交操作（Intersect）擦除操作（Erase）裁剪操作（Clip）多边形的叠置并操作(AB) 保留两个图层的所有图形要素和属性数据。 ABAB交操作(AB)保留两个图层共同的部分，其余部分将被消除。ABAB擦除操作(A-AB) 输出层保留以第二个图层为控制边界之外的所有多边形。A-ABAB裁剪操作输出层保留以第二个图层为边界，对输入图层的内容要素进行截取的结果。和擦除操作相反。A-ABAB（4 4）栅格图层叠置）栅格图层叠置地图代数基于常数的代数运算基于指数、对数、三角函数等数学变换的运算多个数据层面的代数运算（加、减、乘、除等）二值逻辑叠加逻辑交逻辑并逻辑差的

36、运算1 11 11 11 11 11 11 1A A A AB B B BC C C CD D D D地图代数地图代数1 1 1 1 1 11 1 1 11 1 1 1 1 11 11 11 11 11 11 11 11 1D D D DD = A + B + CD = A + B + CD = A + B + CD = A + B + C1 11 11 11 11 11 11 11 11 11 11 12 22 22 22 23 31 11 11 11 11 11 11 11 11 11 11 11 12 22 22 22 23 31 11 11 11 11 1E E1 1 1 1 1 11

37、 11 11 1 1 1 1 13 3F=D-EF=D-EF=D-EF=D-E1 11 11 11 11 11 11 11 1二值逻辑叠加二值逻辑叠加u首首先先按按是是否否满满足足规规定定条条件件，将将各各个个输输入入数数据据层层中中的的所所有有多多边边形形赋赋值值为为1 1（真真）或或0 0（假），变成二值图（假），变成二值图(0,1)(0,1)。u对对各各个个输输入入数数据据层层进进行行“逻逻辑辑交交”、“逻逻辑辑并并”、“逻逻辑辑补补”等等运运算算，输输出出数数据据层层也是一个二值图。也是一个二值图。1 11 11 11 11 11 11 1A A A AB B B B二值逻辑叠加二值逻

38、辑叠加1 11 11 11 11 11 11 1C=AC=AC=AC=AB B B B1 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 1D=ABD=ABD=ABD=AB1 11 11 11 11 11 11 1B B B B叠加后属性的赋值方法点变换方式对单个栅格单元进行属性值运算而不受其邻近点的属性值的影响。区域变换方式对属性赋值要考虑栅格所在区域的特性（面积、长度等）。邻域变换方式对属性赋值要考虑相邻栅格的影响实例：汶川大地震相关损失估算实例：汶川大地震相关损失估算需解决的

39、问题确定汶川地震的分级影响范围计算汶川地震所涉及人口数量估算汶川地震中道路的损失情况u地震等级及分布等相关数据；地震等级及分布等相关数据； u四川省的行政边界图、道路分布图。四川省的行政边界图、道路分布图。1. 准备空间数据准备空间数据四川地震等级分布图（四川地震等级分布图（4.5级以上）级以上）空间操作流程空间操作流程2. 进行进行空间操作空间操作地地震震源源buffer分级分级地震缓冲区地震缓冲区overlay叠置层叠置层行行政政边边界界损失估算损失估算属性数据属性数据道路数据道路数据四川地震等级分布图（四川地震等级分布图（4.5级以上）级以上）汶川汶川北川北川青川青川建立地震源缓

40、冲区建立地震源缓冲区地震缓冲区和行政边界叠加地震缓冲区和行政边界叠加地震缓冲区和道路叠加地震缓冲区和道路叠加统计地震所涉及的具体县和乡镇统计地震所涉及的具体县和乡镇及它们的破坏程度及它们的破坏程度。3. 进行统计分析进行统计分析统计地震所涉及的人口总数。统计地震所涉及的人口总数。结合一些经济指标可以进行地震结合一些经济指标可以进行地震损失估算。损失估算。统计受地震影响的道路及破坏程度。统计受地震影响的道路及破坏程度。三、空间查询三、空间查询百度地图上查询电子科技大学清水河校区空间查询查询和定位空间对象，并对空间对象进行量算是地理信息系统的基本功能之一，它是地理信息系统进行高层次分析的基础。例

41、如：在地理信息系统中，为进行高层次分析，往往需要查询定位空间对象，并用一些简单的量测值对地理分布或现象进行描述，如长度，面积，距离，形状等。实际上，空间分析首先始于空间查询和量算，它是空间分析的定量基础。空间查询主要有两类：空间查询主要有两类：第一类是按属性信息的要求来查询定位空间位置，称为“属性查图形属性查图形”。例如：在中国行政区划图上查询人口大于4000万且城市人口大于1000万的省有哪些？这和一般非空间的关系数据库的SQL查询没有区别，查询到结果后，再利用图形和属性的对应关系，进一步在图上用指定的显示方式将结果定位绘出。第二类是根据对象的空间位置查询有关属性信息，称为“图形查属

42、性图形查属性”。例如：一般地理信息系统软件都提供一个“INFO”工具，让用户利用光标，用点选、画线、矩形、圆、不规则多边形等工具选中地物，并显示出所查询对象的属性列表，可进行有关统计分析。该查询通常分为两步，首先借助空间索引，在地理信息系统数据库中快速检索出被选空间实体，然后根据空间实体与属性的连接关系即可得到所查询空间实体的属性列表。图查文(几何查询)基于空间关系查询基于空间关系查询空间实体间存在着多种空间关系，包括拓扑、顺序、距离、方位等关系。通过空间关系查询和定位空间实体是地理信息系统不同于一般数据库系统的功能之一。例如：查询成都火车北站附近的酒店空间查询类别简单的面、线、点相互关系

43、的查询包括：面面查询，如与某个多边形相邻的多边形有哪些。面线查询，如某个多边形的边界有哪些线。面点查询，如某个多边形内有哪些点状地物。线面查询，如某条线经过（穿过）的多边形有哪些，某条链的左、右多边形是哪些。空间查询类别线线查询，如与某条河流相连的支流有哪些，某条道路跨过哪些河流。线点查询，如某条道路上有哪些桥梁，某条输电线上有哪些变电站。点面查询，如某个点落在哪个多边形内。点线查询，如某个结点由哪些线相交而成几何参数查询一般的GIS软件都提供了查询空间对象几何参数的功能。包括点的位置坐标，两点间的距离，一个或一段线目标的长度，一个面状目标的周长或面积等空间定位查询空间定位查询是指给定一

44、个点或一个几何图形，检索出该图形范围内的空间对象以及相应的属性按点查询：给定一个鼠标点位，检索出离它最近的空间对象，并显示它的属性，回答它是什么，它的属性是什么按矩形查询按圆查询按多边形查询空间关系查询空间关系查询包括空间拓扑关系查询和缓冲区查询。空间关系查询有些是通过拓扑数据结构直接查询得到，有些是通过空间运算，特别是空间位置的关系运算得到 (1)邻接查询邻接查询从多边形与弧段关系的表中，检索出该多边形关系的所有弧从多边形与弧段关系的表中，检索出该多边形关系的所有弧段段从弧段关系的左右多边形的表中，检索出这些弧段所关联的从弧段关系的左右多边形的表中，检索出这些弧段所关联的多边形多边形(2)

45、包含关系查询包含关系查询查询某一个面状所包含的某一类的空间对象查询某一个面状所包含的某一类的空间对象(3) 穿越查询穿越查询长江所经过的县市(4) 落入查询落入查询查询一个空间对象它落在哪个空间对象之内。可采用空间查询一个空间对象它落在哪个空间对象之内。可采用空间运算，使用点在多边形内，线在多边形内，或面在多边形运算，使用点在多边形内，线在多边形内，或面在多边形内的差别方法。内的差别方法。 (5) 缓冲区查询缓冲区查询缓冲区查询根据用户需要给定一个点缓冲、线缓冲或面缓缓冲区查询根据用户需要给定一个点缓冲、线缓冲或面缓冲的距离，从而形成一个缓冲区的多边形，再根据多边形冲的距离，从而形成一个缓

46、冲区的多边形，再根据多边形检索的原理，检索出该缓冲区多边形内的空间地物。检索的原理，检索出该缓冲区多边形内的空间地物。距黄河距黄河150公里范围内的主要城市公里范围内的主要城市（6）地址匹配查询地址匹配查询根据街道地址来查询事物的空间位置和属性信息是地根据街道地址来查询事物的空间位置和属性信息是地理信息系统特有的一种查询功能，这种查询利用地理编码，理信息系统特有的一种查询功能，这种查询利用地理编码，输入街道门牌号码，就可知道大致的位置和所在的街区。输入街道门牌号码，就可知道大致的位置和所在的街区。（7）结构化查询语言）结构化查询语言-SQL查询查询四、空间统计分析空间统计分析,即空间

47、数据（Spatial Data）的统计分析，是现代计量地理学中一个快速发展的方向领域。空间统计分析，其核心就是认识与地理位置相关的数据间的空间依赖、空间关联或空间自相关，通过空间位置建立数据间的统计关系1.相关分析空间要素之间的相关性分析的任务是揭示空间要素之间相互关系的密切成都。空间要素之间相互关系的密切成都的测定，主要是通过对各种相关系数的计算和检验来完成。线性相关分析线性相关分析研究两个变量间线性关系的程度。用相关系数r来描述。 -正相关：如果x,y变化的方向一致，如身高与体重的关系，r0；一般地， |r|0.95 存在显著性相关； |r|0.8 高度相关； 0.5|r|0.8 中度相关

48、； 0.3|r|0.5 低度相关； |r|F2a，而F3close_to(X,”park”) 0.5%, 80%此规则表明80%靠近体育中心的学校同时也靠近公园，并且有0.5%的数据符合这一规则。空间关联规则的挖掘需要在大量的空间对象中计算多种空间关系，代价极高。所以应采用逐步求精的挖掘优化方法：（1）通过空间查询从初始空间数据库中获得和任务相关的空间数据库；（2）使用一些有效空间挖掘算法计算对象之间的空间联接，从而获得一个候选谓词集合；（3）对（2）中所得到的谓词集合中的每一个谓词计算其支持度，并且将那些支持度小于最小支持度的谓词删除；（4）对谓词集合进行进一步精化以决定准确的空间关系（

49、5）以（4）所得的候选集作为输入，生成空间关联规则。空间数据挖掘前期采用的粗略挖掘算法必须满足超级覆盖特性（superset coverage property）：即它保持了潜在的答案。允许假正测试（false positive test），即可以包括一些不属于结果集的数据集；不允许假负测试（false negative test），即不能排除一些潜在的答案。例如，挖掘与空间谓词close_to有关的空间关联规则：使用一定的近似空间计算算法：如用最小边界矩形结构（仅涉及两个空间点）；计算放宽后的空间谓词，如g_close_to，它包括close_to，touch和intersect的结果。4.

50、空间聚类聚类（clustering）就是将数据对象分组成为多个类或簇（cluster），在同一个簇中的对象之间具有较高的相似度，而不同簇中的对象分簇中的对象差别较大。聚类分析是统计学的一个分支，与规则分类不同的是，聚类算法无需背景知识，能直接从空间数据库中发现有意义的空间聚类结构。主要聚类方法的分类1. 划分方法：给定一个n个对象或元组的数据库，一个划分方法构建数据的k个划分，每个划分表示一个簇（即k个组），kn。同时要求：（1）每个划分至少包含一个对象（2）每个对象必须属于且只属于一个组。给定要构建的划分的数目k，划分方法首先创建一个初始划分。然后采用一种迭代的重定位技术，尝试通过对象在划

51、分间移动来改进划分。一个好的划分的准则：在同一个类中的对象之间尽可能“接近”或相关；而不同类中的对象之间尽可能“远离”或不同。流行的启发式方法：(1) k-平均算法；(2) k-中心点算法2.层次的方法：对给定数据对象集合进行层次的分解。凝聚的方法：自底向上的方法，一开始将每个对象作为单独的一个组，然后相继地合并相近的对象或组，直到所有的组合并为一个（层次的最上层），或者达到一个终止条件；分裂的方法：自顶向下的方法，一开始将所有的对象置于一个簇中。在迭代的每一步中一个簇被分裂为更小的簇，直到最终每个对象在单独的一个簇中，或者达到一个终止条件。3. 基于密度的方法：只要临近区域的密度（对象或数据

52、点的数目）超过某个阈值，就继续聚类。对给定类中的每个数据点，在一个给定范围的区域中必须至少包含某给数目的点。4. 基于网格的方法5. 基于模型的方法5.分类分析空间分类发现的规则在模式识别、基于内容的查询、图象分类等应用中具有重要应用。数据分类（data classification）是一个两步过程：（1）建立一个模型，描述预定的数据类集或概念集（或称作分类器）。要构造分类器，需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成，每个元组是一个由有关字段（又称属性或特征）值组成的特征向量，此外，训练样本还有一个类别标记。训练样本形式：(v1,v2,vn, c)；其中vi表示字段值

53、，c表示类别。（2）使用模型进行分类。分类方法分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。机器学习方法包括决策树法和规则归纳法，神经网络法主要是BP算法。决策树方法的分类稳定性优于神经网络方法。GIS中数据挖掘的过程（1）根据一定的主题要求及相关背景知识，从现有的分布式空间数据库中提取数据并进行分析和处理，形成空间数据仓库；（2）根据确定的任务，选择合适的数据挖掘算法，包括合适的数据模型和参数，从空间数据仓库中挖掘用户所需要的知识信息；（3）对挖掘的知识进行评价，首先对其进行一致性检查，以确定本次挖掘的知识与以前挖掘的知识是否相互抵触。其次，判断受挖掘的知识是否满足要求，以决定是否重复挖掘或者反复挖掘,从而获取更加有效的知识信息；（4）对挖掘所得到的知识信息，通过特定的生动形象的可视化表达工具，以用户能够全面理解的方式呈现给用户。GIS中数据挖掘的过程

展开阅读全文

空间数据分析

最新文档