为什么与统计数据相比空间数据更复杂,那空间数据该如何组织与管理为什么与统计数据相比空间数据更复杂,那空间数据该如何组织与管理 ·数据类型多(几何数据、关系数据、辅助数据) ·数据操纵复杂(一般数据检索、增加、删除等,空间数据定位检索、拓扑关系检索等) ·数据输出多样(数据、报表、图形) ·数据量大,空间数据种类多(测量、统计数据、文字;地图、影像等) 空间数据的非结构化特征 ·事务数据库:数据记录一般是结构化的每一个记录有相同的结构和固定的长度,记录 中每个字段表达的只能是原子数据,内部无结构,不允许嵌套记录 ·空间数据:这种结构化不能满足要求需要存储地理实体的空间坐标:实体位置、大小 形状;拓扑关系等文件与数据库混合管理文件与数据库混合管理基本思想:属性数据存储在常规的 RDBMS 中;几何数据存储在 空间数据管理系统中;两个子系统间用标识符联系起来(即通过关键字联系) 优点:由于 一部分建立在标准的 RDBMS 上,存储和检索数据比较有效、可靠缺点:1 由于使用了 两个子系统,它们各自有自己的规则,查询操作难以优化,存储在 RDBMS 外的数据有时 会丢失数据项的语义2 数据完整性的约束条件可能遭破坏,如在几何空间数据系统中目 标实体仍存在,但在 RDBMS 中却已删除。
全关系型空间数据库管理系统全关系型空间数据库管理系统基本思想:采用同一 DBMS 存储空间数据和属性数据,即 在标准的关系数据库上增加空间数据管理层;利用该层将结构查询语言(GeoSQL)转化成 标准的 SQL 查询,借助索引数据的辅助关系实施空间索引操作优点:省去了空间数据库 和属性数据库间的繁琐连接,空间数据存取速度快缺点:由于是存取、效率上总是低于 DBMS 中所用的直接操作过程,且查询过程复杂 对象关系数据库管理系统对象关系数据库管理系统关系型数据库+空间数据引擎思想:用户将自己的空间数据 交给独立于数据库之外的空间数据引擎,由空间数据引擎来组织空间数据在关系型数据库 中的存储;用户需要访问数据的时候,再通过空间数据引擎,由引擎从关系型数据库中去 除数据并转化为客户可以使用的方式优点:访问速度快,支持通用的关系数据库管理系 统,空间数据按 BLOB 存取,可跨数据库平台与特定 GIS 平台结合紧密,应用灵活缺点: 空间操作和处理无法在数据库内核中实现,数据模型较为复杂,扩展 SQL 比较困难,不易 实现数据共享与互操作对象关系数据库管理系统对象关系数据库管理系统扩展对象关系型数据库管理系统。
思想:对关系数据库关系系 统进行扩展,使之能管理非结构化的空间数据,用户利用这种能力增加空间数据类型及相 关函数,从而将空间数据类型与函数从空间数据引擎转移到数据库管理系统中优点:空 间数据的管理与通用数据库系统融为一体,空间数据按对象存取,可在数据库内核中实现 空间操作和处理,扩展 SQL 比较方便容易实现数据共享与互操作缺点:实现难度大,压 缩数据比较困难,目前功能与性能还较差·扩展的关系数据类型:1 大对象类型 LOB 2 BOOLEAN 3 集合类型 ARRAY 4 用户定义的类型 5 面向对象的数据类型·扩展的对 象类型:1 行对象与行类型[第①步定义行类型②创建行类型③创建基于行类型的表 2 列 对象与对象类型①创建列对象②创建表,定义其中属性是对象类型 3 抽象数据类型 (ADT)·参照类型:REF 类型,值是 OID①创建两个行类型②创建两个基于行类型的表 ③描述这两个表的参照关系地理空间建模的方法(二分法)地理空间建模的方法(二分法) 地理空间建模是对空间实体的数据抽象后对实体对象或场的描述 ·基于实体的描述基于实体的描述主要描述不连续的个体现象,适合表示有固定形状的空间实体,强调 个体现象,对象之间的空间位置关系通过拓扑关系进行连接。
核心思想:将地理实体和现 象作为独立的对象,以独立的方式存在,主要描述不连续的地理现象,任何现象都是一个对象,实体由不同的对象组成零维对象:点;一维对象:polyline 线段、边界、链、弧段、 网络(特性:长度,弯曲度,方向性);二维对象:polygon 简单多边形、非简单多边形、凸 多边形、单调多边形、有洞多边形、区域(区域为一组多边形)(特性:面积、周长、独立 性或与其他地物相邻、内岛屿或锯齿状外形、重叠性与非重叠性 ·基于场的描述基于场的描述核心思想:把地理空间的事物和现象作为连续的变量来看待,如空气中 污染物的集中程度、地表的温度在空间中任何点上都有一个表达这一现象的值 ·场模型和实体模型在计算机中实现共存地理空间表达模式地理空间表达模式 曲面细分模式(镶嵌)(镶嵌) 规则镶嵌和不规则镶嵌用镶嵌模式表达基于实体的模型:二维空 间中的空间实体被表示为包含它的有限像素子集点实体被描述为一个像元,用像元的地 址多线多边形和区域实体:用有限个像元构成的像元集来表达用镶嵌模式表达基于场 的模型:基于场的数据被定义为空间上的连续函数,在镶嵌模型中,不再是点的连续函数, 而是像素的连续函数,每个单元通过一定的数值表达方式表达诸如环境污染程度。
植被覆 盖类型等空间地理现象TIN 就是镶嵌模型的一种类型,基于对 2D 空间的三角剖分 矢量模式矢量模式对象被表达为由点和边组成用矢量模式表达基于实体的模型:point : [x: real, y: real] polyline : polygon : region : { polygon } 用矢量模式表达基 于场的模型-图斑模型,等值线模型,选样模型数字高程模型 DEM它是用一组有序数 值阵列形式表示地面高程的一种实体地面模型 实体集合的表达方式实体集合的表达方式 面条模型面条模型特点:独立地描述实体集中任意实体的几何信息;面条模型不存储拓扑关系, 所有的拓扑关系在需要的时候进行计算优点:独立地描述实体集中任意实体的几何信息. 面条模型不存储拓扑关系,所有的拓扑关系在需要的时候进行计算缺点 1 缺乏空间对象 之间的拓扑关系的明确信息,如邻接或包容 2 由于没有共享信息,数据存储冗余,例如,两个 多边形之间的公共边界表示两次 网络模型网络模型用于在基于网络(图)的应用中对网络进行表达点 node 弧 arc特点: planar 每个边的交点记录为一个节点(node),即使这个节点不对应于任何地理实体。
优点: 是对网络拓扑的本质描述缺点:二维对象之间的关系的信息没有存储在这个模型 拓扑模型拓扑模型特点:Noplanar, 边的交叉不产生交点优点:几何是共享不重复数据模型 代表相邻的多边形,因此他们不需要计算的需求有助于更新一致,只有一个边界更新即可 可以促进网络和共享缺点:比面条模型更复杂, 可能处理更慢.一些结构信息没有实际的 语义含义.增加一个新的对象需要对平面图进行重新计算. 空间数据是对现实世界中空间对象(事物)的描述,其实质是指以地球表面空间位置为参照,用来描述空间实体的位置、形状、大小及其分布特征等诸多方面信息的数据 空间数据的基本特征:空间特征,时间特征,属性特征 空间数据库指以特定的信息结构(如国土、规划、环境、交通等)和数据模型(如关系模型、面向对象模型等)表达、存储和管理从地理空间中获取的某类空间信息,以满足不同 用户对空间信息需求的数据库 空间数据库系统:数字栅格地图数据库(DRG) ,数字高程模型数据库(DEM) ,数字正射 影像数据库(DOM)矢量地形要素数据库(DLG)专题数据库(TD)元数据库(MD) 数字高程模型数据库(DEM)是定义在平面 X,Y 上规则格网点上高程数据集构成的数据库 影像数据库由各种航空航天遥感数据或经过扫描处理的影像数据构成的数字正射影像数据库 数字栅格地形图:纸质地形图扫描后经几何纠正,并进行内容更新和数据压缩处理得到数字数字栅格地图分布式数据库:逻辑上是一个统一的数据库系统,物理上分散在不同的场地(节点) ,各场地通过计算机网络连接在一起,统一由一个分布式数据库管理系统( DDBMS )管理 分布数据库特点:地方自治性,相互协作性;位置透明性;副本透明性; 分布式数据库;演绎数据库;时态数据库;实时数据库。
空间实体:地理空间中的物体,通常包括两个组成部分:实体描述:实体由属性集来描述;空间描述:包括几何和拓扑 地图:依据一定的数学法则,运用地图语言(地图符号)对现实世界的科学抽象和概括地图对空间尸体的属性表示:符号与标记;定位表示:点状要素、线状要素、面状要素 欧氏空间:许多地理现象模型建立的基础是嵌入在一个坐标空间中,在这种坐标空间中,根据常用的公式可以测量点之间的距离与方位,这个带坐标的空间模型叫欧氏空间 不规则三角网 TIN 模型:按照一定的规则将离散点连接成覆盖整个区域且互不重叠、结构最佳的三角形存储方式:1 按三角形来存储;2 点和它们的邻居 伪空间数据:一些形式的空间数据不能被直接用于空间应用这样的空间数据被称为伪空间数据拓扑:拓扑:当图形形状在弯曲、拉伸、收缩或其他方式扭曲下几何形状保持不变的属性 几何:几何:“Geometry”通常被理解为数学的一个分支,用来处理零维和高维空间的点、线、 角、面和表面的属性及关系在几何对象模型中, “Geometry”用来表达在数据库中至少有 一个几何属性“对象”的空间要素 拓扑关系:拓扑关系:指满足拓扑几何学原理的各空间数据间的相互关系。
即用结点、弧段和多边形 所表示的实体之间的相邻、连通和包含等关系 Coverage::矢量数据的基本存储单元,存储指定区域内地理要素的位置,拓扑关系及其 专题属性主要特点:空间数据与文件数据相结合,能够存储矢量要素之间的拓扑关系 缺陷:1Coverage 模型的某些可取之处没有必要了(拓扑关系——面向对象技术解决;存 储空间;计算机运行能力提高——实时计算) 2 空间数据不能很好的与其行为相对应 3 以 文件方式保存空间数据,属性数据存放在另外 DBMS 中;对数据一致性有影响 4Coverage 模型的拓扑结构不够灵活 5 不同的 Coverage 之间无法建立拓扑关系 TIN::根据区域有限个点集,将区域划分成相等的三角面网络,数字高程由连续的三角面 组成,三角面的形状和大小取决于不规则分布的测点的密度和位置 八叉树:八叉树:八叉树是一种用于描述三维空间的树状数据结构过程:过程:假设要表示的形体 V 可 以放在一个充分大的正方体 C 内,八叉树的每个节点与 C 的一个子立方体对应,树根与 C 本身相对应,如果 V=C,那么 V 的八叉树仅有树根,如果 V≠C,则将 C 等分为八个 子立方体,每个子立方体与树根的一个子节点相对应。
只要某个子立方体不是完全空白或 完全为 V 所占据,就要被八等分,从而对应的节点也就有了八个子节点这样递归判断、 分割一直进行到节点所对应的立方体或是完全空白,或是完全为 V 占据,或是其大小已是 预先定义的体素大小八叉树节点有灰节点,白节点,黑节点数据存储机制数据存储机制:二级存储(1 主存:数据索引 2 外存:数据)[寻找时间>延迟时间>传输时 间] 物理存储介质:速度:高—低,容量:小—大1 基本存储(寄存器、高速缓冲存储器、 主存储器)2 联机存储(快闪存储器、磁盘存储器)3 脱机存储(光盘存储器、磁带存储器)磁盘:1 磁道:圆形磁盘片上向边缘延伸的许多同心圆环 2 扇区:磁道被划分为扇区,扇区大小由驱动器的厂商设定3 磁盘块 :(页面)是磁盘与主存之间的最小传输单元 域:关系或实体的一个特征或属性记录:关系中的一行,是属性域的集合 文件:记录的集合 文件结构:文件组织其记录的方法 常用的文件结构常用的文件结构:1 堆 Heap 文件:记录没有特定的顺序插入:把记录插入扇区的最后平均来说,需要 检索一半的磁盘页面插入记录和记录文件很有效,但查询,查询下一个较慢 2 散列 Hashed 文。