第5讲 空间数据管理

上传人:油条 文档编号:3712394 上传时间:2017-08-05 格式:PPT 页数:44 大小:1.21MB
返回 下载 相关 举报
第5讲 空间数据管理_第1页
第1页 / 共44页
第5讲 空间数据管理_第2页
第2页 / 共44页
第5讲 空间数据管理_第3页
第3页 / 共44页
第5讲 空间数据管理_第4页
第4页 / 共44页
第5讲 空间数据管理_第5页
第5页 / 共44页
点击查看更多>>
资源描述

《第5讲 空间数据管理》由会员分享,可在线阅读,更多相关《第5讲 空间数据管理(44页珍藏版)》请在金锄头文库上搜索。

1、第五讲 空间数据管理,主要内容,数据与数据文件 数据库与数据库管理系统 空间数据库模型 空间数据库设计 空间数据库建立与维护,5.1 数据与数据文件,一、数据组织的分级数据组织的层次 按逻辑单位分级:数据项、记录、文件和数据库。 按物理单位分级:比特、字节、字、块、桶和卷。 数据库中的数据组织 数据项:定义数据的最小单位,也叫基本项、字段等;有一定的取值范围,即域;可以是数值、字母、字母数字、汉字等形式。 记录:由若干相关联的数据项组成,是处理和存储信息的基本单位;有“型”和“值”的区别;每个记录有唯一的标识符(关键字)。,文件:是一给定类型的(逻辑)记录的全部具体值的集合;用文件名标识;根据

2、组织和存取方法分为顺序文件、索引文件、直接文件和倒排文件。 数据库:具有特定联系的数据的集合(多种类型的记录集合);是具有某种联系的文件集合。 (例如,一个GIS工程可能含有几千幅图,每幅图可能有点、线、面多种数据文件和多种属性表,因而一个GIS工程可作为一个空间数据库,但他们可能涉及成千上万个文件。),二、数据间的逻辑联系,数据间的逻辑联系主要指记录之间的联系。数据间的逻辑联系 一对一的联系(1:1):在集合A中存在一个元素ai,则在集合B中有且仅有一个bj与之联系。,一对多的联系(1:N):在集合A中存在一个ai,则在集合B中存在一个子集B(bj1, bj2bjn)与之联系。,多对多的联系

3、(M:N):对于集合A中的一个元素ai。在集合B就存在一个子集B(bj1, bj2bjn)与之相联系。反过来,对于B集合中的一个元素Bj在集合A中就有一个集合A(ai1,ai2,ai3ain)与之相联系。,三、常用数据文件,文件的组织方式主要有:顺序文件:对记录按主关键字的顺序进行组织。索引文件:除了存储记录本身(主文件)以外,还建立若干索引表。直接文件:也称随机文件,根据记录关键字的值,通过某种转换方法得到一个物理存储位置,然后把记录存储在该位置上。倒排文件:带有辅索引的文件。,5.2 数据库与数据库管理系统,一、数据库的概念概念: 是为一定目的服务,以特定的结构存储的相关的数据集合。特点:

4、 数据集中控制 数据冗余度小 数据独立 复杂的数据模型 数据保护:安全性控制、完整性控制、并发控制、故障 的发现和恢复,二、数据库的系统结构,基本结构 物理级:数据库最内的一层;是物理设备上实际存储的数据集合;由物理模式描述。 概念级:数据库的逻辑表示,包括每个数据的逻辑定义以及数据间的逻辑联系;由概念模式定义。 用户级:用户所使用的数据库,是一个或几个特定用户所使用的数据集合,是概念模型的逻辑子集;用外模式定义。,三、数据库管理系统,DBMS:是处理数据库存取和各种管理控制的软件;是DB的中心枢纽,与各部分有密切联系。DBMS的功能:数据库定义、管理、维护、通讯DBMS的组成:语言处理程序、

5、系统运行控制程序、建立和维护程序DBA:掌握数据库全面情况并作为数据库设计和管理骨干的人;主要功能是建立和维护数据。,四、空间数据库管理系统,空间数据库:指GIS在计算机物理存储介质上存储的与应用相关的地理空间数据的总和。空间数据特征: 1)空间特征:一般需要建立空间索引。 2)非结构化特征:结构化的,即满足第一范式:每条记录定长,且数据项是原子数据;而空间数据数据项变长,对象包含一个或多个对象,需要嵌套记录。 3)空间关系特征:拓扑数据给空间数据的一致性和完整性维护增加了复杂性。 4)分类编码特征:一种地物类型对应一个属性数据表文件。多种地物类型共用一个属性数据表文件。 5)海量数据特征。,

6、空间数据库特点: 1)数据量特别大; 2)数据种类多,复杂; 3)数据应用面相当广。空间数据库管理系统: 1)是指能够对物理介质上存储的地理空间数据进行语义和逻辑上的定义; 2)提供必须的空间数据查询、检索和存取功能; 3)能够空间数据进行有效的维护和更新的一套软件系统。,5.3 数据库模型,数据模型: 描述数据内容和数据之间联系的工具,是衡量数据库能力强弱的主要标志之一。传统数据模型: 层次模型、网络模型、关系模型面向对象模型:,一、传统数据模型,层次模型 以记录类型为结点的有向树。,原始地图E,层次模型,网络模型,将数据组织成有向图结构,结点代表数据记录,连线描述不同结点数据间的关系。,网

7、络模型,关系模型,将数据的逻辑结构归结为满足一定条件的二维表,亦称关系。表的行叫元组,相当于一个记录,表的列叫属性。所有的元组都是同质的,即有相同的属性项。,传统数据库与空间数据库的比较,二 、面向对象模型,1、对象: 含有数据和操作方法的独立模块,可以认为是数据和行为的统一体。(如一个城市、一棵树均可作为地理对象。) 具有一个唯一的标识,以表明其存在的独立性; 具有一组描述特征的属性,以表明其在某一时刻的状态静态属性数据; 具有一组表示行为的操作方法,用以改变对象的状态。-作用、功能函数、方法。,基本概念,2、类:共享同一属性和方法集的所有对象的集合。如河流均具有共性,如名称、长度、流域面积

8、等,以及相同的操作方法,如查询、计算长度、求流域面积等,因而可抽象为河流类。3、实例:被抽象的对象,类的一个具体对象。如长江、黄河等。(真正抽象的河流不存在,只存在河流的例子。)类是抽象的对象,是实例的组合,类、实例是相对的,类和实例的关系为上下层关系。类-申请实例-成为具体对象。4、消息:对象之间的请求和协作。(并不独立存在)对象之间的关系, 如点某按纽,就是对按纽提出请求。,面向对象的特性,1、抽象:是对现实世界的简明表示。形成对象的关键是抽象,对象是抽象思维的结果。2、封装:将方法与数据放于一对象中,以使对数据的操作只可通过该对象本身的方法来进行(指把对象的状态及其操作集成化,使之不受外

9、界影响)。3、多态:是指同一消息被不同对象接收时,可解释为不同的含义。同一消息,对不同对象,功能不同。,四种核心技术,1、分类:分类是把一组具有相同属性结构和操作方法的对象归纳或映射为一个公共类的过程。(instance-of)2、概括:将相同特征和操作的类再抽象为一个更高层次、更具一般性的超类的过程。(is-a),3、聚集:聚集是把几个不同性质类的对象组合成一个更高级的复合对象的过程。(parts-of)4、联合:相似对象抽象组合为集合对象。其操作是成员对象的操作集合。(member-of),面向对象数据模型的核心工具,1、继承:一类对象可继承另一类对象的特性和能力,子类继承父类的共性,它服

10、务于概括,分为单重继承和多重继承。继承机制减少代码冗余,减少相互间的接口和界面。,2、传播,是作用于联合和聚集的工具,它通过一种强制手段将子目标的属性信息传播给复杂对象。成员对象的属性只存储一次,保证数据一致性和减少冗余。如桂林市总人口,由存储在各成员对象中的各区人口总和。3、继承与传播(区别)1)继承服务于概括,传播作用于联合和聚集;2)继承是从上层到下层,应用于类,而传播是自下而上,直接作用于对象;3)继承包括属性和操作,而传播一般仅涉及属性;4)继承是一种信息隐含机制,只要说明子类与父类的关系,则父类的特征一般能自动传给它的子类,而传播是一种强制性工具,需要在复合对象中显式定义它的每个成

11、员对象,并说明它需要传播哪些属性值。,三、现行空间数据库管理方案,基于文件与关系式数据库的空间数据混合管理方案基于关系式数据库的空间数据管理方案基于对象关系式数据库的空间数据管理方案。,文件 关系数据库混合管理方案,属性数据建立在RDBMS上,数据存储和检索比较可靠、有效;几何数据采用图形文件管理,功能较弱,特别是在数据的安全性、一致性、完整性、并发控制方面,比商用数据库要逊色得多。空间数据分开存储,数据的完整性有可能遭到破坏。GIS软件:Arc/Info,MGE,GenMap等,全关系式数据库管理方案,属性数据、几何数据同时采用关系式数据库进行管理空间数据和属性数据不必进行烦琐的连接,数据存

12、取较快属性间接存取,效率比DBMS的直接存取慢,特别是涉及空间查询、对象嵌套等复杂的空间操作GIS软件:System9,Small World、Geovision等,对象关系数据库管理方案,对现有的关系数据库进行扩展,增加空间数据类型解决了空间数据变长记录的存储问题,由数据库软件商开发,效率较高用户不能根据GIS要求进行空间对象的再定义,因而不能将设计的拓扑结构进行存储GIS软件:TIGER,Geo+、Geo Tropics等,面向对象空间数据库管理系统,面向对象模型最适合于空间数据的表达和管理,它不仅支持变长记录,且支持对象的嵌套,信息的继承和聚集。允许用户定义对象和对象的数据结构及它的操作

13、。可以将空间对象根据需要,定义合适的数据结构和一组操作。这种空间数据结构可以带和不带拓扑,当带拓扑时,涉及对象的嵌套、对象的连接和对象与信息聚集。面向对象的地理数据模型的核心是对复杂对象的模拟和操纵。,四、GIS空间数据组织,ARCINFO,属性数据文件建在对应的coverage目录下; MGE,一个地物类对应于一个属性表文件,且所有属性都放在工程目录下; GeoStar,结合前两者的优点;,五、空间数据索引,空间索引概念根据空间对象位置和形状或空间对象的某种空间关系,按一定顺序排列的数据结构,包含空间对象的概要信息,以提高空间操作的效率GIS中引入空间索引的必要性工作区建立查询、显示数据提取

14、常见空间索引方法对象范围索引格网索引四叉树索引R树和R+树索引,空间索引:对象范围索引,空间索引:格网索引,将工作区按一定的规则划分成格网 记录每个格网内所包含的空间对象 将格网按Morton码进行编码,空间索引:四叉树索引,线性四叉树 采用Morton码编码(Peano键) 根据空间对象覆盖范围,进行四叉树分割 建立Peano键与空间目标的索引关系 层次四叉树 记录中间节点和父节点到子节点的指针 若某个记录覆盖了哪一个中间节点,还要记录该空间对象的标识,空间索引:R树和R+树索引,5-4 空间数据库的设计,空间数据库的设计是指在现在数据库管理系统的基础上建立空间数据库的整个过程。,一、需求分

15、析,需求分析是整个空间数据库设计与建立的基础,主要进行以下工作:1、调查用户需求:了解用户特点和要求,取得设计者与用户对需求的一致看法。2、需求数据的收集和分析:包括信息需求(信息内容、特征、需要存储的数据)、信息加工处理要求(如响应时间)、完整性与安全性要求等。3、编制用户需求说明书:包括需求分析的目标、任务、具体需求说明、系统功能与性能、运行环境等,是需求分析的最终成果。 在需求分析阶段完成: 数据源的选择和对各种数据集的评价(一般、空间、属性评价)。,二、结构设计,指空间数据结构设计,结果是得到一个合理的空间数据模型,是空间数据库设计的关键。 空间数据库设计的实质是将地理空间实体以一定的

16、组织形式在数据库系统中加以表达的过程,也就是地理信息系统中空间实体的模型化问题。,1、概念模型,是通过对错综复杂的现实世界的认识与抽象,最终形成空间数据库系统及其应用系统所需的模型。 表示概念模型最有力的工具是ER模型,即实体联系模型,包括实体、联系和属性三个基本成分。用它来描述现实地理世界,不必考虑信息的存储结构、存取路径及存取效率等与计算机有关的问题,比一般的数据模型更接近于现实地理世界,具有直观、自然、语义较丰富等特点,在地理数据库设计中得到了广泛应用。,2、逻辑模型,逻辑模型的设计是将概念模型结构转换转换为具体DBMS可处理的地理数据库的逻辑结构(或外模式),包括确定数据项、记录及记录间的联系、安全性、完整性和一致性约束等。 从ER模型向关系模型转换的主要过程为: 确定各实体的主关键字; 确定并写出实体内部属性之间的数据关系表达式(函数依赖关系),即某一数据项决定另外的数据项;把经过消冗处理(规范化处理)的数据关系表达式中的实体作为相应的主关键字;根据、形成新的关系。完成转换后,进行分析、评价和优化。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号