空间数据仓库

上传人:nbwa****ajie 文档编号:53678153 上传时间:2018-09-04 格式:PPT 页数:26 大小:118KB
返回 下载 相关 举报
空间数据仓库_第1页
第1页 / 共26页
空间数据仓库_第2页
第2页 / 共26页
空间数据仓库_第3页
第3页 / 共26页
空间数据仓库_第4页
第4页 / 共26页
空间数据仓库_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《空间数据仓库》由会员分享,可在线阅读,更多相关《空间数据仓库(26页珍藏版)》请在金锄头文库上搜索。

1、空间数据仓库,1. 空间数据仓库的概况,1.1 空间数据仓库的基本概念 数据库的创始人W. H. Inmon定义数据仓库为支持管理的、决策过程的、面向主题的、集成的、稳定的、不同时间的数据集合。空间数据仓库是建立在传统的数据库基础上,依靠数据库实现对数据的高效存储,二者之间的区别在于其应用不同。因此,在数据组织、集成上有很大的差别:空间数据库作为源数据库负责数据的日常处理及一般的空间分析功能;空间数据仓库根据用户的要求对空间数据库中分散的、多源的空间数据进行集成和分析,截取不同时段上的信息,将数据的时间属性和空间属性紧密地结合起来,通过模型构建分析和比较,进行数据挖掘发现隐藏在数据中的信息,从

2、而为用户提供决策服务.,1.2 空间数据仓库的功能及特征从组成上,空间数据仓库有三方面的功能:从分散、独立的空间数据库中获取空间数据,即数据ETL,包括数据抽取(extract)、转换(transform )、清洗(cleaning )、装载(loading),建立空间数据仓库;对数据的存储、管理和检索;数据集成及数据挖掘. 空间数据仓库相比于空间数据库有以下特征 1.2.1空间数据仓库是面向主题的传统的GIS数据库是面向对象的,根据应用对数据进行组织,空间数据仓库是面向主题的,在空间数据库的基础上进行更高层次的数据组织和分析。,1.2.2 空间数据仓库是集成的空间数据仓库建立在GIS数据库的

3、基础上,在进行决策时利用元数据对空间数据库里的地理空间数据进行抽取、转换,从而得到有用的的信息,把空间数据库中面向对象的数据转向面向主题的数据,实现决策支持。1.2.3 引用时间维在进行趋势分析时需要对关于主题的各时期的空间数据进行概括总结、分析,空间仓库引进时间维把不同历史时期的空间数据组织到一起,使数据具有时间属性.1.2.4 空间方位的引入在进行趋势分析时需要对关于主题的各时期的空间数据进行概括总结、分析,空间仓库引进时间维把不同历史时期的空间数据组织到一起,使数据具有时间属性.,1.3 空间数据仓库的体系结构空间数据仓库是存储、管理空间数据的一种组织形式,其物理实质仍是对数据的高效存储

4、系统,由于使用目的不同,其存储的数据在量和质以及前端分析工具上与传统GIS应用系统有所不同。空间数据仓库按照功能划分为以下几部分:元数据、源数据、数据变换工具、空间数据仓库、客户端分析工具。,1.3.1 元数据空间数据仓库的元数据是指描述空间数据的数据,它是数据仓库管理手段之一,也是空间数据交换的基础,是空间数据标准化与质量的保证。在空间数据仓库中,元数据可以分为两类,一类是管理元数据(AdministrativeMetadata),它是对源数据及其内容、数据仓库主题、数据转换及各种操作信息的描述;另一类是用户元数据(User Metadata)它帮助用户查询信息、理解结果、了解数据仓库中的数

5、据的组织方式等。在数据传输、信息共享、大力发展互操作的今天,元数据标准化是必小可少的,一定要借鉴和使用ISO制定的元数据标准。,1.3.2 源数据空间数据仓库为了支持高层次的决策分析需要大量的数据。这些数据分布在小同的地理信息系统或其他信息系统中的应用系统数据,它们存贮在不同的平台和一般的数据库中。数据的来源丰富,类型多样式存储或分布式存储。,1.3.3数据变换工具为了优化空间数据仓库的分析性能,源数据必须经过变换以最适宜的方式进入空间数据仓库。变换主要包括提炼、转换、空间变换。数据提炼主要指数据的抽取,如数据项的重构、删迭不需要的运行信息、字段值的解码和翻译、补充缺漏的信息、检查数据的完整性

6、和相容性等;数据转换主要指统一数据编码和数据结构、给数据加上时间标志、根据需要对数据集进行各种运算以及语义转换等;空间变换主要指空间坐标和比例尺的统一、赋予一般数据空间属性。数据转换工具为数据库和空间数据仓库之间架起了一座桥梁,使源数据得到了增值和统一,最大限度地满足了空间数据仓库高层次决策分析的需要。,1.3.4 空间数据仓库源数据经过变换进入空间数据仓库。空间数据仓库以多维方式来组织数据和显示数据。维是人们观察现实世界的角度,但多维数据库中的维并小是随意定义的,它是一种高层次的类型划分。为了获得较高的系统性能,维屏蔽掉了许多原始数据,决策分析所需的综介数据预先已被统计出来放在其中。主题维、

7、时间维、空间维、非空间维是空间数据仓库最基本的组织方式。空间维和时间维是空间数据仓库反映现实世界动态变化的基础,它们的数据组织方式是整个空间数据仓库技术的关键。空间数据仓库的数据存储方式可分为虚拟存储方式、基于关系表的存储方式和多维数据库存储方式。基于关系表的数据模型主要有星形模型,雪花模型和混介模型。多维数据库数据模型主要是超立方体结构模型。,1.4 空间数据仓库的建模 1.4.1 多维数据模型选择多维数据模型是资源环境空间数据仓库进行联机分析处理或多维分析的基础,维是观察问题的角度,通过多维模型可以对观察对象(某一主题)的不同侧而不同层次上进行分析。数据模式主要有:星型模式、雪花模式、混介

8、模式和多维数据库模式。山于星型/雪花模式能够提供简洁和有组织的数据仓库结构,并且支持OLAP操作,因此在空间数据仓库的建模中,仍可沿用其基本框架。相比之下,星型结构更为简洁、便于OLAP操作、并易于浏览,较雪花结构来讲更适介于空间数据仓库的建模。,1.4.2 维的建模在空间数据仓库中司建立三种类型的维:非空间维,仅仅包含非空间数据的维,其泛化值也是非空间的。空间非空间维,这种类型的维的特点是在原始概念层次上是空间数据,但其泛化值在较高的层次上即变成非空间的数据。例如,在土地利用时空分布研究中,各种土地类型在云南省地图上的分布是用空间数据来表达的,而这些土地类型数据可以泛化为一些非空间的值,比如

9、泛化为市一级行政区所包含的土地类型而积,其更高层次的泛化伯则全部变为非空间的数据,这种类型的维与非空间维所起的作用类似。空高层次的泛化数据都是空间数据。例如各中土地类型的精确分布情况及其泛化数据,如土地利用类型在全省范围的精确分布图形数据。,1.4.3 度量的建模在空间数据仓库中可建立两种类型的度量:数值型度量,仅仅包含数值型数据的度量。数值型度量可以进一步分为分布的、代数的和整体的。如果一个度量能用立方体分割和分布式聚介计算,那么它就是分布的,如count、sum、max如果一个度量能用分布式度量的代数操作运算,那么它就是代数的,如average、standard、deviation; 如果

10、一个度量,用于描述其子聚介的有储空间的大小没有常数约束,那么它就是全局的,如median、most frequent、rank空间度量,空间度量包含指向空间对象指针集合。例如,在泛化操作中,相同的单元,这样形成的度量包含这些区域的指针的集合。,1.5 空间数据仓库的结构框架空间数据仓库是在GIS空间数据库的基础上,利用数据库技术、元数据技术、网络技术对海量地理空间数据进行集成、管理、查询分析、分发及应用,空间数据仓库的总体框架如图1所示(其中实线框架内为空间数据仓库系统的研究内容,虚线框架内为其它系统的研究内容)。,地理空间数据库位于空间数据仓库的最底层,这些数据可能来自不同单位,表示不同时期

11、由不同软件系统管理,它们相互独立,形成各式各样的异构数据,成为空间数据仓库的数据源.应用系统位于最顶层,它通过统一标准的数据接口提取地理空间数据为多种应用系统服务空间数据仓库系统位于中间层,它提取地理空间数据库中的数据,经过空间数据仓库进行数据集成转换,为应用系统提供数据由此而看见空间数据仓库是一个多源数据共享、处理机制在网络技术、数据仓库技术日益成熟的今天,根据用户的不同需求,以空间数据仓库系统为平台,访问多个地理空间数据库,进行数据挖掘和GIS多维空间分析,为多种应用系统提供全面、科学、实用的决策支持。,2.空间数据仓库研究中主要研究方向,根据空间数据仓库的总体框架,目前空间数据仓库研究的

12、重点有:空间数据的ETL、空间数据仓库元数据管理、GIS多维空间分析三方面.ETL是指从源系统中提取数据,转换数据为一个标准的格式,加载数据到目标数据存储区,是空间数据仓库的构建过程中不可避免的问题,可以有以下两种解决方案:一是把数据源中的数据分为空间数据、多种数据库数据、XML文档数据花种形式,分别设计数据转换工ETL转换工具基于特定的软件,结合具体情况进行空间数据的集成转化.前一种方法需要对数据进行分别具;一是借助元数据管理、开发专用的,前一种方法需要对数据进行分别具;一是借助元数据管理、开发专用的处理,在加载过程中要求空间数据仓库系统的储存、更新、管理数据效率较高;后一种方法由于引入元数

13、据管理,对数据的要求比较高,在实施时劳动强度比较大,可引人智能技术,提高空间数据ETL自动化和分析集成的水平.介于元数据在GIS中的重要地位,后一种实现方法的前景是比较诱人的,这是因为元数据是用来描述地理空间数据集的内容、质量、状态等其他特性的数据,它们在实现地理空间数据仓库的过程中起着重要的作用:指示空间数据仓库如何从多个地理信息数据库中提取出数据种类、数据标准等方面不同的地理空间数据;指示应用系统如何从空间数据仓库中提取出标准的集成的地理空间数据.为用户提供地理空间数据产品服务等.,目前对空间数据仓库元数据的研究主要集中在地理空间数据元数据的研究上.国际上有三个组织对地理空间数据元数据标准

14、进行了大量的研究,这三个组织分别是:美国联邦地理数据委员会(FGDC)、欧洲地理信息标准化委员会(CEN/TC287)以及国际标准化组织(ISO)地理信息/地球信息业技术委员会(ISO/TV211).在国内有中国可持续发展信息共享元数据标准、NREDIS信息共享元数据内容标准等.但对空间数据仓库元数据的研究还是一片空白,当前可见的是武汉大学昊金华提出的空间数据仓库元数据的研究.,GIS因为其空间分析功能而逐渐发展起来.但随着空间分析功能的深人研究,对空间数据的时间维、专题维的考虑日益成为GIS空间分析的重点,在空间数据仓库中引人时间信息维、专题信息维,可以大大提高了GIS空间分析的能力.目前国

15、外提出空间数据立方体(SOLAP)技术,将来自不同领域的地理空间信息、专题信息1、专题信息2,专题信息n、时间信息按维的形式组成一个易理解的超数据立方体.用地理空间维、专题维、时间维来描述空间对象,通过维的不同操作可产生不同的空间分析结果,以满足多维空间分析和概括的需求,实现GIS多维空间信息分析功能,进一步为用户提供决策支持,这无疑为GIS的发展提供了更为广阔的空间.大大的拓宽了GIS的应用范围.,3.空间数据仓库的应用实例,一、澜沧江流域水资源空间数据仓库设计及实现1.空间数据仓库体系框架设计澜沧江流域水资源空间数据仓库体系结构由数据源、数据转换、空间数据仓库和客户端分析工具四个部分组成。

16、集成器对来自各种异构数据源数据进行抽取、清洗和转换后,数据信息进入统一空间数据库管理平台,通过主题的确定,建立空间数据立方体模型结构,形成空间数据仓库。最后,对多维数据进行多维分析及数据挖掘,并进行可视化处理。,2.空间数据仓库实现关键技术 2.1 数据源澜沧江流域数据信息形式多样,从地域单元上分成项目区、地区、县、乡四级;从数据类型上包括图形数据、图象数据、专题GIS数据、统计数据和成果图象数据五类。由于数据来自不同的GIS应用平台及数据库管理系统,如何将它们高效地集成起来是构建空间数据仓库的关键。为此,对数据信息的集成采取同类信息集成、异类信息集成两种方式。,同类信息集成同类信息集成指对来源不同、格式各异的澜沧江区域多源数据,包括属性数据、图形数据与图象数据,按类集成。它相当于对属性数据、图形数据及图象数据按类进行整理,解决数据格式异构性、主题异构性、语义异构性、编码异构性、投影参考坐标系异构性等一系列同类信息异构性问题。 异类信息集成异类信息集成指对澜沧江区域不同种类的信息进行集成,其关键是如何在各类数据信息之间建立起共同的识别字段。通过区域代码ID(国际码)作为属性数据、空间数据的识别字段,易于建立属性数据和空间数据两类数据间的关联,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号