《第四章栅格数据模型》由会员分享,可在线阅读,更多相关《第四章栅格数据模型(75页珍藏版)》请在金锄头文库上搜索。
1、第四章第四章 栅格数据模型栅格数据模型2014.3.7空间数据在计算机中分层表示空间数据在计算机中分层表示数据层 栅格数据 栅格数据表达中,栅格由一系列的栅格坐标或像元所处栅格矩阵的行列号(I, J)定义其位置,每个像元独立编码,并载有属性。栅格单元的大小代表空间分辨率,表示表达的精度。在影像中,栅格单元的值是栅格内的平均灰度。 栅格数据 栅格结构的建立获取数据栅格结构的建立获取数据遥感数据遥感数据将经过分类解译的遥感影像数据直接或重采样后输入系统,作为栅格数据结构的专题地图。图片的扫描图片的扫描逐点扫描专题地图,将扫描数据重采样和再编码得到栅格数据文件。矢量数据转换而来矢量数据转换而来数字化
2、仪手扶或自动跟踪数字化地图,得到矢量结构数据后,再转换为栅格结构;或者运用矢量数据栅格 化技术,利用GIS直接进行转换,为了有利于某些操作或者有利于输出。手工方法获取手工方法获取在专题图上均匀划分网格,逐个网格地决定其代码,最后形成栅格数字地图文件,也叫目读法。栅格数据结构栅格数据结构以规则的像元阵列来表示空间地物或现象的分布以规则的像元阵列来表示空间地物或现象的分布的数据结构,其阵列中的每个数据表示地物或现的数据结构,其阵列中的每个数据表示地物或现象的属性特征。换句话说,栅格数据结构就是像象的属性特征。换句话说,栅格数据结构就是像元阵列,用每个像元的行列号确定位置,用每个元阵列,用每个像元的
3、行列号确定位置,用每个像元的值表示实体的类型、等级等的属性编码。像元的值表示实体的类型、等级等的属性编码。1 1、点实体:表示为一个像元;、点实体:表示为一个像元;2 2、线实体:表示为在一定方向上连接成串的相邻、线实体:表示为在一定方向上连接成串的相邻像元的集合;像元的集合;3 3、面实体:表示为聚集在一起的相邻像元的集合、面实体:表示为聚集在一起的相邻像元的集合点线面在栅格结构中,地表被分成相互邻接、规则排列在栅格结构中,地表被分成相互邻接、规则排列的矩形方块的矩形方块( (特殊的情况下也可以是三角形或菱特殊的情况下也可以是三角形或菱形、六边形等形、六边形等 。每个地块与一个栅格单元相对。
4、每个地块与一个栅格单元相对应。栅格数据的比例尺就是栅格大小与地表相应应。栅格数据的比例尺就是栅格大小与地表相应单元大小之比。单元大小之比。行西南角格网坐标(XWS,YWS)格网分辨率格网方向列单个格网代表点,一系列相邻格网单元代表线,邻单个格网代表点,一系列相邻格网单元代表线,邻接格网的集合代表面。接格网的集合代表面。格网中的每个格网单元有一个值,整型或浮点型。格网中的每个格网单元有一个值,整型或浮点型。整型格网单元值通常代表类别数据。浮点型格网单整型格网单元值通常代表类别数据。浮点型格网单元值常表示连续数据。元值常表示连续数据。格网中的每一单元值代表了由此行此列决定的该位格网中的每一单元值代
5、表了由此行此列决定的该位置上的空间现象的特征。栅格数据模型不把空间数置上的空间现象的特征。栅格数据模型不把空间数据与属性数据明确分开。据与属性数据明确分开。n如以像元边线计算则为如以像元边线计算则为7 7,以像元为单位则为,以像元为单位则为4 4。 n三角形的面积为三角形的面积为6 6个平方单位,而右图中则为个平方单位,而右图中则为7 7个平个平方单位,这种误差随像元的增大而增加。方单位,这种误差随像元的增大而增加。abc345abcac距离: 7/4 (5)面积: 7 (6)栅格数据的栅格数据的比例尺比例尺就是栅格的大小与地表相应单元就是栅格的大小与地表相应单元的大小之比,当像元所表示的面积
6、较大时,对长度、的大小之比,当像元所表示的面积较大时,对长度、面积等的量测有较大影响。面积等的量测有较大影响。每个像元的属性是地表相应区域内地理数据的近似每个像元的属性是地表相应区域内地理数据的近似值,因而有可能产生偏差。值,因而有可能产生偏差。栅格数据模型中,如何将属性数据赋予空栅格数据模型中,如何将属性数据赋予空间数据?间数据?在GIS数据库中,对于分层的栅格数据的存储结构有三种基本方式方法一:基于像元每一个网格单元都赋予一个数值。(简单,但无法有多重属性)需要表达多重属性就必须建立多个栅格图层。土地产权土地产权地形地形土地使用土地使用建筑物建筑物ZYX栅格数据的组织栅格数据的组织方法二:
7、基于层方法二:基于层以像元为记录序列,不同层上同一像元位置上的各属性值以像元为记录序列,不同层上同一像元位置上的各属性值表示为一个列数组。表示为一个列数组。N N层中只记录一层的像元位置,节约层中只记录一层的像元位置,节约大量存储空间,因为栅格个数很多。大量存储空间,因为栅格个数很多。 方法三:基于多边形方法三:基于多边形以层为基础,每层内以多边形为序记录多边形的属性值和以层为基础,每层内以多边形为序记录多边形的属性值和多边形内各像元的坐标。节约用于存储属性的空间。将同多边形内各像元的坐标。节约用于存储属性的空间。将同一属性的制图单元的一属性的制图单元的n n个像元的属性只记录一次,便于地个像
8、元的属性只记录一次,便于地图分析和制图处理。图分析和制图处理。栅格数据的类型栅格数据的类型卫星影像Satellite imagery from many sensors像元值:从地球表面反射或发射的光能数字高程模型DEM:由等间隔海拔数据的排列组成以点为基础的,可转换到栅格数字正射影像DOM:消除照相机镜头和地形起伏引起的位移二值扫描文件:地形图的黑白扫描图像 数字栅格图:地形图的彩色扫描图像图形文件:照片等特定GIS软件的栅格数据:ESRI GridSatelliteImageryAirPhotosScannedMaps优点高精度文件大数据结构简单需要解决问题有效存储处理更快容易检索多个客户
9、同时操作上述问题都与数据结构、数据压缩有关栅格数据模型栅格数据模型栅格系统的确定栅格系统的确定栅格坐标系的确定栅格坐标系的确定:表示具有空间分布特征的地理要素,不论采用什么编码系统,什么数据结构(矢、栅)都应在统一的坐标系统下,而坐标系的确定实质是坐标系原点和坐标轴的确定。 栅格单元的尺寸栅格单元的尺寸:栅格单元的尺寸确定的原则是应能有效地逼近空间对象的分布特征,又减少数据的冗余度。格网太大,忽略较小图斑,信息丢失。一般讲实体特征愈复杂,栅格尺寸越小,分辨率愈高,然而栅格数据量愈大,按分辨率的平方指数增加,计算机成本就越高,处理速度越慢。 栅格代码(属性值)的确定栅格代码(属性值)的确定1 1
10、、中心归属法:每个栅格单元的值由该栅格的中、中心归属法:每个栅格单元的值由该栅格的中心点所在的面域的属性来确定。心点所在的面域的属性来确定。2 2、长度占优法:每个栅格单元的值由该栅格中线、长度占优法:每个栅格单元的值由该栅格中线段最长的实体的属性来确定。段最长的实体的属性来确定。3 3、面积占优法:每个栅格单元的值由该栅格中单、面积占优法:每个栅格单元的值由该栅格中单元面积最大的实体的属性来确定。元面积最大的实体的属性来确定。4 4、重要性法:根据栅格内不同地物的重要性,选、重要性法:根据栅格内不同地物的重要性,选取最重要的地物的类型作为栅格单元的属性值。取最重要的地物的类型作为栅格单元的属
11、性值。这种方法适用于具有特殊意义而面积较小的实体这种方法适用于具有特殊意义而面积较小的实体要素。要素。CAB百分比法面积占优重要性中心点法A连续分布地理要素C具有特殊意义的较小地物A分类较细、地物斑块较小AB栅格数据单元值确定栅格数据单元值确定 为了逼近原始数据为了逼近原始数据精度,除了采用这几种精度,除了采用这几种取值方法外,还可以采取值方法外,还可以采用缩小单个栅格单元的用缩小单个栅格单元的面积,增加栅格单元总面积,增加栅格单元总数的方法。数的方法。空间数据的压缩与重分类空间数据的压缩与重分类n数据压缩:从取得的数据集合数据压缩:从取得的数据集合S S中抽取一个子集中抽取一个子集A A,这
12、,这个子集作为新的信息源,在规定的精度范围内最好地个子集作为新的信息源,在规定的精度范围内最好地逼近原集合,取得尽可能大的压缩比。逼近原集合,取得尽可能大的压缩比。n压缩的目的:压缩的目的:除冗余数据,减少数据的存贮量,节省除冗余数据,减少数据的存贮量,节省存贮空间,加快后继处理的速度。存贮空间,加快后继处理的速度。n栅格数据的压缩技栅格数据的压缩技术有游程编码、四术有游程编码、四叉树编码等。叉树编码等。n矢量数据的压缩主矢量数据的压缩主要是对线性要素中要是对线性要素中心轴线和面状要素心轴线和面状要素边界的压缩。边界的压缩。图形显示输出图形显示输出数据存储数据存储数据压缩数据压缩 光滑光滑 栅
13、格数据的编码栅格数据的编码在数据无压缩的情况下,栅格数据按直接编码顺序进行存储。所谓直接编码,是将栅格数据看成一个数字矩阵,数据存储按矩阵编码方式存储。如果为了特定的目的,也可按下图的特殊编码顺序记录。栅格数据结构的表示和压缩编码栅格数据结构的表示和压缩编码Raster数据是二维表面上地理数据的离散量化值,每一层的pixel值组成像元阵列(即二维数组),其中行、列号表示它的位置。例如影像: A A A A A B B B A A B B A A A B在计算机内是一个4*4阶的矩阵。但在外部设备上,通常是以左上角开始逐行逐列存贮。如上例存贮顺序为:A A A A A B B B A A B B
14、 A A A B当每个像元都有唯一一个属性值时,一层内的编码就需要m行n列3(x,y和属性编码值)个存储单元。数字地面模型就属此种情况。多种压缩存储量的数据结构多种压缩存储量的数据结构分辨率的提高和数据量之间呈平方指数关系分辨率的提高和数据量之间呈平方指数关系 分辨率与精度的问题。如果精度越大、分辨率大,数据量就越大。为了减少数据量,产生了多种压缩存储量的为了减少数据量,产生了多种压缩存储量的数据结构数据结构 栅格数据的压缩目的:减少数据量。通过某种编码的方法,达到减少数据长度的目的。多种压缩编码栅格数据结构多种压缩编码栅格数据结构链式编码(chain codes) 又称为弗里曼链码(Free
15、man)或边界链码。 基本方向可定义为:东0,东南l,南二2,西南3,西4,西北5,北6,东北7等八个基本方向。如果再确定原点为像元(10,1),则该多边形边界按顺时针方向的链式编码为:10,l,7,0,1,0,7,1,7,0,0,2,3,2,2,1,0,7,0,0,0,0,2,4,3,4,4,3,4,4,5,4,5,4,5,4,5,4,6,6。链式编码优缺点:优点: 链式编码对线状和多边形的表示具有很强的数据压缩能力,且具有一定的运算功能,如面积和周长计算等,探测边界急弯和凹进部分等都比较容易,类似矢量数据结构,比较适于存储图形数据。尤其对于线状和多边形较大区域具有较高的压缩率。 缺点:对叠
16、置运算如组合、相交等则很难实施,对局部修改将改变整体结构,即修改和插入比较困难,效率较低,而且由于链码以每个区域为单位存储边界,相邻区域的边界则被重复存储而产生冗余。栅格数据结构的表示栅格数据结构的表示 游程长度编码(run length code)是按行帧序存储多边形内的各个像元的列号,即在某行上从左至右存储属该多边形的始末像元的列号。问:对右图的进行游程长度编码。游程编码(run-length codes)逐行操作记录每一行中每一个数值的开始位置和长度AAAAAAAAAA 纪录为A 10 0(值、长度、行号)AAAAABBBBA A 5 1 B 4 1 A 1 1BBBBBBBBBA B
17、9 2 A 1 2压缩的效果与地图的复杂效果有关对于地图变化越大,效果就越不明显游程编码的优缺点游程编码的优缺点优点:对于线状和较大区域具有较高的压缩率;优点:对于线状和较大区域具有较高的压缩率;数据检索和运算比较简单,容易完成检索、叠加、数据检索和运算比较简单,容易完成检索、叠加、合并等操作;数据精度增加,数据量不会显著增合并等操作;数据精度增加,数据量不会显著增加,对编码形式影响不大;适用于小型计算机,加,对编码形式影响不大;适用于小型计算机,同时减少了栅格数据库的数据输入量。同时减少了栅格数据库的数据输入量。缺点:计算时的处理和制图输入工作量有所增加。缺点:计算时的处理和制图输入工作量有
18、所增加。 块式编码是将游程长度块式编码是将游程长度编码扩大到二维的情况,编码扩大到二维的情况,把多边形范围划分成由像把多边形范围划分成由像元组成的正方形,然后对元组成的正方形,然后对各个正方形进行编码。如各个正方形进行编码。如图:图:块式编码的数据结构(初始行,列,半径,属性)根据这一编码原则,上述多边形只需17个单位正方形。9个4单位的正方形和1个16单位的正方形就能完整表示,总共要57个数据,其中27对坐标,3个块的半径。特点:具有可变分辩率大块图斑记录单元大,分辩率低,压缩率高;小块图斑记录单元小,分辩率高,压缩率低。一个多边形所包含的正方形越大,多边形的边界越一个多边形所包含的正方形越
19、大,多边形的边界越简单,块状编码的效率就越好。游程编码和块状编简单,块状编码的效率就越好。游程编码和块状编码均对大而简单的多边形更为有效,而对那些碎部码均对大而简单的多边形更为有效,而对那些碎部较多的复杂多边形效果并不好。块状编码在合并、较多的复杂多边形效果并不好。块状编码在合并、插入、检查延伸性、计算面积等操作时有明显的优插入、检查延伸性、计算面积等操作时有明显的优越性。然而对某些运算不适应,必须在转换成简单越性。然而对某些运算不适应,必须在转换成简单数据形式才能顺利进行。数据形式才能顺利进行。四叉树编码四叉树编码四叉树编码是最有效的栅格数据压缩编码方法之一,在GIS中有广泛的应用。四叉树编
20、码又称为四分树、四元树编码。它是一种更有效地压编数据的方法。它将2n2n像元阵列连续进行4等分,一直分到正方形的大小正好与象元的大小相等为止(如下图),而块状结构则用四叉树描述,习惯上称为四叉树编码。四分树编码(Quadtree codes) 可变分辨率的方法。通过变化分辨率来达到压缩的目的。栅格连续四分,直到每一个4分后的块都是同一数值为止。采用不同的分辨率存储4分后的每一个块。易于查询、适应于存储数据量大的地图 K为树的高度,图中k=3。四叉树的存储可按常规叶结点的顺序存储,称为常规四叉树。按特定叶结点顺序存储的称为线性四叉树。l常规四叉树:每个结点记录六个指针变量:父结点指针,四个子结点
21、的指针,本结点的属性值。指针不仅增加了数据的存储量,还增加了操作的复杂性,所以常规四叉树并不广泛用于存储数据,其价值在于建立索引文件,进行数据检索。用地址码(定位码、Morton码)记录叶节点的位置、深度(几次分割)和属性。优点:l存储量小,只对叶节点编码,节省了大量中间结点的存储,地址码隐含着结点的分割路径和分割次数;l线性四叉树可以直接寻址,通过其坐标值直接计算morton码,而不用建立四叉树;l定位码容易存储和执行实现集合相加等组合操作。把一幅mm的图像压缩成线性四叉树的过程(1)按morton码把图像读入一维数组。(2)相邻的四个象元比较,一致的合并,只记录第一个象元的morton码,
22、循环比较所形成的大块,相同的再合并,直到不能合并为止。(3)进一步用游程长度编码压缩。压缩时只记录第一个象元的morton码。例子解码时,根据Morton码,就可知道象元在图像中的位置。从左上角,本Morton码和下一个Morton码之差即为象元个数。知道了象元的个数和象元的位置就可恢复出图像了。四叉树编码的优缺点;优点:容易而有效地计算多边形的数量特征;阵列各部分的分辨率是可变的,边界复杂部分四叉树较高,即分级多,分辨率也高;而不需表示许多细节的部分则分级少,分辨率低,因而既可精确表示图形结构又可减少存贮量;栅格到四叉树及四叉树到简单栅格结构的转换比其它压缩方法容易;多边形中嵌套异类小多边形
23、的表示较方便。缺点:转换不具稳定性,用同一形状和大小的多边形可能得出多种不同的四叉树结构,故不利于形状分析和模式识别。允许在多边形中嵌套多边形即所谓“洞”这种结构存在。 AAAAARAAARAAARAARAAAAAAAAAGGAAGGGGGGGAGGGAGGAAAAAARAAAARAAARRAAA1432587612345678起点行列号,单位矢量R: (1,5),3,2,2,3,3,2,3链式编码游程长度编码逐行编码数据结构: 行号, 属性, 重复次数1, A, 4, R, 1, A, 4块状编码正方形区域为记录单元数据结构: 初始位置, 半径, 属性(1,1,3,A),(1,5,1,R),
24、(1,6,2,A),NESWNWSEGG G G A G G A A G A A A四叉树编码01234567数据压缩数据压缩做法减少栅格文件的数据量目的有利于数据传输和网络制图压缩方法无损压缩精确还原原始图像,如游程编码格式、TIFF格式数据量超大有损压缩无法精确还原原始图像,如JPEG格式可以减少数据量矢量栅格数据结构的优缺点矢量栅格数据结构的优缺点n优点优点:便于面向现象(土壤类、土地利便于面向现象(土壤类、土地利用单元)用单元)结构紧凑,冗余度低,便于描述结构紧凑,冗余度低,便于描述线或边界线或边界利于网络、检索分析,提供有效利于网络、检索分析,提供有效的拓扑编码,对需要拓扑信息的的拓
25、扑编码,对需要拓扑信息的操作更有效。操作更有效。图形显示质量好,精度高图形显示质量好,精度高n缺点:缺点:数据结构复杂,各自定义,不便数据结构复杂,各自定义,不便于数据标准化和规范化,数据交于数据标准化和规范化,数据交换困难。换困难。多边形叠置分析困难,没有栅格多边形叠置分析困难,没有栅格有效,表达空间变化性能力差。有效,表达空间变化性能力差。不能像熟悉图像那样做增强处理。不能像熟悉图像那样做增强处理。软硬件技术要求高,显示与绘图软硬件技术要求高,显示与绘图成本要求较高成本要求较高n优点优点:数据结构简单,易数据交换数据结构简单,易数据交换叠置分析和地理现象模拟较易叠置分析和地理现象模拟较易利
26、于与遥感数据的匹配应用和分利于与遥感数据的匹配应用和分析,便于图像处理。析,便于图像处理。输出快速,成本低廉。输出快速,成本低廉。n缺点:缺点:现象识别效果不如矢量方法,难现象识别效果不如矢量方法,难以表达拓扑。以表达拓扑。图形数据量大,数据结构不严密图形数据量大,数据结构不严密不紧凑,需用压缩技术解决该问不紧凑,需用压缩技术解决该问题。题。投影转换困难投影转换困难图形质量转低,图形输出不美观,图形质量转低,图形输出不美观,线条有锯齿,需用增加栅格数量线条有锯齿,需用增加栅格数量来克服,但会增加数据文件。来克服,但会增加数据文件。矢量数据矢量数据栅格数据栅格数据数据转换数据转换由于矢量数据和栅
27、格数据各自的优点和互补性,矢量到栅格、栅格到矢量的转换的情况在GIS中经常发生。一、矢量一、矢量栅格转换栅格转换 由于矢量数据的点到栅格数据的点只是简单的坐标变换,所以,这里主要介绍线和面(多边形)的矢量数据向栅格数据的转换。矢量数据向栅格数据转换矢量数据向栅格数据转换点的转换线线的栅格化方法的栅格化方法 线是由多个直线段组成的,因此,线的栅格化的核心就是直线段如何由矢量数据转换为栅格数据 。线段的变换线线的栅格化方法的栅格化方法 设直线段的两端点坐标转换到栅格数据的坐标系后为(XA, YA),(XB, YB)。 面(多边形)的栅格化方法面(多边形)的栅格化方法多边形数据的转换 (边界代数算法
28、、内部点扩散法、射线算法)面(多边形)的栅格化方法面(多边形)的栅格化方法多边形的栅格化方法主要有三种算法(1)内部点扩散法 由一个内部的种子点,向其4个方向的邻点扩散。判断新加入的点是否在多边形边界上,如果是,不作为种子点,否则当作新的种子点,直到区域填满,无种子点为止。 该算法比较复杂,而且可能造成阻塞而造成扩散不能完成(如图),此外若多边形不完全闭合时,会扩散出去。(2)扫描法 如图,按扫描线的顺序,计算多边形与扫描线的相交区间,再用相应的属性值填充这些区间,即完成了多边形的栅格化。(3)边填充算法 其基本思想是:对于每一条扫描线和每条多边形边上的交点,将该扫描线上交点右方的所有象素取原
29、属性值之补。对多边形的每条边作此处理,多边形的方向任意。如图,是一个简单的例子。栅格向矢量转换栅格向矢量转换从栅格单元转换为几何图形的过程为矢量化;从栅格单元转换为几何图形的过程为矢量化; (一)要求(矢量化过程应保持):(一)要求(矢量化过程应保持): 1 1) 栅栅-矢转换为拓扑转换,即保持实体原有的连矢转换为拓扑转换,即保持实体原有的连通性、邻接性等;通性、邻接性等; 2 2) 转换实体保持正确的外形。转换实体保持正确的外形。(二)方法(二)方法 方法一方法一,实际应用中大多数采用实际应用中大多数采用人工矢量化人工矢量化法,如扫描矢量法,如扫描矢量化化。 方法二方法二,程序转化转换(全自
30、动或半自动)程序转化转换(全自动或半自动) 过程为:过程为: 遥感影象图遥感影象图栅格分类图栅格分类图边界边界提取提取二值化二值化编编辑辑矢矢量量跟跟踪踪数数据据压压缩缩原始线划图原始线划图二值化二值化细化细化分分类类图图扫描扫描预预处处理理拓拓扑扑化化1 1、二值化、二值化 由于扫描后的图像是以不同灰度级存储的,为了进行栅格数据矢量化的转换,需压缩为两级(0和1),称为二值化。2、二值图像的预处理对于扫描输入的图幅,由于原稿不干净等原因,总是会出现一些飞白、污点、线划边缘凹凸不平等。3 3、细化、细化 所谓细化就是将二值图像象元阵列逐步剥除轮廓边缘的点,使之成为线划宽度只有一个象元的骨架图形
31、。细化后的图形骨架既保留了原图形的绝大部分特征,又便于下一步的跟踪处理。 细化的基本过程是:(1)确定需细化的象元集合;(2)移去不是骨架的象元;(3)重复,直到仅剩骨架象元。如果是对扫描后的地图图像进行细化处理,应符合下列基本要求:(1)保持原线划的连续性; (2)线宽只为一个象元; (3)细划后的骨架应是原线划的中心线; (4)保持图形的原有特征。4 4、追踪、追踪 细化后的二值图像形成了骨架图,追踪就是把骨架转换为矢量图形的坐标序列。其基本步骤为: (1)从左向右,从上向下搜索线划起始点,并记下坐标。 (2)朝该点的8个方向追踪点,若没有,则本条线的追踪结束,转(1)进行下条线的追踪;否则记下坐标。 (3)把搜索点移到新取的点上,转(2)。 注意的是,已追踪点应作标记,防止重复追踪。5 5、拓扑化、拓扑化 为了进行拓扑化,需找出线的端点和结点,以及孤立点。 (1)孤立点:8邻域中没有为1的象元。如图(1)。 (2)端点:8邻域中只有一个为1的象元。如图(2)。 (3)结点:8邻域中有三个或三个以上为1的象元。如图(3)。