空间数据的质量控制解析

上传人:最**** 文档编号:117056284 上传时间:2019-11-18 格式:PPT 页数:56 大小:6.42MB
返回 下载 相关 举报
空间数据的质量控制解析_第1页
第1页 / 共56页
空间数据的质量控制解析_第2页
第2页 / 共56页
空间数据的质量控制解析_第3页
第3页 / 共56页
空间数据的质量控制解析_第4页
第4页 / 共56页
空间数据的质量控制解析_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《空间数据的质量控制解析》由会员分享,可在线阅读,更多相关《空间数据的质量控制解析(56页珍藏版)》请在金锄头文库上搜索。

1、第七章第七章 空间数据的质量控制空间数据的质量控制 Geographic Database Query and Analysis Spatial Data Input and Management Output: Display Help Prevent “Garbage in,Garbage out !” G I SG I S 一、空间数据质量 1.空间数据质量的定义 空间数据质量是指数据适用于不同应用的能力 空间位置、专题特性以及时间是表达现实世界空 间变化的三个基本要素。数据质量则是空间数据 在表达这三个基本要素时, 所能够达到的准确性 、一致性、完整性以及它们三者之间统一性的程 度。

2、完整性:能否完全地表达要描述的给定目标 空间数据质量的好坏是一个相对概念 2.数据质量的描述框架 导致数据质量问题的十大原因: 多重数据源 数据生产中主观的判断与技术 过松或过严的输入规则 大量的数据 分布式异构系统 复杂的数据表达,如文本和图像 不同功能领域的编码数据 客户改变数据需求 安全与可访问性的权限 有限的计算资源 l数据质量主要侧重问题: l数据的可信度,这是在数据生产过程中形成的质 量,为本征质量 l数据的可用度,从用户或数据共享的角度出发描 述数据质量,将用户要求的满意程度作为衡量数 据质量的重要指标,此时的数据质量表现为满足 使用要求的相对状态 (1 1)数据可信度)数据可信

3、度 l精确性 l完整性 l一致性 l有效性 l唯一性 精确性精确性 l数据的准确度: 被定义为结果、计算值或估计值 与真实值或者大家公认的真值的接近程度。即一 个记录值(测量或观察值)与它的真实值之间的接 近程度。它可用误差来衡量。 l数据的精密度:数据表示的精密程度, 用数据的 有效位数来表示, 它表现了测量值本身的离散程 度。 l数据的精确度:精密度的实质在于它对数据准确 度的影响, 同时在很多情况下, 它可以通过准确 度而得到体现, 故常把二者结合在一起称为精确 度, 简称精度, 即对现象描述的详细程度。精度 低的数据并不一定准确度也低. 完整性完整性 l指地理数据在范围、内容和结构等方

4、面满 足所有要求的完整程度,包括数据范围、 空间实体类型、空间关系分类、属性特征 分类等方面的完整性。 l一致性:指地理数据关系上的可靠性,包括数据 结构、数据内容,以及拓扑性质上的内在一致性 l有效性:数据是否具有实际意义 l唯一性:数据记录与特征信息是否存在一一对应 关系 (2)数据可用度 l时间性:数据的现势性,稳定性 l可得性:来源、版权、使用期限 l满意度:是否满意、是否清晰易懂、能否 动态扩充 3.影响空间数据质量的原因 数据处理过程误 差 来 源 数据搜集 野外测量误差:仪器误差、记录误差 遥感数据误差:辐射和几何纠正误差、信息提取误差 地图数据误差:原始数据误差、坐标转换、制图

5、综合及印刷 数据输入 数字化误差:仪器误差、操作误差 不同系统格式转换误差:栅格-矢量转换、三角网-等值线转换 数据存储 数值精度不够 空间精度不够:每个格网点太大、地图最小制图单元太大 数据处理 分类间隔不合理 多层数据叠合引起的误差传播:插值误差、多源数据综合分析 误差 比例尺太小引起的误差 数据输出 输出设备不精确引起的误差 输出的媒介不稳定造成的误差 数据使用 对数据所包含的信息的误解 对数据信息使用不当 (1)空间现象自身的不稳定性 (2)空间数据生产中的误差 l系统误差:在相同的测量条件下的测量值序列中 数值、符号保持不变或按某确定规律变化的测量 误差 l随机误差:在实际相同条件下

6、,多次测量同一量 值时,其绝对值和符号无法预计的测量误差 l粗差:在相同的测量条件下的测量值序列中,超 过三倍中误差的测量误差 常见空间数据误差分析 l逻辑误差:数据的不 完整性是通过上述四 类误差反映出来的。 事实上检查逻辑误差, 有助于发现不完整的 数据和其他三类误差 。对数据进行质量控 制或质量保证或质量 评价, 一般先从数据 的逻辑性检查人手。 l(2) 几何误差。由于地图是以二维平面坐标表 示位置 , 在二维平面上的几何误差主要反映在点 和线上。 la. 点误差。 l关于某点的点误差即为测量位置(x,y)与其真实位 置 ( x0 ,y0)的差异。坐标误差定义为: l x = x -

7、x0 l y = y - y0 l为了衡量整个数据采集区域或制图区域内的点误 差, 一般采用抽样测算(x,y)。抽样点应随机 分布于数据采集区内, 并具有代表性。这样抽样 点越多, 所测的误差分布就越接近于点误差的真 实分布。 lb. 线误差。线在系统数据库中既可表示线性现象 , 又可以通过连成的多边形表示面状现象。 l第一类:线在真实世界中是可以找到的, 如道路 、河流、行政界线等, 这类线性特征的误差主要 产生于测量和对数据的后处理 ; l第二类:现实世界中找不到的, 如按数学投影定 义的经 纬线、等高线、气候区划线和土壤类型界 限等, 这类线性特征的线误差, 被称为解译误差 。 解译误差

8、与属性误差直接相关, 若没有属性 误差, 则可以认为那些类型界线是准确的, 因而 解译误差为零。 l数据质量的描述通常分为不同层次,但目前尚未 形成用于表示这种层次性的统一术语 l确保空间数据质量难度较大:不同的数据来源、 数据源的专业性和独立性 l在统一的地理框架下建立跨系统、跨部门的统一 用户视图,清理、合并数据对数据质量解决方案 的实施至关重要 l遥感数据获取误差是获取数据的过程中受自然条 件及卫星的成图成像系统影响所造成的误差 l处理误差是利用地面控制点对原始数据进行几何 校正、图像增强和分类等引起的误差 l转换误差一般是在矢量与栅格数据转换过程中形 成的 l人工判读误差:解析和判读时

9、产生 (3)空间数据处理中的误差 投影变换 地图数字化和扫描后的矢量化处理 数据格式转换 数据抽象 建立拓扑关系 与主控数据层的匹配 数据叠加操作和更新 数据集成处理 数据的可视化表达 数据处理过程中误差的传递和扩散 (4)数据组织时产生的质量问题 l数据组织时的质量问题可能出在单个或多个数据 集合中 l与数据记录本身相关的质量问题,称为实例相关 问题;与数据组织关系有关的质量问题,称为模 式相关问题 l数据组织中产生的质量问题主要是由于缺乏合适 的数据模型或满足特定应用的完整性约束而引起 的 典型的实例相关问题 l空缺值 l拼写问题 l内嵌数据 l属性依赖冲突 l数据重复 二、质量控制体系

10、1.质量管理体系 2.质量标准体系 l空间数据质量标准是生产、使用和评价空间数据 的依据。 l目前, 世界上已建立了一些数据质量标准, 如美 国FGDC的质量标准等。 l空间数据质量标准的建立必须考虑数据产生的全 过程。 空间数据分类标准 (1)原则: 1)遵循已有的国家标准,以利于全国范围内的数据 共享。 2)遵循国务院有关部委以及军队正在使用的数据标 准。 3)遵循各领域中普遍使用和认同的数据标准。 4)当各种数据标准相互矛盾时,应遵循由上而下的 原则进行处理。 5)制定新的数据标准时,应尽可能参考同类标准。 (2)目前我国已有的与GIS有关的关于空间数据分类 的国家标准: GB2260-

11、95 中华人民共和国行政区划代码 GB13923-92 国土基础信息数据分类与代码 GB11708-89 公路桥梁命名和编码规则 GB14804-93 1:500、1:1000、1:2000地形要 素分类与代码 等等。 空间数据交换标准 (1)外部数据交换标准 特点:自动化程度不高,速度较慢等,但它可 解决不同GIS之间的数据转换问题。它仍然是 实现数据共享的主流方式。 GIS-A 数据格式 GIS-B 数据格式 外部数据交 换格式标准 数据转换 数据转换 (2)空间数据互操作协议 特点:比外部数据交换标准方便,但由于各种 软件存储和处理空间数据的方式不同,空间数 据的互操作函数又不可能很庞大

12、,因此往往不 能解决所有问题。 GIS-AGIS-B 操纵空间数 据的API 直接调用 操纵 直接调用 操纵 服务器存放空间数据,采用客户机/服务器体系结 构,各种GIS通过一个公共的平台在服务器存取所有数 据,以避免数据的不一致性。 特点:思路较好,但现有的GIS软件各有自己的底 层,要统一平台目前难以实现 GIS-A GIS-B 服务器存 放空间数 据 C/S平台 C/S平台 (3)空间数据共享平台 在对空间数据模型有共同理解的基础上,各系统开发专门的双向转 换程序, 将本系统的内部数据结构转换成统一数据库的接口。 特点:这种方式的前提,首先要求对现实世界进行统一的 面向对象的数据理解,

13、这不易实现的 目前:外部数据交换标准仍是实现数据共享的主流方式。 GIS-A GIS-B 空间数据 库接口 转换程序 转换程序 (4)统一数据库接口 空间数据质量标准的要素及内容 (1) 数据情况说明:对地理数据的来源、内容及处 理过程等做出准确、全面和详尽的说明。 (2) 位置精度:为空间实体的坐标数据及实体真实 位置的接近程度, 常表现为空间三维坐标数据精 度。它包括数学基础精度、平面精度、高程精度 、接边精度、形状再现精度(形状保真度)、像元 定位精度(图像分辨率)等。 (3) 属性精度:指空间实体的属性值与其真值相符 的程度。通常取决于地理数据的类型, 且常常与 位置精度有关, 包括要

14、素分类与代码的正确性、 要素属性值的准确性及其名称的正确性等。 (4) 时间精度:要素时间属性和时间关系的准确度 (5) 逻辑一致性:指地理数据关系上的可靠性,包 括数据结构、数据内容(如毛面积、净面积和扣除 面积的关系), 以及拓扑性质上的内在一致性。 (6) 数据完整性。指地理数据在范围、内容及结构 等方面满足所有要求的完整程度, 包括数据范围 、空间实体类型、空间关系分类、属性特征分类 (如土地利用分类编码能否涵盖所有现象)等方 面的完整性。 (7) 表达形式的合理性。主要指数据抽象、数据表 达与真实地理世界的吻合性, 包括空间特征、专 题特征和时间特征表达的合理性等。 3.质量控制措施

15、 质量 控制 传统的手工 方法 元数据 方法 地理相 关法 将数字化数据与数据源 进行比较,图形部分的 检查包括目视方法、绘 制到透明图上与原图叠 加比较,属性部分的检 查采用与原属性逐个对 比或其他比较方法。 数据集的元数据中 包含了大量的有关 数据质量的信息, 通过它可以检查数 据质量,了解数据 质量的状况和变化 。 用空间数据的地 理特征要素自身 的相关性来分析 数据的质量。 (1)总体技术方案的控制与评价 l用户需求分析及联合设计 l数据源 l制图综合 l数据生产时间 l引用标准 l数学基础 l要素分类编码 l数据格式 l技术路线与技术性实验 l(2)数据源质量控制 l(3)数据生产质

16、量控制 l(4)数据加工处理质量控制 (5)数据质量控制策略 l数据清洗 l生产组织管理 l建立质量保障体系 l建立“二级检查、一级验收”制度 l区分数据清理的优先级 l监理机构设定 三、质量评价体系 Mr User Multimedia Maps Existing data Data gathering and retrieval Ground survey Satellite imagery 1.质量评价模式 l最小质量标准模式,是规定阈值的评价模式 l元数据标准模式,是真实标记模式 l市场标准模式,是真实标记和信息反馈结合的模 式 空间数据质量评价矩阵表 数据描述 数据要素 空间 特征 时间 特征 专题 特征 世系(继承性) 位置精度 属性精度 逻辑一致性 完整性 表现形式准确性 2.质量评价方法 (1)直接评价法 1)用计算机程序自动检测 某些类型的错误可以用计算机软件自动发现, 数据中不符合要求的数据项的百分率或平均质量等 级也可由计算机软件算出。此外,还可检测

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号