《数据质量》由会员分享,可在线阅读,更多相关《数据质量(1页珍藏版)》请在金锄头文库上搜索。
数据质量谈到数据质量,先来说数据质量的4点内容:完整性、一致性、准确性、及时性。本文将从完整、准确、及时三点出发,来讨论数据的质量。数据的完整性是一个很直观的标准,数据完不完整,可以从数据本身看,也可以从数据延伸内容看,数据的位数,属性是否缺失,条条款款是不是完整,足以看出数据的完整性,所以文中将保留对数据完整性的讨论。地图数据最基本的就是地理坐标,坐标的准确度至关重要,所以准确性是我们不得不讨论的内容。在较早的的时候我的一篇小文章中写过一个可能已经落后于研究前沿的想法:鉴于国内数据尤其是军队地理数据滞后严重,建议发展大规模自发数据采集,当时的想法是利用传感器甚至无人机完全依靠机器与网络,不使用人员采集,完全依赖高度发达的科学技术,只需要算法与指令,现在想来颇有科幻色彩,随处可见的现实-网络交互,总之目前不太现实。事实证明,我的想法有落后的地方也有不甚现实的地方,在现在的城市交通网中,传感器已经很常见了,而在地形中面积最大的野外区域,很难实现,而且高度发达的现实-虚拟交互还没有实现。这就是我想谈到的及时性,及时采集、及时反馈、及时更新,数据会非常新,但是难度也会非常大,至于效率,主要看采集的方式与主体还有用途。