结构化和非结构化数据定义

上传人:宝路 文档编号:21465470 上传时间:2017-11-23 格式:DOCX 页数:2 大小:17.13KB
返回 下载 相关 举报
结构化和非结构化数据定义_第1页
第1页 / 共2页
结构化和非结构化数据定义_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《结构化和非结构化数据定义》由会员分享,可在线阅读,更多相关《结构化和非结构化数据定义(2页珍藏版)》请在金锄头文库上搜索。

1、结构化、非结构化数据相对于结构化数据(即行数据 ,存储在数据库里,可以用二维表结构来逻辑表达实现的数据)而言, 不方便用数据库二维逻辑表来表现的数据即称为非结构化数据 ,包括所有格式的办公文档、文本、图片、XML 、 HTML、各类报表、图像和音频/视频信息等等。 非结构化数据库是指其字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成的数据库,用它不仅可以处理结构化数据(如数字、符号等信息)而且更适合处理非结构化数据(全文文本、图象、声音、影视、超媒体等信息) 。 非结构化 WEB 数据库主要是针对非结构化数据而产生的,与以往流行的关系数据库相比,其最大区别在于它突破了关系数

2、据库结构定义不易改变和数据定长的限制,支持重复字段、子字段以及变长字段并实现了对变长数据和重复字段进行处理和数据项的变长存储管理,在处理连续信息(包括全文信息)和非结构化信息(包括各种多媒体信息)中有着传统关系型数据库所无法比拟的优势。 结构化数据(即行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据) 非结构化数据,包括所有格式的办公文档、文本、图片、XML、HTML、各类报表、图像和音频/视频信息等等 所谓半结构化数据,就是介于完全结构化数据(如关系型数据库、面向对象数据库中的数据)和完全无结构的数据(如声音、图像文件等)之间的数据,HTML 文档就属于半结构化数据。它一般是自描

3、述的,数据的结构和内容混在一起,没有明显的区分。 数据模型: 结构化数据:二维表(关系型) 半结构化数据:树、图 非结构化数据:无 RMDBS 的数据模型有:如网状数据模型、层次数据模型、关系型 其他: 结构化数据:先有结构、再有数据 半结构化数据:先有数据,再有结构 随着网络技术的发展,特别是 Internet 和 Intranet 技术的飞快发展,使得非结构化数据的数量日趋增大。这时,主要用于管理结构化数据的关系数据库的局限性暴露地越来越明显。因而,数据库技术相应地进入了“后关系数据库时代 ”,发展进入基于网络应用的非结构化数据库时代。 我国非结构化数据库以北京国信贝斯(iBase)软件有

4、限公司的 iBase 数据库为代表。IBase数据库是一种面向最终用户的非结构化数据库,在处理非结构化信息、全文信息、多媒体信息和海量信息等领域以及 Internet/Intranet 应用上处于国际先进水平,在非结构化数据的管理和全文检索方面获得突破。它主要有以下几个优点: (1)Internet 应用中,存在大量的复杂数据类型,iBase 通过其外部文件数据类型,可以管理各种文档信息、多媒体信息,并且对于各种具有检索意义的文档信息资源,如HTML、DOC 、 RTF、TXT 等还提供了强大的全文检索能力。 (2)它采用子字段、多值字段以及变长字段的机制,允许创建许多不同类型的非结构化的或任

5、意格式的字段,从而突破了关系数据库非常严格的表结构,使得非结构化数据得以存储和管理。 (3)iBase 将非结构化和结构化数据都定义为资源,使得非结构数据库的基本元素就是资源本身,而数据库中的资源可以同时包含结构化和非结构化的信息。所以,非结构化数据库能够存储和管理各种各样的非结构化数据,实现了数据库系统数据管理到内容管理的转化。 (4)iBase 采用了面向对象的基石,将企业业务数据和商业逻辑紧密结合在一起,特别适合于表达复杂的数据对象和多媒体对象。 (5)iBase 是适应 Internet 发展的需要而产生的数据库,它基于 Web 是一个广域网的海量数据库的思想,提供一个网上资源管理系统

6、 iBase Web,将网络服务器(WebServer)和数据库服务器(Database Server)直接集成为一个整体,使数据库系统和数据库技术成为 Web的一个重要有机组成部分,突破了数据库仅充当 Web 体系后台角色的局限,实现数据库和Web 的有机无缝组合,从而为在 Internet/Intranet 上进行信息管理乃至开展电子商务应用开辟了更为广阔的领域。 (6)iBase 全面兼容各种大中小型的数据库,对传统关系数据库,如Oracle、Sybase、SQLServer、DB2、Informix 等提供导入和链接的支持能力。 通过从上面的分析后我们可以预言,随着网络技术和网络应用技术的飞快发展,完全基于 Internet 应用的非结构化数据库将成为继层次数据库、网状数据库和关系数据库之后的又一重点、热点技术。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号