数据库技术的前沿

上传人:子 文档编号:43481761 上传时间:2018-06-06 格式:DOC 页数:9 大小:37KB
返回 下载 相关 举报
数据库技术的前沿_第1页
第1页 / 共9页
数据库技术的前沿_第2页
第2页 / 共9页
数据库技术的前沿_第3页
第3页 / 共9页
数据库技术的前沿_第4页
第4页 / 共9页
数据库技术的前沿_第5页
第5页 / 共9页
点击查看更多>>
资源描述

《数据库技术的前沿》由会员分享,可在线阅读,更多相关《数据库技术的前沿(9页珍藏版)》请在金锄头文库上搜索。

1、数据库技术的前沿数据库技术的前沿数据库技术的前沿一、分布式数据库分布式数据库由一组数据组成,这些数据物理上分布在计算机网络的不同结点(亦称场地或站点)上,逻辑上是属于同一个系统。与集中式数据库不同,分布式数据库中应存在适当冗余以适合分布处理的特点,提高系统处理效率和可靠性。因此,数据复制技术是分布式数据库的重要技术。但分布式数据库中的这种数据冗余对用户是透明的,即用户不必知道冗余数据的存在,维护各副本的一致性也由系统来负责。分布式数据库是数据库技术与分布式处理技术相结合的产物。由于计算机技术的发展以及一些地理上分散经营的金融、商业集团、公司对数据库应用的需求,数据库管理系统的运行环境从单机扩展

2、到网络,对数据的处理从集中式走向分布式,从封闭式走向开放式,分布式数据库应运而生。分布式数据库系统中数据是分布的,数据分布在计算机网络的不同节点上,而这些数据在逻辑上是一个整体,构成一个逻辑的数据库。网络中的每一个节点都具有独立处理本地数据库中的数据的能力,也可以存储和处理异地数据库中的数据。如银行转账,一个分行账户中的金额划转到另一个分行的账户,即从一个节点的数据库划转到另一个节点的数据库,需要同时更新两个结点上的数据库。此时既有本地数据库的数据处理,又有异地数据库的数据处理。随着地理上分散的用户对数据库共享的要求,结合计算机网络技术的发展,在传统的集中式数据库系统基础上产生和发展了分布式数

3、据库系统。分布式数据库应具有以下特点。(1)数据的物理分布性。? 数据库中的数据不是集中存储在一个场地的一台计算机上,而是分布在不同场地的多台计算机上。它不同于通过计算机网络共享的集中式数据库系统。(2)数据的逻辑整体性。? 数据库虽然在物理上是分布的,但这些数据并不是互不相关的,它们在逻辑上是相互联系的整体。它不同于通过计算机网络互连的多个独立的数据库系统。(3)数据的分布独立性(也称分布透明性) 。? 分布式数据库中除了数据的物理独立性和数据的逻辑独立性外,还有数据的分布独立性。即在用户看来,整个数据库仍然是一个集中的数据库,用户不必关心数据的分片,不必关心数据物理位置分布的细节,不必关心

4、数据副本的一致性,分布的实现完全由分布式数据库管理系统来完成。(4)场地自治和协调。? 系统中的每个结点都具有独立性,能执行局部的应用请求;每个结点又是整个系统的一部分,可通过网络处理全局的应用请求。? 二、多媒体数据库多媒体数据库是数据库技术与多媒体技术相结合的产物。一般我们把文字、数字形式记录的数据称为传统数据,把图像、视频、音频等形式记录的数据称作多媒体数据。传统的数据库无法存储图片、视频等多媒体数据,但现实中人们又迫切需要这些数据类型。20 世纪 80 年代以来,人们越来越重视多媒体数据的存储与处理,这样能存储声音、视频、图片、动画的多媒体数据库应运而生,从而使数据库变得功能更加强大而

5、具有实用价值。多媒体数据库可以被广泛地应用于网站的建设、医疗系统的会诊、公安系统的犯罪嫌疑人的档案(如指纹、照片等) 、企业产品展示、教育系统的多媒体素材库和电子商务等方方面面,它正在越来越多地走入人们的生活。媒体是信息的载体。多媒体是指多种媒体,如数字、文本、图形、图像和声音的有机集成,而不是简单的组合。其中数字、字符等称为格式化数据,文本、图形、图像、声音、视频等称为非格式化数据,非格式化数据具有大数据量、处理复杂等特点。多媒体数据库实现对格式化和非格式化的多媒体数据的存储、管理和查询,其主要特征如下。? (1)能够表示多种媒体的数据。? 非格式化数据表示起来比较复杂,需要根据多媒体系统的

6、特点来决定表示方法。如果感兴趣的是它的内部结构且主要是根据其内部特定成分来检索,则可把它按一定算法映射成包含它所有子部分的一张结构表,然后用格式化的表结构来表示它。如果感兴趣的是它本身的内容整体,要检索的也是它的整体,则可以用源数据文件来表示它,文件由文件名来标记和检索。? (2)能够协调处理各种媒体数据。? 正确识别各种媒体数据之间在空间或时间上的关联。例如,关于乐器的多媒体数据包括乐器特性的描述,乐器的照片,利用该乐器演奏某段音乐的声音等,这些不同媒体数据之间存在着自然的关联,比如多媒体对象在表达时必须保证时间上的同步特性。? (3)提供更强的适合非格式化数据查询的搜索功能。? 例如可以对

7、 Image 等非格式化数据作整体和部分搜索。? 多媒体数据库应提供特种事务处理与版本管理能力。? 三、主动数据库主动数据库(Active DataBase)是相对于传统数据库的被动性而言的。许多实际的应用领域,如计算机集成制造系统、管理信息系统、办公室自动化系统中常常希望数据库系统在紧急情况下能根据数据库的当前状态,主动适时地做出反应,执行某些操作,向用户提供有关信息。? 主动数据库通常采用的方法是在传统数据库系统中嵌入ECA(即事件条件动作)规则,在某一事件发生时引发数据库管理系统去检测数据库当前状态,看是否满足设定的条件。若条件满足,便触发规定动作的执行。? 为了有效地支持 ECA 规则

8、,主动数据库的研究主要集中于解决以下问题。? (1)数据模型和知识模型。即如何扩充传统的数据库模型,使之适应于主动数据库的要求。? (2)执行模型。即 ECA 规则的处理和执行方式,是对传统数据库系统事务模型的发展和扩充。? (3)条件检测。是主动数据库系统实现的关键技术之一,由于条件的复杂性,如何高效地对条件求值对提高系统效率有很大的影响。? (4)事务调度。与传统数据库系统中的数据调度不同,它不仅要满足并发环境下的可串行化要求而且要满足对事务时间方面的要求。目前,对执行时间估计的代价模型是有待解决的难题。? (5)体系结构。目前,主动数据库的体系结构大多是在传统数据库管理系统的基础上,扩充

9、事务管理部件和对象管理部件以支持执行模型和知识模型,并增加事件侦测部件、条件检测部件和规则管理部件。? (6)系统效率。系统效率是主动数据库研究中的一个重要问题,是设计各种算法和选择体系结构时应主要考虑的设计目标。? 四、对象关系数据库对象关系数据库系统兼有关系数据库和面向对象的数据库两方面的特征。即它除了具有原来关系数据库的种种特点外,还应该具有以下功能。? (1)允许用户扩充基本数据类型。? 即允许用户根据应用需求自己定义数据类型、函数和操作符,而且一经定义,这些新的数据类型、函数和操作符将存放在数据库管理系统核心中,可供所有用户公用。? (2)能够在 SQL 中支持复杂对象。? 即由多种

10、基本类型或用户定义的类型构成的对象。? (3)能够支持子类对超类的各种特性的继承。? 支持数据继承和函数继承,支持多重继承,支持函数重载。 ? (4)能够提供功能强大的通用规则系统,而且规则系统与其他的对象关系能力是集成为一体的。例如规则中的事件和动作可以是任意的 SQL 语句,可以使用用户自定义的函数,规则能够被继承等。实现对象关系数据库系统的方法主要有以下五类。? (1)从头开发对象关系数据库管理系统。这种方法费时费力,不是很现实。? (2)在现有的关系型数据库管理系统基础上进行扩展。扩展方法有两种:对关系型数据库管理系统核心进行扩充,逐渐增加对象特性。这是一种比较安全的方法,新系统的性能

11、往往也比较好。不修改现有的关系型数据库管理系统核心,而是在现有关系型数据库管理系统外面加上一个包装层,由包装层提供对象关系型应用编程接口,并负责将用户提交的对象关系型查询映像成关系型查询,送给内层的关系型数据库管理系统处理。? 采用这种方法,系统效率会因包装层的存在受到影响。 (3)将现有的关系型数据库管理系统与其他厂商的对象关系型数据库管理系统连接在一起,使现有的关系型数据库管理系统直接而迅速地具有了对象关系特征。? 连接方法主要有两种。关系型数据库管理系统使用网关技术与其他厂商的对象关系型数据库管理系统连接。但网关这一中介手段会使系统效率打折扣。将对象关系型引擎与关系型存储管理器结合起来。

12、即以关系型数据库管理系统作为系统的最底层,具有兼容的存储管理器的对象关系型系统作为上层。? (4)将现有的面向对象型数据库管理系统与其他厂商的对象关系型数据库管理系统连接在一起,使现有的面向对象型数据库管理系统直接而迅速地具有了对象关系特征。? 连接方法是:将面向对象型数据库管理系统引擎与持久语言系统结合起来。即以面向对象的数据库管理系统作为系统的底层,具有兼容的持久语言系统的对象关系型系统作为上层。? (5)扩充现有的面向对象的数据库管理系统,使之成为对象关系型数据库管理系统。? 五、并行数据库系统并行数据库系统是在并行机上运行的具有并行处理能力的数据库系统。并行数据库系统的目标:高性能;高

13、可用性;可扩充性。? 六、数据仓库数据仓库专家 W.H.Inmon 在其著作Building the Data Warehouse中给出的描述是:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。对于数据仓库的概念,我们可以从两个层次予以理解:首先,数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库;其次,数据仓库是对多个异构的数据源有效集成,集成后按照主题进行重组,并包含历史数据,而且存放在数据仓库中的数据一般不再修改。传统的数据库技术是以单一的数据资源为中心,进行各种操作型处理。操作型处理也叫事务处理,是指对数据库联机的日常操作,

14、通常是对一个或一组记录的查询和修改,主要是为企业的特定应用服务,人们关心的是响应时间,数据的安全性和完整性。分析型处理则用于管理人员的决策分析。于是,数据库由旧的操作型环境发展为一种新环境:体系化环境。体系化环境由操作型环境和分析型环境(数据仓库级,部门级,个人级)构成。? 数据仓库是体系化环境的核心,它是建立决策支持系统(DSS)的基础。面向主题、集成、稳定和随时间变化是数据仓库四个最主要的特征。(1) 数据仓库是面向主题的。? 它是与传统数据库面向应用相对应的。主题是一个在较高层次将数据归类的标准,每一个主题基本对应一个宏观的分析领域。比如一个保险公司的数据仓库所组织的主题可能为:客户政策

15、保险金索赔。而按应用来组织则可能是:汽车保险、生命保险、健康保险、伤亡保险。我们可以看出,基于主题组织的数据被划分为各自独立的领域,每个领域有自己的逻辑内涵而不相交叉。而基于应用的数据组织则完全不同,它的数据只是为处理具体应用而组织在一起的。应用是客观世界既定的,它对于数据内容的划分未必适用于分析所需。(2) 数据仓库是集成的。? 操作型数据与适合 DSS 分析的数据之间差别甚大。因此数据在进入数据仓库之前,必然要经过加工与集成。这一步实际是数据仓库建设中最关键、最复杂的一步。首先,要统一原始数据中所有矛盾之处,如字段的同名异义、异名同义,单位不统一,字长不一致等。并且对原始数据结构作一个从面

16、向应用到面向主题的大转变。(3) 数据仓库是稳定的。? 它反映的是历史数据的内容,而不是处理联机数据。因而,数据经集成进入数据库后是极少或根本不更新的。(4) 数据仓库是随时间变化的。? 首先,数据仓库内的数据时限要远远长于操作环境中的数据时限。前者一般在 510 年,而后者只有 6090 天。数据仓库保存数据时限较长是为了适应 DSS 进行趋势分析的要求。其次,操作环境包含当前数据,即在存取的一刹那是正确有效的数据。而数据仓库中的数据都是历史数据。最后,数据仓库数据的码键都包含时间项,从而标明该数据的历史时期。? 七、工程数据库工程数据库是一种能存储和管理各种工程图形,并能为工程设计提供各种服务的数据库。它适用于 CAD/CAM(计算机辅助设计/计算机辅助管) 、计算机集成制造(CIM)等通称为 CAX 的工程应用领域。工程数据库针对工程应用领域的需求,对工程对象进行处理,并提供相应的管

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号