《数据库清华版8章数据库技术新进展ppt课件》由会员分享,可在线阅读,更多相关《数据库清华版8章数据库技术新进展ppt课件(92页珍藏版)》请在金锄头文库上搜索。
1、第第8章章 数据库技术新进展数据库技术新进展l8.1 数据库技术发展概述数据库技术发展概述l8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.3 数据库技术与其它相关技术相结合数据库技术与其它相关技术相结合l8.4 面向应用领域的数据库新技术面向应用领域的数据库新技术第第8章章 数据库技术新进展数据库技术新进展l8.1 数据库技术发展概述数据库技术发展概述l8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.3 数据库技术与其它相关技术相结合数据库技术与其它相关技术相结合l8.4 面向应用领域的数据库新技术面向应用领域的数据库新技术8.1 数据库技术发展概述数据库
2、技术发展概述l数据库系统已从第一代的网状、层次数数据库系统已从第一代的网状、层次数据库系统,第二代的关系数据库系统,据库系统,第二代的关系数据库系统,发展到第三代以面向对象模型为主要特发展到第三代以面向对象模型为主要特征的数据库系统。征的数据库系统。l数据库技术与网络通信技术、人工智能数据库技术与网络通信技术、人工智能技术、面向对象程序设计技术、并行计技术、面向对象程序设计技术、并行计算技术等互相渗透,互相结合,成为当算技术等互相渗透,互相结合,成为当前数据库技术发展的主要特征。前数据库技术发展的主要特征。 数据库技术发展概述(续)数据库技术发展概述(续)l下图从数据模型、新技术内容、应用领域
3、三个方面,通过下图从数据模型、新技术内容、应用领域三个方面,通过一个三维空间的视图,阐述了新一代数据库系统及其相互一个三维空间的视图,阐述了新一代数据库系统及其相互关系。关系。第第8章章 数据库技术新进展数据库技术新进展l8.1 数据库技术发展概述数据库技术发展概述l8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.3 数据库技术与其它相关技术相结合数据库技术与其它相关技术相结合l8.4 面向应用领域的数据库新技术面向应用领域的数据库新技术8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l数据模型是数据库系统的核心和基础数据模型是数据库系统的核心和基础格式化数据模型
4、(包括层次数据模型和网状格式化数据模型(包括层次数据模型和网状数据模型)数据模型)关系数据模型关系数据模型面向对象的数据模型等非传统数据模型面向对象的数据模型等非传统数据模型 数据模型及数据库系统的发展数据模型及数据库系统的发展(续)(续)l1 1、第一代数据库系统(层次数据库系统和网、第一代数据库系统(层次数据库系统和网状数据库系统状数据库系统 )格式化模型格式化模型 ,层次模型是网状模型的特例,层次模型是网状模型的特例 l2 2、第二代数据库系统、第二代数据库系统 (关系数据库系统(关系数据库系统 )关系模型简单、清晰,关系代数作为语言模型,关关系模型简单、清晰,关系代数作为语言模型,关系
5、数据理论作为理论基础。关系数据库系统具有形系数据理论作为理论基础。关系数据库系统具有形式基础好、数据独立性强、数据库语言非过程化等式基础好、数据独立性强、数据库语言非过程化等特色特色 。l3 3、第三代数据库系统、第三代数据库系统 更加丰富的数据模型、更强大的数据管理功能、满更加丰富的数据模型、更强大的数据管理功能、满足新应用要求足新应用要求 8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.2.1 第一代数据库系统第一代数据库系统l8.2.2 第二代数据库系统第二代数据库系统l8.2.3 新一代数据库技术的研究和发展新一代数据库技术的研究和发展8.2 数据模型及数据库系统的发
6、展数据模型及数据库系统的发展l8.2.1 第一代数据库系统第一代数据库系统l8.2.2 第二代数据库系统第二代数据库系统l8.2.3 新一代数据库技术的研究和发展新一代数据库技术的研究和发展8.2.1 第一代数据库系统第一代数据库系统 l第一代数据库系统指层次和网状数据库第一代数据库系统指层次和网状数据库系统,其代表是:系统,其代表是:1969年年IBM公司研制的层次模型的数据库管公司研制的层次模型的数据库管理系统理系统IMS(Information Management System)。)。数据库任务组数据库任务组DBTGDBTG(Data Base Task Data Base Task
7、GroupGroup)于于2020世纪世纪6060年代末年代末7070年代初提出的年代初提出的DBTGDBTG报告,数据库网状模型的典型代表报告,数据库网状模型的典型代表 。 第一代数据库系统(续)第一代数据库系统(续)l两种数据库系统具有下列共同特点:两种数据库系统具有下列共同特点: 1. 1. 支持三级模式的体系结构支持三级模式的体系结构 2. 2. 用存取路径来表示数据之间的联系用存取路径来表示数据之间的联系 3. 3. 独立的数据定义语言独立的数据定义语言 4. 4. 导航的数据操纵语言导航的数据操纵语言8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.2.1 第一代数
8、据库系统第一代数据库系统l8.2.2 第二代数据库系统第二代数据库系统l8.2.3 新一代数据库技术的研究和发展新一代数据库技术的研究和发展8.2.2 第二代数据库系统第二代数据库系统l1970年年IBM公司公司 San Jose 研究室的研究研究室的研究员员 E.F.Codd发表了题为发表了题为“大型共享数据大型共享数据库数据的关系模型库数据的关系模型”论文论文 ,为关系数据为关系数据库技术奠定了理论基础库技术奠定了理论基础 。第二代数据库系统(续)第二代数据库系统(续)l20世纪世纪70年代是关系数据库理论研究和原型开年代是关系数据库理论研究和原型开发的时代。其中以发的时代。其中以IBM
9、San Jose研究室开发的研究室开发的System R和和Berkeley大学研制的大学研制的INGRES为典为典型代表。型代表。 发展过程:发展过程:奠定了关系模型的理论基础,关系模型的规范说明。奠定了关系模型的理论基础,关系模型的规范说明。 研究了关系数据语言研究了关系数据语言 攻克了系统实现中查询优化、并发控制、故障恢复攻克了系统实现中查询优化、并发控制、故障恢复等一系列关键技术。促进了等一系列关键技术。促进了RDBMS产品的蓬勃发产品的蓬勃发展和广泛应用。展和广泛应用。 第二代数据库系统(续)第二代数据库系统(续)关系模型具有以下主要特点:关系模型具有以下主要特点:l关系模型的概念单
10、一,实体以及实体之间的联关系模型的概念单一,实体以及实体之间的联系都用关系来表示系都用关系来表示l以关系代数为基础,形式化基础好以关系代数为基础,形式化基础好 l数据独立性强,数据的物理存储和存取路径对数据独立性强,数据的物理存储和存取路径对用户隐蔽用户隐蔽 l关系数据库语言是非过程化的,将用户从编程关系数据库语言是非过程化的,将用户从编程数据库记录的导航式检索中解脱出来,大大减数据库记录的导航式检索中解脱出来,大大减小了用户编程的难度小了用户编程的难度 8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.2.1 第一代数据库系统第一代数据库系统l8.2.2 第二代数据库系统第二
11、代数据库系统l8.2.3 新一代数据库技术的研究和发展新一代数据库技术的研究和发展8.2.3 8.2.3 新一代数据库技术的研究新一代数据库技术的研究和发展和发展l一、应用领域的需求一、应用领域的需求l二、传统数据库系统的局限性二、传统数据库系统的局限性l三、第三代数据库技术的特点三、第三代数据库技术的特点 一、应用领域的需求一、应用领域的需求l新的数据库应用领域,如计算机辅助设计新的数据库应用领域,如计算机辅助设计/ /管管理(理(CAD/CAMCAD/CAM)、)、计算机集成制造(计算机集成制造(CIMCIM)、)、办办公信息系统(公信息系统(OISOIS)、)、地理信息系统(地理信息系统
12、(GISGIS)、)、知识库系统和实时系统等知识库系统和实时系统等l新应用需求需要数据库系统支持以下功能:新应用需求需要数据库系统支持以下功能:(1 1)存储和处理复杂对象)存储和处理复杂对象 (2 2)支持复杂的数据类型)支持复杂的数据类型 (3 3)需要常驻内存的对象管理以及支持对大量对)需要常驻内存的对象管理以及支持对大量对象的存取和计算象的存取和计算(4 4)实现程序设计语言和数据库语言无缝地集成)实现程序设计语言和数据库语言无缝地集成(5 5)支持长事务和嵌套事务的处理)支持长事务和嵌套事务的处理二、传统数据库系统的局限性二、传统数据库系统的局限性l传统数据库系统的局限性主要表现在以
13、下几个传统数据库系统的局限性主要表现在以下几个方面:方面:1. 1. 面向机器的语法数据模型面向机器的语法数据模型2. 2. 数据类型简单、固定数据类型简单、固定 3. 结构与行为分离结构与行为分离4. 阻抗失配(阻抗失配(编程模式不同编程模式不同 、类型系统不匹配类型系统不匹配 )5. 被动响应被动响应 6. 存储、管理的对象有限存储、管理的对象有限 7. 事务处理能力较差(事务处理能力较差(只能支持非嵌套事务只能支持非嵌套事务 ) 三、第三代数据库技术的特点三、第三代数据库技术的特点l支持面向对象数据模型支持面向对象数据模型l面向对象模型的概念是:面向对象模型的概念是:对象标识对象标识封装
14、封装类和类层次类和类层次继承继承第三代数据库技术的特点(续)第三代数据库技术的特点(续)l一个面向对象的数据库系统是一个持久一个面向对象的数据库系统是一个持久的、可共享的对象库的存储和管理者的、可共享的对象库的存储和管理者l一个对象库是由一个面向对象数据模型一个对象库是由一个面向对象数据模型所定义的对象的集合体所定义的对象的集合体第三代数据库技术的特点(续)第三代数据库技术的特点(续)l一个数据库可称为一个数据库可称为OODBS,必须满足以,必须满足以下条件下条件支持一核心的面向对象数据模型支持一核心的面向对象数据模型支持传统数据库系统所有的数据库特征支持传统数据库系统所有的数据库特征第三代数
15、据库技术的特点(续)第三代数据库技术的特点(续)l在研究热潮中,许多厂商推出的产品粗在研究热潮中,许多厂商推出的产品粗糙,质量低,导致糙,质量低,导致OODBS有某种回归到有某种回归到人工导航系统的倾向人工导航系统的倾向l面向对象数据库的实现方式面向对象数据库的实现方式一种是在面向对象的设计环境中加入数据库一种是在面向对象的设计环境中加入数据库功能,如功能,如ORIEN,CLOS等等另一种是对传统数据库系统进行改进,使其另一种是对传统数据库系统进行改进,使其支持面向对象的数据模型,如支持面向对象的数据模型,如ORACLE8.0,INFORMIX9.0等等第三代数据库技术的特点(续)第三代数据库
16、技术的特点(续)l与传统数据库系统相比有许多优点,如与传统数据库系统相比有许多优点,如包含更多数据语义信息,对复杂数据对包含更多数据语义信息,对复杂数据对象的表达能力更强等象的表达能力更强等l面向对象数据库还只是一种新兴的技术,面向对象数据库还只是一种新兴的技术,它的发展远不如关系数据库成熟它的发展远不如关系数据库成熟l是一项具有重大理论意义和应用前景的是一项具有重大理论意义和应用前景的数据库技术数据库技术第第8章章 数据库技术新进展数据库技术新进展l8.1 数据库技术发展概述数据库技术发展概述l8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.3 数据库技术与其它相关技术相结
17、合数据库技术与其它相关技术相结合l8.4 面向应用领域的数据库新技术面向应用领域的数据库新技术8.3 8.3 数据库技术与其他相关技术相结合数据库技术与其他相关技术相结合 l数数据据库库技技术术与与其其他他学学科科的的内内容容相相结结合合,是是新新一一代代数数据据库库技技术术的的一一个个显显著著特特征征,涌涌现现出出各各种种新新型型的的数数据据库库系系统,例如:统,例如:数数据据库库技技术术与与分分布布处处理理技技术术相相结结合合,出出现现了了分分布布式式数数据据库库系系统;统;数据库技术与并行处理技术相结合,出现了并行数据库系统;数据库技术与并行处理技术相结合,出现了并行数据库系统;数数据据
18、库库技技术术与与人人工工智智能能技技术术相相结结合合,出出现现了了知知识识库库系系统统和和主主动数据库系统;动数据库系统;数据库技术与多媒体技术相结合,出现了多媒体数据库系统;数据库技术与多媒体技术相结合,出现了多媒体数据库系统;数据库技术与模糊技术相结合,出现了模糊数据库系统等。数据库技术与模糊技术相结合,出现了模糊数据库系统等。8.3 8.3 数据库技术与其他相关技术相结合数据库技术与其他相关技术相结合l8.3.1 分布式数据库系统分布式数据库系统l8.3.2 并行数据库并行数据库l8.3.3 多媒体数据库多媒体数据库l8.3.4 主动数据库主动数据库l8.3.5 对象关系数据库对象关系数
19、据库8.3 8.3 数据库技术与其他相关技术相结合数据库技术与其他相关技术相结合l8.3.1 分布式数据库系统分布式数据库系统l8.3.2 并行数据库并行数据库l8.3.3 多媒体数据库多媒体数据库l8.3.4 主动数据库主动数据库l8.3.5 对象关系数据库对象关系数据库8.3.1 分布式数据库系统分布式数据库系统l随着地理上分散的用户对数据共享的要随着地理上分散的用户对数据共享的要求日益增强,以及计算机网络技术的发求日益增强,以及计算机网络技术的发展,在传统的集中式数据库系统基础上展,在传统的集中式数据库系统基础上产生和发展了分布式数据库系统产生和发展了分布式数据库系统8.3.1 分布式数
20、据库系统分布式数据库系统l1. 分布式数据库系统的特点分布式数据库系统的特点l2. 分布式数据库的体系结构分布式数据库的体系结构8.3.1 分布式数据库系统分布式数据库系统l1. 分布式数据库系统的特点分布式数据库系统的特点l2. 分布式数据库的体系结构分布式数据库的体系结构1.分布式数据库系统的特点分布式数据库系统的特点分布式数据库应具有以下特点:分布式数据库应具有以下特点: (1 1)数据的物理分布性)数据的物理分布性 (2 2)数据的逻辑整体性)数据的逻辑整体性 (3 3)数据的分布独立性(也称分布透明)数据的分布独立性(也称分布透明性)性) (4 4)场地自治和协调)场地自治和协调 (
21、5 5)数据的冗余及冗余透明性)数据的冗余及冗余透明性 分布式数据库系统的特点(续)分布式数据库系统的特点(续)l例子:例子: 假设一个大公司拥有四个子公司,总公司与各子公司假设一个大公司拥有四个子公司,总公司与各子公司各有一台计算机,并已联网,每台计算机带有若干终各有一台计算机,并已联网,每台计算机带有若干终端。场地端。场地A为公司的总部,位于场地为公司的总部,位于场地B的公司负责制造的公司负责制造和销售其产品,位于场地和销售其产品,位于场地CDE的公司负责销售其产品。的公司负责销售其产品。各场地都存储了本场地雇员的数据,场地各场地都存储了本场地雇员的数据,场地B存储了产品存储了产品制造情况
22、的数据,场地制造情况的数据,场地BCDE存储了本场地销售、库存存储了本场地销售、库存情况的数据。可执行的全局应用包括:总公司总销售情况的数据。可执行的全局应用包括:总公司总销售情况、总公司总库存情况、公司间的人员调动,等等;情况、总公司总库存情况、公司间的人员调动,等等;可执行的局部应用包括:场地可执行的局部应用包括:场地B检查产品制造情况、场检查产品制造情况、场地地E统计本子公司雇员的平均工资等等。这是一个典型统计本子公司雇员的平均工资等等。这是一个典型的分布式数据库系统。的分布式数据库系统。 场地A 分布式DBMS场地E 分布式DBMS场地B 分布式DBMS场地D 分布式DBMS场地C 分
23、布式DBMS网络分布式数据库系统的特点(续)分布式数据库系统的特点(续)l分布式系统的优点分布式系统的优点分布式控制分布式控制数据共享数据共享可靠性和可用性得到加强可靠性和可用性得到加强性能得到改善性能得到改善可扩充性好可扩充性好分布式数据库系统的特点(续)分布式数据库系统的特点(续)l分布式系统缺点分布式系统缺点复杂复杂增加开销增加开销硬件开销硬件开销通信开销通信开销冗余数据的潜在开销冗余数据的潜在开销保证数据库全局并行性、并行操作的可串行性、保证数据库全局并行性、并行操作的可串行性、安全性和完整性的开销安全性和完整性的开销8.3.1 分布式数据库系统分布式数据库系统l1. 分布式数据库系统
24、的特点分布式数据库系统的特点l2. 分布式数据库的体系结构分布式数据库的体系结构2.分布式数据库的体系结构分布式数据库的体系结构l原则原则 (若干个)局部数据模式(若干个)局部数据模式 (一个)全局数据模式(一个)全局数据模式l全局数据模式四个层次全局数据模式四个层次全局外模式全局外模式全局概念模式全局概念模式分片模式分片模式分布模式分布模式分布式数据库的体系结构(续)分布式数据库的体系结构(续)l分片模式分片模式水平分片水平分片垂直分片垂直分片混合分片混合分片分布式数据库的体系结构(续)分布式数据库的体系结构(续)l分片时必须遵守的准则分片时必须遵守的准则完全性完全性可重构性可重构性不相交性
25、不相交性分布式数据库的体系结构(续)分布式数据库的体系结构(续)l分布模式的分配方案分布模式的分配方案划分式划分式全副本式全副本式部分重复式部分重复式分布式数据库的体系结构(续)分布式数据库的体系结构(续)l四层模式之间的联系和转换由三层映象四层模式之间的联系和转换由三层映象实现实现映象映象1 定义全局外模式与全局概念模式之间定义全局外模式与全局概念模式之间的对应关系的对应关系映象映象2 定义全局关系与片段之间的对应关系定义全局关系与片段之间的对应关系映象映象3 定义片段与网络结点之间的对应关系定义片段与网络结点之间的对应关系分布式数据库的体系结构(续)分布式数据库的体系结构(续)l分布透明性
26、式分布式数据库系统的一个分布透明性式分布式数据库系统的一个显著特点显著特点l分布透明性三个层次从高到低依次为:分布透明性三个层次从高到低依次为:分片透明性、位置透明性和局部数据模分片透明性、位置透明性和局部数据模型透明性型透明性8.3 8.3 数据库技术与其他相关技术相结合数据库技术与其他相关技术相结合l8.3.1 分布式数据库系统分布式数据库系统l8.3.2 并行数据库并行数据库l8.3.3 多媒体数据库多媒体数据库l8.3.4 主动数据库主动数据库l8.3.5 对象关系数据库对象关系数据库8.3.2 并行数据库并行数据库l计算机体系结构的一个明显发展趋势是计算机体系结构的一个明显发展趋势是
27、从单处理器结构向多处理器结构过渡从单处理器结构向多处理器结构过渡l原因:原因:提高单处理器的性能越来越困难,单处理器提高单处理器的性能越来越困难,单处理器性能有物理极限性能有物理极限高性能处理器价格昂贵,可以用廉价的多处高性能处理器价格昂贵,可以用廉价的多处理器来代替理器来代替并行数据库(续)并行数据库(续)l能否为越来越多的用户维持高事务吞吐能否为越来越多的用户维持高事务吞吐量和低响应时间以成为衡量量和低响应时间以成为衡量DBMS性能性能的重要指标的重要指标l并行数据库以高性能、高可用性、高扩并行数据库以高性能、高可用性、高扩充性为指标,充分利用多处理器平台的充性为指标,充分利用多处理器平台
28、的能力,通过多种并行性,在联机事务处能力,通过多种并行性,在联机事务处理与决策支持应用两种典型环境中提供理与决策支持应用两种典型环境中提供优化的响应时间和事务吞吐量优化的响应时间和事务吞吐量并行数据库(续)并行数据库(续)l1. 并行数据库系统的体系结构并行数据库系统的体系结构l2. 并行处理技术并行处理技术l3. 并行数据库与分布式数据库系统的区并行数据库与分布式数据库系统的区别别1. 并行数据库系统的体系结构并行数据库系统的体系结构l目前并行计算机的体系结构主要有以下目前并行计算机的体系结构主要有以下几类:几类:紧耦合全对称多处理器(紧耦合全对称多处理器(SMP)系统,所有)系统,所有CP
29、U共享内存与磁盘共享内存与磁盘松耦合群集机系统,所有松耦合群集机系统,所有CPU共享磁盘共享磁盘大规模并行处理(大规模并行处理(MPP)系统,所有)系统,所有CPU均均有自己的内存和磁盘有自己的内存和磁盘并行数据库系统的体系结构(续)并行数据库系统的体系结构(续)l相应并行数据库系统的体系结构:相应并行数据库系统的体系结构:共享内存结构共享内存结构共享磁盘结构共享磁盘结构无共享资源结构无共享资源结构并行数据库系统的体系结构(续)并行数据库系统的体系结构(续)l图图 共享内存结构共享内存结构处理器处理器处理器连接网络全局共享内存磁盘磁盘磁盘并行数据库系统的体系结构(续)并行数据库系统的体系结构(
30、续)l图图 无共享资源结构无共享资源结构处理器处理器处理器连接网络磁盘磁盘磁盘内存内存内存并行数据库系统的体系结构(续)并行数据库系统的体系结构(续)l图图 共享磁盘结构共享磁盘结构处理器处理器处理器连接网络磁盘磁盘磁盘内存内存内存并行数据库系统的体系结构(续)并行数据库系统的体系结构(续)l三种结构各有利弊三种结构各有利弊共享内存结构相对来说容易实现,各处处理共享内存结构相对来说容易实现,各处处理器的负载较平衡;但存在访问内存和磁盘的器的负载较平衡;但存在访问内存和磁盘的瓶颈,可伸缩性不佳,可用性不太好瓶颈,可伸缩性不佳,可用性不太好共享磁盘结构消除了访问内存的瓶颈;但存共享磁盘结构消除了访
31、问内存的瓶颈;但存在访问磁盘的瓶颈,分布式缓存器也是一个在访问磁盘的瓶颈,分布式缓存器也是一个瓶颈,可扩充性不佳瓶颈,可扩充性不佳无共享资源结构不易做到负载平衡;具有极无共享资源结构不易做到负载平衡;具有极佳的可伸缩性佳的可伸缩性2. 并行处理技术并行处理技术l采用多线程多线索结构,提供四种不同采用多线程多线索结构,提供四种不同粒度的并行性粒度的并行性不同用户事务间的并行性不同用户事务间的并行性同一事务内不同查询间的并行性同一事务内不同查询间的并行性同一查询内不同操作间的并行性(垂直并行,同一查询内不同操作间的并行性(垂直并行,或流水线并行)或流水线并行)同一操作内的并行性(水平并行,或划分并
32、同一操作内的并行性(水平并行,或划分并行)行)并行处理技术(续)并行处理技术(续)l水平并行性要求物理地将数据库划分为水平并行性要求物理地将数据库划分为小分片,并存放在不同磁盘上小分片,并存放在不同磁盘上并行并行数据库中的数据划分数据库中的数据划分l划分时依据一个属性的值,就是一维数划分时依据一个属性的值,就是一维数据划分据划分l划分时依据多个属性的值,就是多维数划分时依据多个属性的值,就是多维数据划分据划分并行处理技术(续)并行处理技术(续)l一维数据划分有以下几种方法一维数据划分有以下几种方法Round-robin(轮转)划分法(轮转)划分法Range(值域)划分法(值域)划分法Hash(
33、杂凑)划分法(杂凑)划分法Userdefined(用户定义)划分法(用户定义)划分法Schema(模式)划分法(模式)划分法l目前商用并行数据库系统都只提供了一目前商用并行数据库系统都只提供了一种或多种一维数据划分法种或多种一维数据划分法3. 并行数据库系统与分布式数据并行数据库系统与分布式数据库系统的区别库系统的区别l应用目标不同应用目标不同l实现方式不同实现方式不同l各结点的地位不同各结点的地位不同8.3 8.3 数据库技术与其他相关技术相结合数据库技术与其他相关技术相结合l8.3.1 分布式数据库系统分布式数据库系统l8.3.2 并行数据库并行数据库l8.3.3 多媒体数据库多媒体数据库
34、l8.3.4 主动数据库主动数据库l8.3.5 对象关系数据库对象关系数据库8.3.3 8.3.3 多媒体数据库多媒体数据库l多媒体数据库实现对格式化和非格式化的多媒多媒体数据库实现对格式化和非格式化的多媒体数据的存储、管理和查询,其主要特征有:体数据的存储、管理和查询,其主要特征有:(1 1)多媒体数据库应能够表示多种媒体的数据。)多媒体数据库应能够表示多种媒体的数据。 (2 2)多媒体数据库应能够协调处理各种媒体数据,)多媒体数据库应能够协调处理各种媒体数据,正确识别各种媒体数据之间在空间或时间上的关联。正确识别各种媒体数据之间在空间或时间上的关联。 (3 3)多媒体数据库应提供比传统数据
35、管理系统更)多媒体数据库应提供比传统数据管理系统更强的适合非格式化数据查询的搜索功能。强的适合非格式化数据查询的搜索功能。 l多媒体数据库应提供特种事务处理与版本管理多媒体数据库应提供特种事务处理与版本管理能力。能力。 8.3 8.3 数据库技术与其他相关技术相结合数据库技术与其他相关技术相结合l8.3.1 分布式数据库系统分布式数据库系统l8.3.2 并行数据库并行数据库l8.3.3 多媒体数据库多媒体数据库l8.3.4 主动数据库主动数据库l8.3.5 对象关系数据库对象关系数据库8.3.4 8.3.4 主动数据库主动数据库l主动数据库(主动数据库(Active Data Base)是相对
36、于传统是相对于传统数据库的被动性而言的。在传统数据库基础上,数据库的被动性而言的。在传统数据库基础上,结合人工智能技术和面向对象技术提出了主动结合人工智能技术和面向对象技术提出了主动数据库。数据库。l主动数据库的主要目标是提供对紧急情况及时主动数据库的主要目标是提供对紧急情况及时反应的能力,同时提高数据库管理系统的模块反应的能力,同时提高数据库管理系统的模块化程度。主动数据库通常采用的方法是在传统化程度。主动数据库通常采用的方法是在传统数据库系统中嵌入数据库系统中嵌入ECAECA(即事件即事件- -条件条件- -动作)动作)规则规则主动数据库(续)主动数据库(续)l为了有效地支持为了有效地支持
37、ECAECA规则,主动数据库的规则,主动数据库的研究主要集中于解决以下问题:研究主要集中于解决以下问题:主动数据库的数据模型和知识模型主动数据库的数据模型和知识模型执行模型执行模型条件检测条件检测事务调度事务调度体系结构体系结构系统效率系统效率 8.3 8.3 数据库技术与其他相关技术相结合数据库技术与其他相关技术相结合l8.3.1 分布式数据库系统分布式数据库系统l8.3.2 并行数据库并行数据库l8.3.3 多媒体数据库多媒体数据库l8.3.4 主动数据库主动数据库l8.3.5 对象关系数据库对象关系数据库8.3.5 对象关系数据库对象关系数据库l是将关系数据库和面向对象的数据库相是将关系
38、数据库和面向对象的数据库相结合的产品结合的产品l特点特点运行用户扩充基本数据类型运行用户扩充基本数据类型能够在能够在SQL中支持复杂对象中支持复杂对象能够支持子类对超类的各种特性的继承能够支持子类对超类的各种特性的继承能够提供功能强大的通用规则系统能够提供功能强大的通用规则系统对象关系数据库(续)对象关系数据库(续)l实现方法实现方法从头开始对象关系从头开始对象关系DBMS在现有的关系型在现有的关系型DBMS基础上进行扩展基础上进行扩展将现有的关系型将现有的关系型DBMS与其他厂商的对象关与其他厂商的对象关系型系型DBMS连接在一起,使现有的关系型连接在一起,使现有的关系型DBMS直接而迅速具
39、有对象关系型直接而迅速具有对象关系型DBMS的的特征特征将现有的面向对象型将现有的面向对象型DBMS与其他厂商的对象与其他厂商的对象关系型关系型DBMS连接在一起,使现有的面向对连接在一起,使现有的面向对象型的象型的DBMS直接而迅速地具有对象关系型直接而迅速地具有对象关系型DBMS的特征的特征扩充现有的面向对象型扩充现有的面向对象型DBMS,使之成为对象,使之成为对象关系型关系型DBMS第第8章章 数据库技术新进展数据库技术新进展l8.1 数据库技术发展概述数据库技术发展概述l8.2 数据模型及数据库系统的发展数据模型及数据库系统的发展l8.3 数据库技术与其它相关技术相结合数据库技术与其它
40、相关技术相结合l8.4 面向应用领域的数据库新技术面向应用领域的数据库新技术8.4 8.4 面向应用领域的数据库新面向应用领域的数据库新技术技术 l数据库技术被应用到特定的领域中,出现了数据仓库、数据库技术被应用到特定的领域中,出现了数据仓库、工程数据库、统计数据库、空间数据库、科学数据库工程数据库、统计数据库、空间数据库、科学数据库等多种数据库,使数据库领域的应用范围不断扩大。等多种数据库,使数据库领域的应用范围不断扩大。 特定领域特定领域DSSCAx (CAD/CAM/CIM)地理信息系统地理信息系统计划、统计计划、统计数据库数据库技术技术数据仓库数据仓库工程数据库工程数据库地理数据库地理
41、数据库空间数据库空间数据库统计数据库统计数据库8.4 8.4 面向应用领域的数据库新技面向应用领域的数据库新技术术l8.4.1 数据仓库数据仓库l8.4.2 工程数据库工程数据库l8.4.3 统计数据库统计数据库l8.4.4 空间数据库空间数据库8.4 8.4 面向应用领域的数据库新技面向应用领域的数据库新技术术l8.4.1 数据仓库数据仓库l8.4.2 工程数据库工程数据库l8.4.3 统计数据库统计数据库l8.4.4 空间数据库空间数据库8.4.1 数据仓库数据仓库l1. 从数据库到数据仓库从数据库到数据仓库l2. 数据仓库的特点数据仓库的特点l3. 分析工具分析工具l4. 基于数据库技术
42、的基于数据库技术的DSS解决方案解决方案1. 从数据库到数据仓库从数据库到数据仓库l操作型处理和分析型处理的区分操作型处理和分析型处理的区分l这种分离,划清了数据处理的分析型环这种分离,划清了数据处理的分析型环境与操作型环境之间的界限,从而由原境与操作型环境之间的界限,从而由原来的以单一数据库为中心的数据环境发来的以单一数据库为中心的数据环境发展为一种新环境:体系化环境。展为一种新环境:体系化环境。l体系化环境由操作型环境和分析型环境体系化环境由操作型环境和分析型环境(全局级数据仓库、部门级数据仓库、(全局级数据仓库、部门级数据仓库、个人级数据仓库)构成。个人级数据仓库)构成。 从数据库到数据
43、仓库从数据库到数据仓库(续)(续)l事务处理环境不适宜事务处理环境不适宜DSS应用:应用:(1 1)事务处理和分析处理的性能特性不同)事务处理和分析处理的性能特性不同 (2 2)数据集成问题)数据集成问题 (3 3)数据动态集成问题)数据动态集成问题 (4 4)历史数据问题)历史数据问题 (5 5)数据的综合问题)数据的综合问题 2. 2. 数据仓库的定义和特点数据仓库的定义和特点l数据仓库概念的创始人数据仓库概念的创始人W.H. W.H. InmonInmon在其在其Building Data WarehouseBuilding Data Warehouse一书中,一书中,列出了操作型数据与
44、分析型数据之间的列出了操作型数据与分析型数据之间的区别区别( (见见P 262)P 262)。l数据仓库的定义:数据仓库就是一个面数据仓库的定义:数据仓库就是一个面向主题的、集成的、不可更新的、随时向主题的、集成的、不可更新的、随时间不断变化的数据集合,用以支持企业间不断变化的数据集合,用以支持企业或组织的决策分析处理。或组织的决策分析处理。数据仓库的定义和特点数据仓库的定义和特点(续)(续)l分分析析型型数数据据的的特特点点可可以以概概括括为为四四点点,也也就是数据仓库数据的四个基本特征:就是数据仓库数据的四个基本特征: 数据仓库的数据是面向主题的数据仓库的数据是面向主题的 数据仓库的数据是
45、集成的数据仓库的数据是集成的 数据仓库的数据是不可更新的数据仓库的数据是不可更新的 数据仓库的数据是随时间不断变化的数据仓库的数据是随时间不断变化的 3. 分析工具分析工具l数据仓库系统的重要组成部分数据仓库系统的重要组成部分 (1 1)联机分析处理技术及工具)联机分析处理技术及工具 联机分析处理(联机分析处理(OLAPOLAP与联机事务处理与联机事务处理(OLTPOLTP) 从从19911991年年W.H.InmonW.H.Inmon提出提出DW概念到概念到E.F.CoddE.F.Codd于于19931993年提出年提出OLAP概念仅仅两年,而概念仅仅两年,而从从OLAPOLAP概念提出到概
46、念提出到OLAP工具的推出则时间更短,的推出则时间更短,几乎是同时的。几乎是同时的。 分析工具(续)分析工具(续)l E.F.CoddE.F.Codd在在“Providing OLAP to User Analysts”一文(见一文(见PC WorldPC World19931993,9 9)中完整地定义了中完整地定义了OLAPOLAP的概念,多维的概念,多维分析的概念,并给出了数据分析从低级分析的概念,并给出了数据分析从低级到高级的四种模型以及到高级的四种模型以及OLAP的十二条准则l OLAPOLAP工具产品的实现可分为两大类:工具产品的实现可分为两大类:基于多维数据库的基于多维数据库的基
47、于关系数据库的基于关系数据库的 分析工具(续)分析工具(续)(2)数据挖掘技术和工具)数据挖掘技术和工具 数据挖掘(数据挖掘(Data MiningData Mining,简称简称DMDM)是从超大型数据库(是从超大型数据库(VLDBVLDB)或数据或数据仓库中发现并提取隐藏在内的信息的一仓库中发现并提取隐藏在内的信息的一种新技术。目的是帮助决策者寻找数据种新技术。目的是帮助决策者寻找数据间潜在的关联,发现经营者被忽略的要间潜在的关联,发现经营者被忽略的要素,而这些要素对预测趋势、决策行为素,而这些要素对预测趋势、决策行为也许是十分有用的信息。也许是十分有用的信息。分析工具(续)分析工具(续)
48、l数据挖掘技术涉及数据库技术、人工智数据挖掘技术涉及数据库技术、人工智能技术、机器学习、统计分析等多种技能技术、机器学习、统计分析等多种技术,它使术,它使DSSDSS系统跨入了一个新阶段。系统跨入了一个新阶段。l综上所述,数据仓库系统是多种技术的综上所述,数据仓库系统是多种技术的综合体,它由数据仓库综合体,它由数据仓库( (DW)DW)、数据仓库数据仓库管理系统管理系统( (DWMS)DWMS)、数据仓库工具三个部数据仓库工具三个部分组成。分组成。 数据仓库工具层多维分析工具数据挖掘工具可视化工具 最 终 用户备注: 表示关系型数据表示多维数据高 度 综合级轻 度 综合级数据仓库早 期 细节级
49、当 前 细节级数据仓库管理系统4. 基于数据库技术的基于数据库技术的DSS解决方案解决方案lDWOLAPDM DSS的可行方案的可行方案l数据仓库、数据仓库、OLAPOLAP和数据挖掘是作为三种独立的和数据挖掘是作为三种独立的信息处理技术出现的。数据仓库用于数据的存信息处理技术出现的。数据仓库用于数据的存储和组织,储和组织,OLAPOLAP集中于数据的分析,数据挖掘集中于数据的分析,数据挖掘则致力于知识的自动发现。它们都可以分别应则致力于知识的自动发现。它们都可以分别应用到信息系统的设计和实现中,以提高相应部用到信息系统的设计和实现中,以提高相应部分的处理能力。分的处理能力。 基于数据库技术的
50、基于数据库技术的DSS解决方案(续)解决方案(续)l三种技术结合起来成为新的三种技术结合起来成为新的DSSDSS构架构架(1 1)在底层的数据库中保存了大量的事务级细)在底层的数据库中保存了大量的事务级细节数据。节数据。 (2 2)数据仓库对底层数据库中的事务级数据进)数据仓库对底层数据库中的事务级数据进行集成、转换、综合,重新组织成面向全局的行集成、转换、综合,重新组织成面向全局的数据视图,为数据视图,为DSSDSS提供数据存储和组织的基础提供数据存储和组织的基础(3)OLAP从数据仓库中的集成数据出发,构从数据仓库中的集成数据出发,构建面向分析的多维数据模型,再使用多维分析建面向分析的多维
51、数据模型,再使用多维分析方法从多个不同的视角对多维数据进行分析、方法从多个不同的视角对多维数据进行分析、比较,分析活动从以前的方法驱动转向了数据比较,分析活动从以前的方法驱动转向了数据驱动,分析方法和数据结构实现了分离。驱动,分析方法和数据结构实现了分离。(4 4)数据挖掘以数据仓库和多维数据库中的大)数据挖掘以数据仓库和多维数据库中的大量数据为基础,自动地发现数据中的潜在模式,量数据为基础,自动地发现数据中的潜在模式,并以这些模式为基础自动地作出预测。并以这些模式为基础自动地作出预测。8.4 8.4 面向应用领域的数据库新技面向应用领域的数据库新技术术l8.4.1 数据仓库数据仓库l8.4.
52、2 工程数据库工程数据库l8.4.3 统计数据库统计数据库l8.4.4 空间数据库空间数据库8.4.2 8.4.2 工程数据库工程数据库l工程数据库是一种能存储和管理各种工工程数据库是一种能存储和管理各种工程设计图形和工程设计文档,并能为工程设计图形和工程设计文档,并能为工程设计提供各种服务的数据库。应用于程设计提供各种服务的数据库。应用于 CAD/CAMCAD/CAM,CIMCIM,CASECASE等等CaxCax的工程应用领的工程应用领域。域。 工程数据库(续)工程数据库(续)l工程数据库管理系统的功能:工程数据库管理系统的功能:支支持持复复杂杂对对象象( (如如图图形形数数据据、工工程程
53、设设计计文文档档) )的的表表示示和处理;和处理;可扩展的数据类型;可扩展的数据类型;支持复杂多样的工程数据的存储和集成管理;支持复杂多样的工程数据的存储和集成管理;支持变长结构数据实体的处理;支持变长结构数据实体的处理;支持工程长事务和嵌套事务的并发控制和恢复;支持工程长事务和嵌套事务的并发控制和恢复;支持设计过程中多个不同数据版本的存储和管理;支持设计过程中多个不同数据版本的存储和管理;支持模式的动态修改和扩展;支持模式的动态修改和扩展;支持多种工程应用程序等。支持多种工程应用程序等。 8.4 8.4 面向应用领域的数据库新技面向应用领域的数据库新技术术l8.4.1 数据仓库数据仓库l8.
54、4.2 工程数据库工程数据库l8.4.3 统计数据库统计数据库l8.4.4 空间数据库空间数据库8.4.3 8.4.3 统计数据库统计数据库l统计数据库是一种用来对统计数据进行存储、统计数据库是一种用来对统计数据进行存储、统计、分析的数据库系统。统计、分析的数据库系统。 l统计数据具有以下的基本特性:统计数据具有以下的基本特性: (1)分类属性和统计属性)分类属性和统计属性 (2)多维性)多维性 ,多维性是统计数据最基本的特多维性是统计数据最基本的特点点(3 3)分类属性的层次结构)分类属性的层次结构(4)微数据)微数据(Micro Data)和宏数据和宏数据(Macro Data) 统计数据
55、库(续)统计数据库(续)l统计数据库研究的问题和技术有:统计数据库研究的问题和技术有: (1)数据模型)数据模型 (2)查询语言和用户接口)查询语言和用户接口 (3)统计数据的物理组织)统计数据的物理组织 (4)时序数据)时序数据 (5)统计数据库安全性)统计数据库安全性 8.4 8.4 面向应用领域的数据库新技面向应用领域的数据库新技术术l8.4.1 数据仓库数据仓库l8.4.2 工程数据库工程数据库l8.4.3 统计数据库统计数据库l8.4.4 空间数据库空间数据库8.4.48.4.4空间数据库空间数据库l空间数据是用于表示空间物体的位置、空间数据是用于表示空间物体的位置、形状、大小和分布
56、特征等诸方面信息的形状、大小和分布特征等诸方面信息的数据,适用于描述所有二维、三维和多数据,适用于描述所有二维、三维和多维分布的关于区域的现象。维分布的关于区域的现象。 l空间数据库系统是描述、存储和处理空空间数据库系统是描述、存储和处理空间数据及其属性数据的数据库系统。间数据及其属性数据的数据库系统。 空间数据库(续)空间数据库(续)l空间数据库技术研究的主要内容包括:空间数据库技术研究的主要内容包括: (1)空间数据模型)空间数据模型 :空间数据模型是描述空空间数据模型是描述空间实体和空间实体关系的数据模型。间实体和空间实体关系的数据模型。 (2)空间数据查询语言)空间数据查询语言 ,空间
57、数据查询包括位空间数据查询包括位置查询、空间关系查询和属性查询,置查询、空间关系查询和属性查询, (3)空间数据库管理系统)空间数据库管理系统l 小结小结 l本章概要地回顾了数据库技术发展的三个阶段,本章概要地回顾了数据库技术发展的三个阶段,着重介绍了数据库新技术的主要内容和发展方着重介绍了数据库新技术的主要内容和发展方向。向。l本章以数据模型、新技术内容、应用领域为三本章以数据模型、新技术内容、应用领域为三条主线,阐述了新一代数据库系统及其相互关条主线,阐述了新一代数据库系统及其相互关系,从这三个方面介绍了数据库技术的进展系,从这三个方面介绍了数据库技术的进展 :数据库技术发展的核心是数据模
58、型的发展;数据库技术发展的核心是数据模型的发展; 传统的数据库技术和其他计算机技术的互相结合、传统的数据库技术和其他计算机技术的互相结合、互相渗透是数据库新技术的主要特征;互相渗透是数据库新技术的主要特征; 数据库技术在特定领域的应用使数据库的应用范围数据库技术在特定领域的应用使数据库的应用范围不断扩大,从而为数据库技术的发展提供源源不断不断扩大,从而为数据库技术的发展提供源源不断的动力。的动力。 小结小结 (续)(续)介绍了数据库大家庭中的主要成员,包括介绍了数据库大家庭中的主要成员,包括分布式数据库系统、并行数据库系统、分布式数据库系统、并行数据库系统、主动数据库系统、多媒体数据库系统、主动数据库系统、多媒体数据库系统、模糊数据库系统以及面向特定领域的数模糊数据库系统以及面向特定领域的数据仓库系统、工程数据库系统、统计数据仓库系统、工程数据库系统、统计数据库系统和空间数据库系统。据库系统和空间数据库系统。