数据库系统概论分布式数据库系统

上传人:宝路 文档编号:48058107 上传时间:2018-07-09 格式:PPT 页数:62 大小:237.07KB
返回 下载 相关 举报
数据库系统概论分布式数据库系统_第1页
第1页 / 共62页
数据库系统概论分布式数据库系统_第2页
第2页 / 共62页
数据库系统概论分布式数据库系统_第3页
第3页 / 共62页
数据库系统概论分布式数据库系统_第4页
第4页 / 共62页
数据库系统概论分布式数据库系统_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《数据库系统概论分布式数据库系统》由会员分享,可在线阅读,更多相关《数据库系统概论分布式数据库系统(62页珍藏版)》请在金锄头文库上搜索。

1、第十四章分布式数据库系统概述4分布式数据库系统是数据库技术和网络技术两 者相互渗透和有机结合的结果DB1DB2DB3计算机1计算机2计算机3通讯网络北京重庆上海银行系统分布式数据库和分布式数据库系统4定义 分布式数据库是由一组数据组成的,这组数据分布 在计算机网络的不同计算机上,网络中每个结点具 有独立处理的能力(称为场地自治),可以执行局 部应用(只对本结点数据进行存取的应用),同时 每个结点也能通过网络通讯支持全局应用(指存取 两个或两个以上的结点的数据库应用)。分布式数据库强调场地自治性(局部应用)以及自 治场地之间的协作性(全局应用)。分布式数据库和分布式数据库系统4分布式数据库具有以

2、下两个特点: 分布性 分布性有两层含义,一是指数据库中的数据不是 都存储在同一结点(更确切的讲,不存储在同一 计算机的存储设备上),而是分布在多个结点上 ;二是指各结点具有独立的数据库处理能力,能 够有效地支持局部应用。 逻辑整体性 分布在各结点的数据不是孤立的,而是相互联系 的,是一个逻辑整体,能够支持存取多个结点数 据的全局应用。分布式数据库和分布式数据库系统4分布式数据库系统是在集中式数据库系统技术 的基础上发展起来的,但不是简单地把集中式 数据库分散的实现,它丰富和发展了集中式数 据库的许多概念和技术,具有自己独特的特征 和性质。具体来说,它具有以下特点: 数据独立性 数据独立性在分布

3、式数据库系统中具有了更多的含 义,它不仅包括数据的逻辑独立性和物理独立性以 外,还包括数据的分布独立性(也称分布透明性) 。分布透明性指用户不必关心数据的逻辑分片,不 必关心数据物理位置分布的细节,不必关心重复副 本(冗余数据)一致性问题,也不必关心局部结点 上数据库支持哪种数据模型。分布式数据库和分布式数据库系统 集中与自治相结合的控制机构 在分布式数据系统中,数据的共享有两个层次: 一是局部共享,即在局部数据库中存储局部结点 各用户的共享数据;二是全局共享。即在分布式 数据库系统的各个结点也存储供其他结点的用户 共享的数据,支持系统的全局应用。因此,相应 的控制机构也具有两个层次:集中和自

4、治。分布 式数据库系统常常采用集中和自治相结合的控制 机构。各局部的DBMS可以独立的管理局部的数 据库,具有自治功能。同时系统又设有集中控制 机构,协调各局部DBMS的工作,执行全局应用 。分布式数据库和分布式数据库系统 适当增加数据冗余 在分布式数据库系统中适当的增加了冗余数据, 在不同的结点存储同一数据的多个副本,其原因 是:一提高系统的可靠性、可用性,当某一结点 出现故障时,系统可以对另一结点的相同副本进 行操作,不会因为一处故障而造成整个系统的瘫 痪;二是提高系统性能,系统可以选择用户最近 的数据副本来进行操作,减少通信代价,改善整 个系统的性能。分布式数据库和分布式数据库系统 全局

5、的一致性、可串行性和可恢复性 分布式数据库系统中各局部数据库应满足集中式 数据库的一致性、并发事务的可串行性和可恢复 性。除此之外还应保证数据库的全局一致性、全 局并发事务的可串行性和系统全局的可恢复性。 这是因为在分布式数据库系统中全局应用要涉及 两个以上结点的数据,全局事务可能由不同结点 上的多个操作组成。分布式数据库和分布式数据库系统4分布式数据库系统的目标 适应部门分布的组织结构,降低费用 使用数据库的单位在组织上常常是分布的,在地 理上也是分布的。分布式数据库系统的结构符合 上述分布的组织结构,允许各个部门将自己常用 的数据存储在本地,降低了通信代价,提高了响 应速度。 提高系统的可

6、靠性和可用性 将数据分布于多个结点,并适当增加冗余度,可 以提供更好的可靠性。分布式数据库和分布式数据库系统 充分利用数据库资源,提高现有集中式数据 库的利用率 当在一个大企业内部和大部门中已经建成若干个 数据库后,为了利用相互的资源,开发全局应用 可以在现有各局部数据库的基础上做一定的修改 和重构,建立一个分布式数据库系统。 逐步扩展处理能力和系统规模 相对于集中式数据库系统,分布式数据库系统能 够方便地将一个新结点纳入系统,而不影响现有 系统的结构和系统的正常运行,提供了逐步扩展 系统能力的较好途径。分布式数据库的体系结构全局外模式全局外模式全局概念模式分片模式分布模式局部概念模式局部概念

7、模式局部内模式局部内模式局部DB局部DB全局DBMS局部DBMS映像1映像2映像3映像4分布式数据库的体系结构4全局外模式 全局应用的用户视图,是全局概念模式的子集。4全局概念模式 定义分布式数据库中数据的整体逻辑结构,使得数 据如同没有分布一样。 4分片模式 每一个全局关系可以分为若干互不相交的部分,每 一部分称为一个片段。分片模式定义片段以及全局 关系到片段的映像。 4分布模式 定义片段的存放结点。分布式数据库的体系结构4分布(网络)透明性 分片透明性 用户或应用程序只对全局关系进行操作而不必考虑 关系的分片。如果分片模式改变了,通过调整全局 模式与分片模式之间的映象关系来保持全局模式不

8、变。 位置透明性用户或应用程序不必了解片段的存储位置。 局部数据模型透明性用户或应用程序不必了解局部场地上使用的是哪种 数据模型。分布式数据库的体系结构4示例:设有全局关系S,它被划分为两个片段 S-A(本科生),S-B(研究生),S-B有两个 副本。SS-AS-BS-AS-BS-BSite-1Site-2Site-3全局关系片段物理存储分布式数据库设计4数据在分布式数据库中的存储途径 数据的重复存储 系统在两个或两个以上结点维护关系R的几个完全 相同的副本。如果系统的每个结点都存储R的一个 副本,则称这种重复存储为完全重复存储。数据重 复存储具有以下几个优点: 可用性强如果某个存储R的结点出

9、了故障,系统仍然可以使用其它 结点上的副本继续处理用户查询,使系统正常运行。 增强并行性由于R的重复存储,可以使更多的用户并行地查询R。数据的重复存储也会带来一些问题,如增加了更新 操作的开销,加大了并行控制的难度分布式数据库设计 分片存储 关系被划分为几个片段,各个片段存储在不 同的结点上。将数据分片,使数据存放的单 位不是关系而是片段,这既有利于按照用户 的需求较好地组织数据的分布,也有利于控 制数据的冗余度。分片时必须遵循以下原则 : 完全性:被划分关系中的每个元组必须属于一个片段。 不相交性:同一个关系的片段互不相交。 可重构性:如果R被划分为片段R1、R2、Rn,则R能从 R1、R2

10、、Rn恢复出来。分布式数据库设计 分片方式 水平分片 垂直分片 导出分片 混合分片分布式数据库设计 水平分片 将关系r依照一定条件按行分为不相交的若干子 集r1,r2,rn,每个子集ri称为一个水平片段。一个水平片段可以看成是关系上的一个选择。 ri =P(i)(r) 如C_S=DNO=D06(S) 关系的重构可以通过并运算来实现。 r= r1 r2rn分布式数据库设计 垂直分片 将关系r按列分为若干属性子集r1,r2,rn,每 个子集ri称为一个垂直片段。 一个垂直片段可以看成是关系上的一个投影。 ri =Ri(r) 其中Ri是r的一个属性子集。 如P_S = PNO,SAL(P) 关系的重

11、构可以通过连接运算来实现。 r= r1 r2 rn 所有分片都包括关系的码分布式数据库设计 导出分片 导出水平分片,分片的条件不是关系本身属性条件,而 是其它关系的属性条件。 如SC(SNO,CNO,G)按学生系别分片。 混合分片 关系按某种方式分片后,得到的片段再按另一种方式继 续分片。 如SC(SNO,CNO,G)按学生系别分片,再对每个 片段按成绩(及格,不及格)分片。分布式数据库设计 组合存储 这种方法是重复存储和分片存储相结合的方 法。关系被划分为几个片段,系统为每个片 段维护几个副本,每个副本存放于不同的结 点上。分布式数据库设计4命名和局部自治性 每个数据项(关系、副本、片段)必

12、须有唯 一的名字,在分布式数据库系统中必须保证 在不同的结点上不会用同一个名字来代表不 同的数据项。 途径1:名字服务器 所有名字都在名字服务器中注册,每个名字对应 一个数据项。 缺陷:名字服务器成为名字解析的瓶颈;其故障 将影响整个系统的运行;局部自治性降低。分布式数据库设计 途径2:将结点标识作为前缀加到该结点数 据项的名字前面。使用这一方法,能够保 证名字的唯一性,不须中央控制,局部自 治性提高;但不能保证网络透明性。分布式数据库管理系统概述4D-DBMS由四个部分组成: LDBMS,局部场地上的DBMS,主要功能 是建立和管理局部数据库,提供场地自治能 力,执行局部应用以及全局查询的子

13、查询。 GDBMS,全局数据库管理系统,主要功能 是提供分布透明性,协调全局事务的执行, 协调各局部DBMS以完成全局应用,保证数 据库的全局一致性,执行并发控制,实现更 新同步,提供全局恢复等功能。分布式数据库管理系统概述 全局数据字典,存放全局概念模式、分片模 式、分布模式等的定义,以及各模式之间的 映像定义,存放有关用户存取权限的定义、 完整性约束的定义等。 通信管理,在分布式数据库各场地之间传送 消息和数据,完成通信功能。分布式数据库管理系统概述4D-DBMS的分类 按全局控制发生分类 全局控制集中的DDBMS 全局数据库器和全局数据字典集中于某一结 点,其优点是控制简单,容易实现更新

14、一致 性,但该结点容易成为系统的瓶颈,系统也 较脆弱。分布式数据库管理系统概述全局控制分散的DDBMS 全局数据库器和全局数据字典分散在网络上 的每一个结点上,每个结点都能完成全局事 务的协调和局部数据库事务的控制功能。每 个结点既是全局事务的参与者,也是全局事 务的协调者。其优点是结点独立,自治性强 ,但全局控制的协调机制和一致性维护都比 较困难。 全局控制部分分散的DDBMS 介于上述两者之间,根据应用的需要将全局 数据库管理器和全局数据字典分散在某些结 点上。分布式数据库管理系统概述按局部DBMS的类型分类 同构型DDBMS 每个结点的局部数据库具有相同的DBMS。 异构型DDBMS 各

15、结点的局部数据库具有不同的DBMS分布式查询处理4在分布式数据库系统中,数据分布在网 络上的多个结点之中,其查询需要由多 个结点利用网络协作完成。在集中式数 据库中,查询优化的目标是产生最小磁 盘I/O数,在分布式数据库中还要考虑网 络的传输时间和各结点的并发执行。因 此,分布式查询处理较集中式数据库复 杂。分布式查询处理4在分布式数据库系统中,查询可分为三 类:局部查询,远程查询,全局查询。 局部查询和远程查询只涉及单个结点的 数据(本地的或远程的),可以采用集 中式数据库的处理技术;二全局查询涉 及到多个结点的数据,因此相对复杂的 多。分布式查询处理4分布式查询处理的过程包括: 查询变换将

16、用户查询转换为析取范式或合取范式,并 进行语义分析,检查查询的正确性等工作。分布式查询处理 数据定位数据定位的目的是把用户定义在全局概念模式上的 查询转换为定义在局部概念模式上的查询。由于它 定义在片段上,也称为片段查询。设查询Q中包含 关系R1、R2、Rn,而且对于1in,Ri已经被 划分为m个片段Ri1、Ri2、Rim, Ri=F(Ri1、Ri2 、Rim)。Q的数据定位包括两步。第一步,对于 1in,用Ri=F(Ri1、Ri2、Rim)代替Q中的Ri , 得到一个等价的片段查询FQ。第二步,进一步加工 FQ,产生一个与FQ等价并且效率更高的片段查询 。分布式查询处理 全局查询优化无论是集中式数据库还是分布式数据库其查 询策略的选择都是以执行查询的预期代价为 依据的。在集中式数据库中,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号