大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解

上传人:我** 文档编号:115741215 上传时间:2019-11-14 格式:PPT 页数:114 大小:2.87MB
返回 下载 相关 举报
大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解_第1页
第1页 / 共114页
大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解_第2页
第2页 / 共114页
大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解_第3页
第3页 / 共114页
大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解_第4页
第4页 / 共114页
大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解_第5页
第5页 / 共114页
点击查看更多>>
资源描述

《大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解》由会员分享,可在线阅读,更多相关《大连理工大学算法分析与设计20143章_分布式数据库系统的设计2014-12-3讲解(114页珍藏版)》请在金锄头文库上搜索。

1、第三章分布式数据库系统的设计 1 徐喜荣 2012年11月2013年1月 徐喜荣 (xirongxu ) 第三章分布式数据库系统的设计 2 1 分布式数据库系统设计的目标 在理想情况下,分布式数据库系统的用户可不关心数据的物理分布, 由系统负责处理在不同站点上的分布数据。但是数据实际分布情况会 影 响系统的总体性能:访问多个数据对象所需的时间和费用,会因为 这些 数据对象是存放在同一站点,还是分布在多个站点有很大差别。 分布式数据库系统中最重要的目标是尽量减少对网络的利用,即尽 可能减少站点之间的通信次数和通信量。 因此,分布式数据库系统的数据库设计者必须仔细考虑数据是否分片 ,片段如何复制,

2、以及数据或片段如何分布,甚至在分布式数据库 管理 系统支持高的分布透明性时也要如此。 第三章分布式数据库系统的设计 3 DDBS 设计目标 目标一:本地性或近地性; 目标四:存储能力和费用。 目标二:控制数据适当冗余; 目标三:工作负荷分布; 1 分布式数据库系统设计的目标 第三章分布式数据库系统的设计 4 1 分布式数据库系统设计的目标 目标一:分布式数据库的本地性或近地性 分布式数据库设计中的一个主要原则是使数据和应用实现最大程度 的本地性。 开发一个分布式数据库的主要目的:通过尽可能地使数据靠近使用 该数据的应用进行分配,从而提高处理的本地性或近地性,减少通信。 在一个精心设计的分布式数

3、据库中,90%的数据应当在本地站点找 到而只有10%的数据需要在远程站点上进行访问。也即最有效的设计 是确保数据对最大数目的应用具有本地性。 设计方法是对每种可供选择的分片方法和片段的分配方法都统计出 本地访问和远程访问的次数,然后从其中选择一个最佳的方案。 第三章分布式数据库系统的设计 5 目标二:控制数据适当冗余 1 分布式数据库系统设计的目标 控制数据的适当冗余是分布式数据库系统设计的又一个目标。 在分布式数据库系统中,为了提高系统的本地性、并发度和可靠性, 需要增加数据的副本。 这不仅使应用具有高度的可用性和本地性,而且当数据的任何一个副 本不能使用时,可方便地使用在另一站点中的该数据

4、的副本进行恢复, 从而提高系统的可靠性。 第三章分布式数据库系统的设计 6 目标三:工作负荷分布 1 分布式数据库系统设计的目标 分布式计算机系统的一个重要特征是把工作负荷分布在网络中的 各个站点上。 分布工作负荷的目的是充分利用每个站点的计算机的能力和资源 以提高应用执行的并行程度,从而提高系统的性能。 第三章分布式数据库系统的设计 7 数据库的分布会受到各站点的存储能力的影响。在网络中可以有 专 门用于存储数据的站点,也可以有完全不支持大量容存储的站点。 一般数据存储的费用与 CPU,I /O及传输的费用相比是不重要的, 但 是必须考虑各站点可用存储空间的限制。 1 分布式数据库系统设计的

5、目标 目标四:存储的能力和费用 第三章分布式数据库系统的设计 8 2 分布式数据库系统设计的内容 分布式数据库系统设计的内容包括:分布式数据库的设计和应用设计。 分布式数据库的设计包括全局模式设计和每个站点的局部数据库设计。 其中的关键是数据库的全局模式应如何划分,并映射到合适的站点上。由 此产生了分布式数据库设计所特有的两个新问题:数据的分片设计和片段 的位置分配设计。 分片设计研究的是全局模式分片的“逻辑准则”,而片段的位置分配设计 研究的是处理数据在各站点上的“物理布局” 。 在分布式数据库设计中,为使分片设计和片段的位置分配设计得到的模 式能够高效地支持应用,还需要知道应用的确切要求。

6、 第三章分布式数据库系统的设计 9 2 分布式数据库系统设计的内容 DDBS 设计 DDB设计 应用设计 全局模式设计 局部数据库设计 各个应用的原发站点 各个应用在每个站点激活频率 各个应用对要求访问数据对象 的访问次数、类型和统计分布 数据的分片设计 和位置分配设计 第三章分布式数据库系统的设计 1.2 分布式数据库的发展 重构法 :一种自顶向下的创建方法。根据系统的实现环境和用户需求, 按照分布式数据库系统的设计思想和方法,采用统一观点,从总体设计 做起,包括各站点上的数据库系统,重新建立一个分布式数据库系统。 1.按照统一的思想来考虑 分布式数据库系统中的 各种问题,有效地解决 分布式

7、数据库系统数据 一致性、完整性和可靠性 。 2.花费的人力、物力会比较 多,研制周期也比较长, 系统建设的代价会比较大 。 采用重构法创建的分布式数据 库系统,通常是同构异质或同 构同质DDBS。大多选择同构 型分布式数据库系统。 用户1用户2用户n 分布式数据库管理系统 网络 3 分布式数据库系统的设计方法 第三章分布式数据库系统的设计 11 3.1 分布式数据库的发展 3 分布式数据库系统的设计方法 组合法 :一种自底向上的创建方法,也称集成法。利用现有的计算机网络和 独立存在于各个站点上的现存数据库系统,通过建立一个分布式协调管 理系 统,集成为一个统一的分布式数据库系统。 1.先剖析网

8、络功能; 2.剖析各个站点上原 有的数据库系统; 3.解决数据的一致性 、完整性和可靠性 ; 4.若各站点上DBMS 不相同,理论和实 践难度较大。 采用组合法的分布式 数据库系统通常是异构 或者同构异质DDBS。 用户1用户2用户n 分布式协调管理系统 DBMS1DBMS2DBMSm 网络 第三章分布式数据库系统的设计 12 DDBS 设计方法 自顶向下方法(重构法):从头开始设计分布式数据库。 设计者理解用户的数据库应用要求,历经概念设计、逻辑设计和物理 设 计阶段,并将与计算机系统无关的规格说明逐渐求精成低级的、与 计算 机系统有关的规格说明。概念设计和逻辑设计的结果是数据库的 全局模

9、式,包含了数据库的所有数据元素及其使用形式。 专门针对 分布式数 据库的一个设计阶段称为分布设计,将全局模式映射成几个 可能交叠的 子集模式,每一个子模式表示与一个站点有关的信息子集,然后完成每 一单个数据库的设计。 混合方法:许多实际情况中,设计者一部分使用自顶向下方法,另 一部分使用自底向上方法。 自底向上方法(组合法):通过聚集现存数据库设计分布式数据库。 由于需要互联一些现存数据库以形成一个多数据库系统,或者是由于 对各站点已独立完成了数据库的概念说明,所以各站点上数据库规格 说明已是现存的。需综合各站点的规格说明,以便得到分布式数据库 的全局概念模式。 3 分布式数据库系统的设计方法

10、 第三章分布式数据库系统的设计 13 3.1 自顶向下设计方法 需求分析 概念设计 视图设计 分布设计 物理设计 观察与监视 系统需求 全局概念模式 访问模式 外部模式定义 局部概念模式 物理模式 用户输入 视图集成 用户 输入 反馈反馈 自顶向下设计过程 3 分布式数据库系统的设计方法 第三章分布式数据库系统的设计 一、集中式数据库设计 包括四个阶段:需求分析、概念设计、逻辑设计、物理设计。 需求分析涉及收集用户数据库应用的非结构规格说明,并收集在 设计数据字典中。 概念设计产生全局、综合数据库模式的一种概念规格说明和在此 模式上执行应用的概念规格说明。 逻辑设计将综合概念模式转换成一给定的

11、DBMS类型(关系、网状 、 层次或面向对象模型)的数据库模式。 物理设计要遵照所选择的特定DBMS的能力和特征进行,并产生 实现数据库的物理访问结构的定义。 3.1 自顶向下设计方法 3 分布式数据库系统的设计方法 第三章分布式数据库系统的设计 15 二、分布式数据库设计增加一个新的阶段:分布设计 分布设计位于逻辑设计与物理设计之间,以一个全局的、与站点 无关的模式作为输入,以产生分布式数据库各站点的子模式 ( 局部 概念模式 )作为结果输出。 分布设计包括:数据的分片设计和片段的位置分配设计。 分片是指把一个全局对象(实体或关系)细分成若干逻辑片段的过程; 分配是指把各片段映射到一个或多个

12、站点的过程,片段是最合适的 数据分配单位。 3.1 自顶向下设计方法 3 分布式数据库系统的设计方法 第三章分布式数据库系统的设计 把现有数据库集成起来构成分布式数据库时,可采用自底向上的方法。 此方法重点是把将现有的各种不同的数据库模式集成为全局模式。 集成就是把公用数据定义合并起来,并解决对同一个数据的不同表示 方 法之间的冲突。 把现有数据库集成为一分布式数据库时,现有数据库很可能使用的是 不 同的DBMS,这将构成异构系统,从而增加了数据集成的复杂性。 此时可以在每对不同的DBMS之间进行一对一的翻译,也可选择一个 公用数据模型,然后再把涉及这个DBMS的所有的不同模式都翻译成 这 种

13、唯一的表示方法。 3.2 自底向上设计方法 3 分布式数据库系统的设计方法 第三章分布式数据库系统的设计 自底向上设计方法主要问题是构造一个全局模式(超视图). 把分布式数据库中各站点上的数据库模式看成是全局模式的一个 视图,则寻求全局模式的问题可以看作是视图综合问题。 概括分层结构支持视图综合。概括分层允许定义两个实体之间的 类 型和子类型关联,用于两个视图对同一实体的部分属性相交时。 视图综合问题的经典方法就是生成三个实体: 一个实体具有共同属性(超类型),两个实体具有不相交属性(子类型 )。在全局视图中,共同属性与子类型相关联,并且对包含非相交 属 性的各个视图生成一子类型。 视图综合次

14、序问题:一次把一个视图和全局模式进行综合,逐步构造起 全局视图。通常最好首先综合最大的或最重要的视图,然后综合小的或 者不重要的视图。 3.2 自底向上设计方法 3 分布式数据库系统的设计方法 一、构造全局模式问题分析 第三章分布式数据库系统的设计 班 机 机号 日期 可用座位 出入口 座位图 延期 班 机 机号 日期 可用座位 机型 座位图 班机 班机1班机2 机号 日期 可用座位 座位图 出入口 延期 机型 使用概括分层的两个视图的合并 3.2 自底向上设计方法 3 分布式数据库系统的设计方法 第三章分布式数据库系统的设计 识别相似性: 综合两个模式的第一步是识别它们的相似性,识别相似性是

15、综合 模 式的出发点。 从先前存在的数据库中数据的相似性可以推得匹配,相似的值集 表 明相交。 通过比较属性,可以识别匹配属性域。 如果在不同站点上有相似应用,使用各自数据库中的数据副本, 则 这两站点的数据库之间有某些相似点。 3.2 自底向上设计方法 3 分布式数据库系统的设计方法 二、识别相似性和识别冲突 第三章分布式数据库系统的设计 识别冲突:识别不同模式中相似数据的不同表示或域定义。 通过在全局模式中引入差异或在源模型中做一些折中,可以解决冲突 。 模式差异包括命名冲突、域差异、定标差异和结构差异。 命名冲突:同物异名(EMP,EMPLOYEE)和异物同名。通过在 全 局模式中存储名

16、字对应表就能方便地解决。 域差异:检测此问题通过比较源数据库或文件并注意不一致性来 进 行。概括分层可以用来表示这一问题的解。 定标差异:在具有同一数值的不同视图中可以见到定标差异,如 计 量单位不同(天、小时、分钟、秒)。设计中如有可能,应使用 更精 确的定标来检索数据,并使用换算公式进行连接或输出。 结构差异:同一对象有的用实体描述, 有的用属性描述。视图设计中 ,一般通过改变一个或两个视图来解决结构差异。 3.2 自底向上设计方法 3 分布式数据库系统的设计方法 第三章分布式数据库系统的设计 处理操作期间的不一致数据策略(5种) 对于设计时不能解决的冲突,需设计可供选择的策略,当执行时检测到 不一致性时,以回答有不一致数据的查询。这些策略包括: 显示任一不一致值,但不通知用户。这是最直截了当,同时也是最 危险的解决办法。 显示所有不一致值,并告诉用户不一致值信息源。在这种情况下, 用户应能评价不一致性的原因。 求

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号