分布式数据库总结

上传人:壹****1 文档编号:487865807 上传时间:2024-02-15 格式:DOC 页数:11 大小:372.50KB
返回 下载 相关 举报
分布式数据库总结_第1页
第1页 / 共11页
分布式数据库总结_第2页
第2页 / 共11页
分布式数据库总结_第3页
第3页 / 共11页
分布式数据库总结_第4页
第4页 / 共11页
分布式数据库总结_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《分布式数据库总结》由会员分享,可在线阅读,更多相关《分布式数据库总结(11页珍藏版)》请在金锄头文库上搜索。

1、%第一章:分布式数据库系统概述数据库:长期存储在计算机内的有组织的,可共享的有关数据的集合。数据库管理系统:D是介于顾客与操作系统之间的一层数据管理软件。为顾客或应用程序提供访问DB的措施,涉及D的建立、查询、更新及多种数据控制。DMS基于某种数据模型。数据库系统:数据库系统(DS)一般是指带有数据库的计算机应用系统。涉及数据库、相应的硬件、软件和各类人员。数据库技术:数据库技术是研究数据库的构造、存储、设计、管理和使用的一门软件学科;是一门综合性较强的学科。数据抽象:视图抽象外模式;概念抽象概念模式;物理抽象内模式数据模型:数据模型三要素:数据构造;数据操作;完整性约束模式内模式映象:该映象

2、存在于模式与内模式之间,用于定义模式与内模式之间的相应性。本映象一般在内模式中描述。外模式/模式映象:该映象存在于外模式与模式之间,用于定义外模式和模式之间的相应性。本映象一般在外模式中描述。物理独立性:在数据库系统的三级模式构造中,存在模式内模式的映 象,当内模式发生变化时,只要修改模式/内模式的映象,就可以保持模式不变,从而保证程序与数据的物理独立性。逻辑独立性:在数据库系统的三级模式构造中,存在外模式模式的映象,当模式发生变化时,只要修改外模式/模式的映象,即可保持外模式不变,从而保证程序和数据的逻辑独立性。DDS具有如下四个基本特点:物理分布性逻辑整体性 场地自治性 场地之间协作性计算

3、机网络:定义为互相联接、彼此独立的计算机系统的集合。互相联接指两台或多台计算机通过信道互连,从而可进行通信;彼此独立则强调在网络中,计算机之间不存在明显的主从关系,即网络中的计算机不具有控制其她计算机的能力,每台计算机都具有独立的操作系统。 计算机网络的构成:通信子网和资源子网分布式数据库定义:物理上分散而逻辑上集中的系统,它使用计算机网络将地理位置分散而管理和控制又需要不同限度集中的多种逻辑单位(一般是集中式数据库系统)连接起来,共同构成一种统一的数据库系统。分布式数据库系统可以当作是计算机网络和数据库系统的有机结合。分布式数据库系统的特点:物理分布性:数据不是寄存在一种站点上逻辑整体性:是

4、与分散式数据库系统的区别 站点自治性:是与多解决机系统的区别 数据分布透明性集中与自治相结合 存在合适的数据冗余度 事务管理的分布性分布式数据库的分类:按局部DBMS的数据模型分类同构型DDBS:各个站点上数据库的数据模型都是同一数据模型。同构同质型:同一类型,同一种BMS同构异质型:同一类型,不是同一种异构型DBS:各个站点上数据库的数据模型的类型是各不相似的。按DDBS的全局控制类型分类全局控制集中型DS:全局控制机制和全局数据词典位于中心站点全局控制分散型DS:全局控制机制和全局数据词典分散在网络的各个站点上。全局控制可变型DDBS:也称主从型DB。提成两组站点,一组涉及全局控制机制和全

5、局控制词典,此外一组不涉及。分布式数据库的构成成分:应用数据库,它是分布式数据库的主体,有关应用所需要的数据的集合;、局部数据(只提供本站点的局部应用所需要的数据);2、全局数据(虽然物理上存储在个站点上,但是参与全局应用)描述数据库(数据字典、数据目录或元数据)有关数据库中该数据构造的定义,以及全局数据的分片、分布的描述。1、局部数据目录(局部站点上的数据词典)2、全局数据目录(提供全局数据的描述和管理有关信息)数据分片要准守的原则:完备性原则:要把所有的数据映射到各个片断中;可重构原则:关系分片后的各个片断可重构整个关系;不相交原则:关系分片后的各个片断不能重叠分布式数据库是多层的:全局外

6、层(全局外模式) 全局概念层:(全局概念模式、分片模式和分派模式)描述分布式数据库总全局数据的逻辑构造和数据构造。 局部概念层:局部概念模式 局部内层:局部内模式DD的体系构造自上而下有六个层次:全局外模式;全局概念模式;分片模式;分派模式; 局部概念模式;局部内模式模式构造:全局外模式,全局概念模式,分片模式,分派模式,局部概念模式,局部内模式。分布式数据库管理系统的功能模块:要保证数据库的共享性、可用性、安全性、完整性、分布透明性等功能的实现,应当涉及如下四个基本功能模块:查询解决模块:查询分析和查询优化 完整性解决模块 调度解决模块 可靠性解决模块 DDBS在物理硬件层和集中式系统的重要

7、区别是:多种各样被称为站点或节点的计算机必须通过通信网络连接起来,在站点间传播数据和命令。分布式数据库管理系统的参照模型的重要成分:解决器和模式。分布式数据库中的数据独立性:逻辑独立性物理独立性分布独立性(分布透明性):分三个层次:分片透明性(完全分布透明性);位置透明性(中级分布透明性);局部数据模型透明性(低档分布透明性); 无分布透明性:异构数据分布透明性的定义:指顾客或顾客程序使用分布式数据库犹如使用集中式数据库那样,不必关怀全局数据的分布状况,涉及全局数据的逻辑分片状况、逻辑片段的站点位置分派状况,各站点数据库的数据模型等状况对顾客和顾客程序是透明的。分布透明性的三个层次:分片透明性

8、:分布透明性中的最高层,位于全局概念模式与分片模式之间。位置透明性:分布透明性的中间层,位于分片模式和分派模式之间。局部数据模型透明性:分布透明性的最底层,位于分派模式与局部概念模式之间。%第二章:分布式数据库系统的设计设计集中式数据库的一般措施涉及四个阶段:需求分析,概念设计,逻辑设计,物理设计分布式数据库加一阶段:分布设计,涉及数据的分片设计和ain段的位置分派设计。需求分析阶段输出:应用的频率表,实体的划分表,数据与应用的筹划表。DDB设计措施:自顶向下(重构法);自底向上(组合法);混合法分片应遵守的原则:(1)完整性条件;()可重构条件; (3)不相交条件分片的方式:()水平分片:是

9、对全局关系执行“选择”操作。分为基本分片和基于到处分片。()垂直分片;是通过“投影”操作把它的属性提成若干组。导出分片 ;混合分片分布式查询方略:代价公式: C = O 代价 +CP 代价 + 通讯代价通讯代价: C 传播延迟时间C0 + (传播数据量X * 数据传播速率1)%第三章:分布式数据库的查询解决与优化分布式查询分类:局部查询,远程查询,全局查询(1)层次构造:分布式数据库查询解决的层次构造,查询解决可分为四个层次:查询分解:将查询问题转换成一种定义在全局关系上的关系代数式;数据本地化:把一种在全局关系上的查询,进行具体化,贯彻到适合片段上的查询;全局优化:寻找最优方略;局部优化:每

10、个子站点上执行的子查询; (2)查询优化的方式:基于关系代数等价变换的查询优化解决;基于半连接算法的查询优化解决; 基于直接连接算法的查询优化解决基于半联接的查询优化方略的重要思想是不参与联接的值或无用的值不必在网络中来回传播半连接表达连接的代价估算:Card()片段关系R的元组数目 Size(A)属性的大小(即字节数)Size()片段关系的大小, 属性大小之和 Val(A)属性在R中浮现的不同值的个数选择操作 F()Car(S)= *Car(R) ze()Sz(R) Vl()是Va(R), ar(S), Crd(R)的函数并操作T=RCrd(T)r()Card() Size(T)=Si(R)

11、=z(S)V(AT)Val(R)+al(A)连接操作 T=SCard(T) =(C(R)*Ca())/(R) Sze(T) Sze(R)Si()Size(A)(T)Min(al(AR),al(BS)) A 是连接属性Val(AT)Val(R)+Val(BS) 不是连接属性 半连接 R=V(AS)/l(D(A) Car() =*Cad(R)Sie(T) 第一种操作数iz() l(AT) *Vl()采用半连接的总代价T半 20+ (i() ard( R) +sie ()* va( )半S=C1(sie (S)* ar()+size(A)*va( AR))比较半R 与T半, 取最优者例:举例:已知1

12、分段F1和12的大小为: |F11=|F12|0,2分段F21和F2的大小为:|1| 10 |F2200设数据通讯C0=,C1=1, 本地连接Cot=J(x,2)=5*(x1+2)并操作Cost= U(1,x2) 2*(x1+x)令R1保持分片状态, 则: 站点的完毕时间 T(Q, ,) 200+*(10000)+*(50+00)=0同理: T(Q, S, 1) = 10+2(100+200)+5*(50+0)=20因此,查询响应时间在1保持分片状态为 550.令R2保持分片状态,则: 站点1的完毕时间(Q, S,R) = +2*(5050)+*(100+10)25同理: T(Q,S, R2)

13、 = 52*(50+5)+(20+100)=1750因此,查询响应时间在R2保持分片状态为10.由于:R1保持分片状态的响应时间R2保持分片状态的响应时间因此: 选择R2保持分片计算查询设关系(,B,C)在场地1,关系S(,D,E)在场地2,现欲在场地2得到的操作成果。(1)用联接的措施,如何执行上述操作。(2)用半联接的措施,如何执行上述操作。(1)用联接的措施执行,就是直接把关系R从场地1传播到场地2,在场地2执行自然联解得:()用联接的措施执行,就是直接把关系从场地1传播到场地,在场地2执行自然联接。(2) 在场地2,求(S)的值; 把(S)的值从场地2传播到场地; 在场地1执行RC(S)操作;把(RC(S)的值从场地1传播到场地2; 在场地执行(RC(S)操作,即求得S的值。即RS=(R(S))S (R S)S%第四章:分布式数据库中的事务管理和恢复事务概念:事务是访问或更新多种数据项的最小逻辑工作单位。它是一种操作序列它可以使数据库从一种一致状态到此外一种一致状态 事务必须保证数据库的一致性事务执行期间数据库也许不一致分布式数据库中的事务 分类:全局事务 局部事务分布式事务特性(C特性)原子性(Aiity):事务的操作要么所有执行, 要么所有不执行 ,保证数据库一致性状态一致性(Csten):事务的对的性,串行性,并发

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 幼儿教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号