分布式数据库学习总结论文

上传人:第*** 文档编号:56745255 上传时间:2018-10-15 格式:DOC 页数:29 大小:152KB
返回 下载 相关 举报
分布式数据库学习总结论文_第1页
第1页 / 共29页
分布式数据库学习总结论文_第2页
第2页 / 共29页
分布式数据库学习总结论文_第3页
第3页 / 共29页
分布式数据库学习总结论文_第4页
第4页 / 共29页
分布式数据库学习总结论文_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《分布式数据库学习总结论文》由会员分享,可在线阅读,更多相关《分布式数据库学习总结论文(29页珍藏版)》请在金锄头文库上搜索。

1、分布式数据库系统分布式数据库系统姓名:张定国学号:s20130415第一章分布式数据库系统概述第一章包含五个部分内容,分别是引言及准备知识、分布库系统的基本概、分布库系统的作用和特点、分布式数据库系统介绍、关键技术。引言及准备知识:引言及准备知识:分布数据库管理系统兴起于70年代中期,推动其发展来自两方面:一方面是应用需求,另一方面是硬件环境的发展。这些应用都涉及地理上分布的团体、组织的局部业务管理和系统全局管理,采用成熟的集中式数据库管理系统已无法实现应用需求。在硬件环境上提供了功能强大的计算机和成熟的广域范围公用数据网及局域范围局域网的硬件环境支持。分布式数据库系统是地理上分散而逻辑上集中

2、的数据库系统。即通过计算机网络将地理上分散的各局域结点连接起来共同组成一个逻辑上统一的大数据库系统。因此可以说:分布式数据库系统是计算机网络技术和数据库技术的结合的产物。分布式数据库系统与集中数据库系统一样,包含两个重要部分:分布式数据库和分布式数据库管理系统。分布库系统的基本概:分布库系统的基本概:数据库-从用户使用数据库的角度出发,可定义如下:数据库是长期存储在计算机内、有组织的、可共享的数据集合。数据库中的数据按一定的数据模型组织、描述、存储,具有较小的冗余度、较高的数据独立性和易于扩展性,并可为各种用户共享。数据库设计-对一个给定的应用环境(现实世界)设计最优的数据模型,然后,按模型建

3、立数据库。数据库管理系统-人们用于管理和操作数据库的软件产品。为有效地管理和操作数据库,研制出数据库管理系统(Database Management System),使用户不必涉及数据的结构描述及实际存储,方便、最优地操作数据库。数据库管理系统可描述为用户接口、查询处理、查询优化、存储管理四个基本模块和事务管理、并发控制、恢复管理三个辅助模块组成。模式-现实世界的信息抽象到数据库存储的数据是一个逐步抽象的过程。美国国家标准协会(ANSI)和标准需求计划委员会(SPARC)根据数据的抽象级别定义了三层模式参考模型。 关系模型-数据库数据模型的三种模型(层次数据模型、网状数据模型和关系数据模型)之

4、一。关系是二维表,关系也称表。表中的一行称关系的一个元组,表中的一列称关系的一个属性。关系代数-关系是一个集合,关系的元组是集合的元素。关系代数包括5个集合运算和3个特殊关系运算。SQL-是一种非过程性语言。提供了数据定义(建立数据库和表结构)、数据操纵(输入、修改、删除和更新、数据查询)、数据控制等数据库操作命令,较好地满足数据库语言的要求。由于国际标准化组织指定了SQL标准,具有可移植性, SQL又提供了灵活而强大的查询功能方便复杂的查询操作,使SQL为广大用户所采用。节点/场地-分布式数据库系统是地理上分散而逻辑上集中的数据库系统。管理分布式数据库的软件称分布式数据库管理系统。分布式系统

5、通常是由计算机网络将各地理上分散的逻辑单位连接起来。被连接的逻辑单位称为节点(node)或场地(site)。节点/场地可是单独一台计算机也可是局域网组成。集中数据库系统-所有数据驻留在同一场地上。我们称传统的数据库系统为集中式数据库系统(DB)。分布式数据库-分布在一个计算机网络上的多个逻辑相关的数据库的集合。也就是说,分布式数据库是一组结构化的数据集合,逻辑上属于同一系统,物理上分布在计算机网络的各个不同节点上。分布式数据库系统介绍分布式数据库系统介绍20世纪80年代以来,这一时期商品化的产品如下:Sybase SQL Server。SYSBASE1987年推出的。Informix-Onli

6、ne. INFORMIX 公司20世纪90年代推出。C-POREL.1990年由中国科学院数学所等单位开发集成的。分布库系统的作用和特点:分布库系统的作用和特点:作用:分布式数据库系统是地理上(或物理上)分散而逻辑上集中的数据库系统。适合于分散型组织结构的任何信息系统。如:航空公司订票系统、陆、海、空军事指挥系统、CIMS制造业、银行通存通兑系统和连锁配送系统等等。以上每一系统都涉及分散在不同地理位置上数据的一致性、完整性及有效性,是集中式数据库无法满足的。在此推动下,研制出分布式数据库系统,有效地适应了地理上分散的、网络环境下的、逻辑上统一的分布式系统的需求。特点:分布式数据库系统是在集中式

7、数据库和计算机网络技术基础上发展起来的,同时提出了许多新观点、新方法和实现的新技术,有效地提高了分布系统的性能。因此,分布式数据库系统具有许多集中库系统所不具备的优点。但由于分布库系统复杂,有些技术的实现还不完善,如:恢复开销庞大,导致系统效率严重下降;难于达到完全透明等。优点: 提高系统性能,如:吞吐率和响应速度提高。可利用现有设备和系统,降低投资。系统允许存储副本,提高可靠性、可用性和并行执行度。根据实际需要,可增加或减少某一场地。系统具有可扩展性。系统资源和数据分布在物理上不同场地上,为系统所有用户共享。缺点:经验不足,系统不很完善。 系统复杂。 维护开销大。 需分布控制。 安全问题。

8、系统难以改变。关键技术:关键技术:分布式数据库设计中需要考虑下面几个问题:如何合理分布数据于各个场地上,如何设定复制型和非复制型数据,如何实现目录管理。查询处理:事务到数据操作命令的转换问题,以最小代价(访问时间)执行查询策略的优化问题。并发控制:对多个用户并发访问的同步问题;事务的一致性和隔离性问题;解决和预防死锁问题。可靠性:系统故障恢复问题;事务的原子性和耐久性实现问题。安全性与完整性方面,要解决:用户授权和认证问题;访问权限控制问题;数据完整性约束问题。第二章分布式数据库系统的结构体系结构框架是用于规范系统体系结构设计的指南。要建立一个分布式数据库系统,首先要考虑系统的体系机构。系统的

9、体系结构用于定义系统的结构,包括组成系统的组件,定义各组件的功能及组件之间的内部联系和彼此间的作用。本章包含的主要内容有:物理结构和逻辑结构、体系结构、系统结构、模式结构、功能结构、数据集成系统、MDBS体系结构、P2PDBS、分布式数据库系统分类、字典信息的组织。物理结构和逻辑结构:物理结构和逻辑结构:系统结构:系统结构:系统的体系结构( Architecture):按组件、组件功能以及它们的交互作用定义系统的结构(Structure)。参考体系结构的目的:讨论的框架、标准。DBMS 标准化:基于功能、基于组件、基于数据、最早的是基于数据组织ANSI/SPARC Architecture(e

10、xternal view, conceptual view, internal view, )的三级模式结构。组件结构:组件结构:应用处理器(AP)功能:用户接口:检查用户身份,接受用户命令,如:SQL命令。语义数据控制器: 视图管理、安全控制、语义完整性控制(全局概念模式)。这些约束定义在字典中。全局查询处理器:将用户命令翻译成数据库命令;生成全局查询的分布执行计划;收集局部执行结果并返回给用户。全局执行监控器(全局事务管理器):调度协调和监视AP和DP之间的分布执行;保证复制数据的一致性;保证全局事务的原子性。DP功能局部查询处理:实现全局命令到局部命令的转换;访问路径选择器,选择最好的路

11、径执行。局部恢复管理器: 维护本地数据库一致性的故障恢复。运行支持处理器(存储管理器):按调度命令访问数据库;控制数据库缓存管理器;返回局部执行结果;保证子事务执行的正确性。局部事务管理器:以局部子事务为单位调度执行,保证子事务执行的正确性。局部调度管理器:负责局部场地上的并发控制,按可串行化调度和执行数据操作。模式结构:模式结构:我国分布式数据库系统标准草案中给定的抽象为四层的模式结构:全局外层、全局概念层、局部概念层和局部内层。模式与模式之间是映射关系。全局模式或外模式(ES):全局外模式即全局用户视图,是分布式数据库的全局用户对分布式数据库的最高层抽象。全局用户使用视图时,不必关心数据的

12、分片和具体的物理分配细节。全局概念模式(GCS): 全局概念模式即全局概念视图,是分布式 数据库的整体抽象,包含了全部数据特性和逻辑结构。像集中式数据库中的概念模式一样,是对数据库全体的描述。全局概念模式再经过分片模式和分配模式映射到局部模式。分片模式是描述全局数据的逻辑划分视图。即全局数据逻辑结构根据某种条件的划分,将全局数据逻辑结构划分为局部数据逻辑结构。每一个逻辑划分成一个分片。在关系数据库中,一个关系中的一个子关系称该关系的一个片段。分配模式是描述局部数据逻辑的局部物理结构,即划分后的分片的物理分配视图。局部概念视图(LCS):局部概念模式为局部概念视图,是全局概念模式的子集。局部概念

13、模式用于描述局部场地上的局部数据逻辑结构。当全局数据模型与局部数据模型不同时,还涉及数据模型转换等内容。 局部内模式定义局部物理视图,是对物理数据库的描述,类似集中数据库的内层。分布式数据库的四层结构及模式定义描述了分布式数据库是一组用网络联结的局部数据库的逻辑集合。它将数据库分为全局数据库和局部数据库。全局数据库到局部数据库由映射(1:N)模式描述。全局数据库是虚拟的,由全局概念层描述。局部数据库是全局数据库的内层,由局部概念层和局部内层描述。全局用户只关心全局外层定义的数据库用户视图,其内部数据模型的转换、场地分配节等由系统自动实现。数据库集成系统:数据库集成系统:DDB 和 数据库集成系

14、统通常,分布式数据库系统是自上而下(top-down)地设计数据库,可灵活地进行分片和分配设计。用户可得益于其“集中控制”和数据库系统具有的数据处理能力。但分布式数据库系统具有数据库组件数量的限制,通常不多于数十个数据库组件。数据集成系统通过约束数据管理能力(只支持只读),可将数据库组件数量扩展到数百个。在数据集成系统中,通常数据和数据库已存在,是遵循自下而上(bottom-up)地集成各局部场地上的数据。多数据库系统(MDB)MDBS 是在己经存在的数据库系统 (称为局部数据库系统:LDBs) 之上为用户提供一个统一的存取数据的环境。数据集成系统:数据集成系统:DDB 和 MDB的不同MDB

15、:本地数据管理器(data manager )都是完备的DBMS,具有它自己的DDL, DML和TM。DDB:只有一个数据管理器和依赖于该管理器的存在于各局部场地上组件数据管理器(component-data-manager)。MDBSMDBS (多库数据库系统):(多库数据库系统):在多数据库系统中,不是所有子事务的成功或失败都影响全局事务的执行结果,多数据库事务中的部分结果也可被其它事务引用。因此,在多数据库系统中,需要松弛型事务(relaxed transaction);通常,多数据库事务是长事务(long transaction)。多数据库事务管理的目标是要实现对多副本的全局数据的并发

16、操作,同时,要保证数据的一致性和局部场地的自治性。多数据库的并发控制:能同步全局事务和局部事务。若要支持多数据库的任意更新操作,必须牺牲某些场地的自治性;若要保证局部场地的自治性,就必须限制全局事务的类型如只读或单场地更新等。P2PP2P数据库系统数据库系统(P2PDBS)(P2PDBS):对等型 模型(又称P2P 模型)是一种新型的体系结构模型,面向大范围的多数据资源点的松散耦合。特点:每个点均可贡献数据,系统资源具有丰富性、多样性;可直接访问数据源中的数据资源,即时得到最新鲜的数据,不同于如数据仓库等集中的数据资源仓;采用自组织原则,具有健壮性;每个点可随时加入和退出,系统具有分散性、可扩展性;以Web上的资源为Peer点,系统部署简单,不需要复杂的框架部署实现。分布式数据库系统分类:分布式数据库系统分类:分布式数据库系统的分类很多。为全面、系统地对分布式数据库系统进行分类,采用分布式数据库的三个特性(分布性、异构性、自治性)组成的三维空间图来描述分布式数据库的类型。三个基本特性:分布性是指系统的各组成单元是否位于同一

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 调研报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号