DD 分布式数据库

上传人:hs****ma 文档编号:559519926 上传时间:2024-01-02 格式:DOCX 页数:3 大小:11.58KB
返回 下载 相关 举报
DD 分布式数据库_第1页
第1页 / 共3页
DD 分布式数据库_第2页
第2页 / 共3页
DD 分布式数据库_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

《DD 分布式数据库》由会员分享,可在线阅读,更多相关《DD 分布式数据库(3页珍藏版)》请在金锄头文库上搜索。

1、DD 分布式数据库科技名词定义中文名称: 分布式数据库英文名称: distributed database;DDB定义: 数据分存在计算机网络中的各台计算机上的数据库。应用学科:分布式数据库系统通常使用较小的计算机系统,每台计算机可单独放 在一个地方,每台计算机中都有DBMS的一份完整拷贝副本,并具有自己局 部的数据库,位于不同地点的许多计算机通过网络互相连接,共同组成一 个完整的、全局的大型数据库。简介这种组织数据库的方法克服了物理中心数据库组织的弱点。首先,降 低了数据传送代价,因为大多数的对数据库的访问操作都是针对局部数据 库的,而不是对其他位置的数据库访问;其次,系统的可靠性提高了很多

2、, 因为当网络出现故障时,仍然允许对局部数据库的操作,而且一个位置的 故障不影响其他位置的处理工作,只有当访问出现故障位置的数据时,在 某种程度上才受影响;第三,便于系统的扩充,增加一个新的局部数据库, 或在某个位置扩充一台适当的小型计算机,都很容易实现。然而有些功能 要付出更高的代价。例如,为了调配在几个位置上的活动,事务管理的性 能比在中心数据库时花费更高,而且甚至抵消许多其他的优点。分布式软件系统(Distributed Software Systems)是支持分布式处理 的软件系统,是在由通信网络互联的多处理机体系结构上执行任务的系统。 它包括分布式操作系统、分布式程序设计语言及其编译

3、(解释)系统、分布式文件系统和分布式数据库系统等。分布式操作系统负责管理分布式处理系统资源和控制分布式程序运行。 它和集中式操作系统的区别在于资源管理、进程通信和系统结构等方面。 分布式程序设计语言用于编写运行于分布式计算机系统上的分布式程序。 一个分布式程序由若干个可以独立执行的程序模块组成,它们分布于一个 分布式处理系统的多台计算机上被同时执行。它与集中式的程序设计语言 相比有三个特点:分布性、通信性和稳健性。分布式文件系统具有执行远程文件存取的能力,并以透明方式对分布在网络上的文件进行管理和存取。分布式数据库系统由分布于多个计算机结点上的若干个数据库系统组成,它提供有效的存取手段来操纵这

4、些结点上的子数据库。分布式数据库在使 用上可视为一个完整的数据库,而实际上它是分布在地理分散的各个结点 上。当然,分布在各个结点上的子数据库在逻辑上是相关的。主要特点多数处理就地完成;各地的计算机由数据通信网络相联系。克服了中心数据库的弱点:降低了数据传输代价;提高了系统的可靠性,局部系统发生故障,其他部分还可继续工作;各个数据库的位置是透明的,方便系统的扩充;为了协调整个系统的事务活动,事务管理的性能花费高;数据分片类型(1 )水平分片:按一定的条件把全局关系的所有元组划分成若干不相 交的子集,每个子集为关系的一个片段。(2) 垂直分片:把一个全局关系的属性集分成若干子集,并在这些子 集上作

5、投影运算,每个投影称为垂直分片。(3) 导出分片:又称为导出水平分片,即水平分片的条件不是本关系 属性的条件,而是其他关系属性的条件。(4) 混合分片:以上三种方法的混合。可以先水平分片再垂直分片, 或先垂直分片再水平分片,或其他形式,但他们的结果是不相同的。条件:(1) 完备性条件:必须把全局关系的所有数据映射到片段中,决不允 许有属于全局关系的数据却不属于它的任何一个片段。(2 )可重构条件:必须保证能够由同一个全局关系的各个片段来重建 该全局关系。对于水平分片可用并操作重构全局关系;对于垂直分片可用 联接操作重构全局关系。(3 )不相交条件:要求一个全局关系被分割后所得的各个数据片段互

6、不重叠(对垂直分片的主键除外)。数据分配方式(1) 集中式:所有数据片段都安排在同一个场地上。(2) 分割式:所有数据只有一份,它被分割成若干逻辑片段,每个逻 辑片段被指派在一个特定的场地上。(3) 全复制式:数据在每个场地重复存储。也就是每个场地上都有一 个完整的数据副本。(4) 混合式:这是一种介乎于分割式和全复制式之间的分配方式。目前分布式数据库分配的设计,越来越多的采用寻找最优解的算法, 比如遗传算法、退火机制等查询优化指在执行分布式查询时选择查询执行计划的方法和关系运算符的实现 算法。根据系统环境的不同,查询优化所使用的算法也有所不同,通常分 为远程广域网环境和高速局域网环境,其区别

7、主要在网络的带宽。对于一 元运算符可以采用集中式数据库中的查询优化方法。而对于二元运算符, 由于涉及场地间的数据传输,因此必须考虑通信代价。分布式查询中常见 的连接运算执行策略包括:(1)半连接方法:利用半连接运算的转换方法RS= (RµS ) S。 假设场地1和场地2上分别有关系R和关系S,首先在S上执行连接属性上 的投影并将结果传输至场地1,在场地1上执行关系R与投影的连接操作, 再将结果传输至场地2与关系S执行连接操作。这种方法能够降低执行连 接运算时的网络通信代价,主要适用于带宽较低的远程广域网络。(2)枚举法方法:指枚举关系运算符的物理执行计划,通过对比执行 计划的代价选择执行算法的方法。其中,连接运算符的物理执行计划包括 嵌套循环方法、哈希连接法和归并连接法。枚举法主要适用于以磁盘IO代价为主的高速局域网环境。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号