哈工大数据库课件-数据库系统体系结构

上传人:宝路 文档编号:48362992 上传时间:2018-07-14 格式:PPT 页数:88 大小:937.26KB
返回 下载 相关 举报
哈工大数据库课件-数据库系统体系结构_第1页
第1页 / 共88页
哈工大数据库课件-数据库系统体系结构_第2页
第2页 / 共88页
哈工大数据库课件-数据库系统体系结构_第3页
第3页 / 共88页
哈工大数据库课件-数据库系统体系结构_第4页
第4页 / 共88页
哈工大数据库课件-数据库系统体系结构_第5页
第5页 / 共88页
点击查看更多>>
资源描述

《哈工大数据库课件-数据库系统体系结构》由会员分享,可在线阅读,更多相关《哈工大数据库课件-数据库系统体系结构(88页珍藏版)》请在金锄头文库上搜索。

1、n教学目的n n本章在一个更高的层次上认识数据库系统,首先简要介绍一下数据本章在一个更高的层次上认识数据库系统,首先简要介绍一下数据 库的存储结构,然后从传统的集中式系统开始,依次讨论客户库的存储结构,然后从传统的集中式系统开始,依次讨论客户- -服务服务 器系统、并行数据库系统和分布式数据库系统,使学生了解如何根器系统、并行数据库系统和分布式数据库系统,使学生了解如何根 据不同的计算环境搭建与之相适应的数据库系统。据不同的计算环境搭建与之相适应的数据库系统。n主要内容n n数据存储,数据库系统体系结构概述,集中式数据库系统,数据存储,数据库系统体系结构概述,集中式数据库系统, 数据库系统,并

2、行数据库系统,分布式数据库系统数据库系统,并行数据库系统,分布式数据库系统n教学方法n n课堂讲授为主课堂讲授为主n重点n n集中式数据库系统、集中式数据库系统、数据库系统、并行数据库系统、分布式数据库系统、并行数据库系统、分布式 数据库系统的概念及特点,分布式查询处理数据库系统的概念及特点,分布式查询处理n难点n n分布式查询处理分布式查询处理第七章 数据库系统体系结构第七章 数据库系统体系结构内容出处:1.Abraham Silberschatz数据库系统概念第十一 章1-3节,第十八章,第十九章2,7节物理存储介质n特性n数据存取速度n每单位数据的成本n可靠性n电源故障或系统崩溃时的数据

3、丢失n介质故障n介质分类n易失介质(volatile storage)n电源关时数据丢失n非易失介质(non-volatile storage)n电源关时数据持久保留,包括二级和三级存储物理存储介质n高速缓冲存储器(Cache)n最快最昂贵的存储介质,一般由操作系统来管理n主存储器(Main memory)n用于存放可被处理的数据的存储介质n快速访问,但一般不能存放整个数据库n如果发生电源故障或系统崩溃,主存储器中的数 据会丢失n快闪存储器(Flash memory)nEEPROM:电可擦可编程只读存储器n电源故障时数据会保存n读速度:0.1s; 写速度:10s物理存储介质n磁盘存储器(Mag

4、netic-disk storage)n用于长期联机数据存储n一般存放整个数据库n数据必须从磁盘移入主存才能访问n直接存取(direct-access)n按任意顺序存取数据n如果发生电源故障或系统崩溃,数据不会丢失n光盘存储(Optical storage)nCD-ROM:只读,提供预先记录的数据nWORM:一次写,多次读,用于数据归档物理存储介质n磁带存储(Tape storage)n用于数据的备份和归档n顺序访问(sequential-access)n速度慢n容量大n价格低存储层次基本存储辅助存储三级存储易失性存储非易失性存储存储层次n基本存储(primary storage)n快速但易失

5、ncache, main memoryn辅助存储(secondary storage)n非易失,相对快速 n联机存储(on-line storage)nflash memory, magnetic disksn三级存储(tertiary storage)n非易失,速度慢相对快速n脱机存储(off-line storage)nmagnetic tape, optical storage磁盘结构磁盘性能估计n访问时间n从发出请求到数据开始传输之间的时间n寻道时间(Seek time)n磁盘臂定位时间,即磁盘臂移动到正确的磁道所需时间n与移动距离成正比,平均寻道时间是最坏时间的1/3n旋转等待时间(

6、Rotational latency )n寻道结束后,等待被存取的扇区出现在读写头下面的时间n平均旋转等待时间是磁盘旋转一周时间的1/2n数据传输率n从磁盘获得数据或向磁盘存储数据的速率n平均故障时间(MTTF)n预期系统无故障连续运行的时间n是指基于全新磁盘发生故障的可能性RAIDn廉价磁盘冗余阵列(RAID)nRedundant Arrays of Inexpensive Disksn是一种利用大量廉价磁盘进行磁盘组织的技术n价格上,大量廉价的磁盘比少量昂贵的大磁盘合 算得多n性能上,使用大量磁盘可以提高数据的并行存取n可靠性上,冗余数据可以存放在多个磁盘上,因 此一个磁盘的故障不会导致数

7、据丢失n过去RAID是大而昂贵的磁盘的替代方法;今天, 使用RAID是因为它的高可靠性和高数据传输率; 因此 “I” 代表independent,而非inexpensiveRAIDn通过冗余提高可靠性nN个磁盘组成的集合中某个磁盘发生故障的概率比特定的 单个磁盘发生故障的概率高很多 n假定单个磁盘的MTTF是100,000小时 (约为11年),则由 100个磁盘组成的阵列的MTTF是1000小时(约为41天)n冗余(Redundancy)n存储额外的信息,以便当磁盘故障时能从中重建n镜像(Mirroring or shadowing)n一个逻辑磁盘由两个物理磁盘组成,写操作在每个磁盘上执行n如

8、果其中一个发生故障,数据可以从另一个磁盘读出n只有第一个磁盘的故障尚未恢复,第二个磁盘也发生故障,这时才 会发生数据丢失n假定一个磁盘的MTTF是100,000小时,修复时间是10小时,则镜 像磁盘系统的MTTF是100,0002/(2*10)=500*106小时,约为 57000年RAIDn通过并行提高性能n负载平衡多个小的存取操作(即页面存取),以提高这种 存取操作的吞吐量n并行执行大的存取操作,以减少大的存取操作的响应时间n通过在多个磁盘上对数据进行拆分来提高传输率n比特级拆分(Bit-level striping)n将每个字节按比特分开,存储到多个磁盘上n例如,对于一个由8个磁盘组成的

9、阵列,将每个字节的第i个比特位 写到第i个磁盘上;它的存取速度是单个磁盘的8倍n对于由4个磁盘组成的阵列,将每个字节的第i个比特位和第i+4个 比特位写到第i个磁盘上n块级拆分(Block-level striping)n对于由n个磁盘构成的阵列,文件的第i块 存放在第(i mod n) + 1个 磁盘上RAIDnRAID级别n镜像提供高可靠性,拆分提供高数据传输率,通 过利用与奇偶校验相结合的磁盘拆分思想,可以 实现以较低成本提供冗余的方案n不同的RAID级别,具有不同的代价、性能和可靠 性CP代表数据的第 二个拷贝表示纠错位RAIDnRAID 0n块级拆分且没有任何冗余(如镜像或奇偶校验位

10、 )的磁盘阵列n用于高性能访问并且数据丢失不十分重要的应用 场合RAID 0:无冗余拆分RAIDnRAID 1n带块级拆分的磁盘镜像n完全容错,成本高n一般用于类似于数据库系统中日志文件存储的应 用场合RAID 1:镜像的磁盘CCCCRAIDnRAID 2n按比特级拆分,具有内存风格的纠错码n纠错码(ECC:Error-Correcting-Codes)n内存中每个字节都有一个奇偶校验位与之相连,它记录 这个字节中为1的比特位的总数是偶数(=0)还是奇数 (=1),如果字节中有一位被破坏,则字节的ECC与存 储的ECC就不会相匹配;通过ECC可以检测到所有的1位 错误;通过更多的附加位,当数据

11、遭到破坏时,还可以 重建数据RAID 2:内存风格纠错码PPPRAIDnRAID 3n磁盘控制器能够检测一个扇区是否被正确的读出n如果一个扇区被破坏,我们先能准确地知道是哪个扇区坏 了,然后对扇区的每一位,通过计算其他磁盘上对应扇区 的对应位的奇偶值来推断该位是1还是0。如果其余位的奇 偶值等于存储的奇偶值,则丢失的位是0,反之为1nRAID 3效果与RAID 2一样,但只有一个磁盘的额外开销n使用N道数据拆分的RAID 3对一个字节的读写散布在多个 磁盘中,因此读写一个块的传输率是使用N道数据拆分的 RAID 1的N倍n每个磁盘参与每个I/O请求,每秒RAID 3支持的I/O数较少RAID

12、3:位交叉奇偶校验PRAIDnRAID 4n块级拆分,在一个独立的磁盘上为其他N个磁盘上 对应的块保留一个奇偶校验块n读取一个块只访问一个磁盘n每个存取操作的传输率低,但可以并行地执行多 个读操作,从而产生较高的总的I/O率n读取大量数据的操作有很高的传输率,因为所有 磁盘可以并行地读RAID 4:块交叉奇偶校验PRAIDnRAID 5n将数据和奇偶校验位都分布到所有的N+1个磁盘上;对每 个块,一个磁盘存储奇偶校验位,其余磁盘存储数据n例如由5个磁盘组成的阵列,第n块的奇偶校验位存储在第 (n mod 5)+1上,其余4个磁盘的第n块存储了对应这个块 的实际数据n奇偶校验块不能和这个块对应的

13、数据存储在同一个磁盘上n所有磁盘都参与对读请求的服务,而RAID 4中奇偶校验磁 盘不参与读操作nRAID 5包容了RAID 4,同时在相同成本下,提供了更好的 读写性能RAID 5:块交叉的分布奇偶校验PPPPPRAIDnRAID 6n类似于RAID 5,存储了额外的冗余信息n不采用奇偶校验位的方法,使用类似Reed-Solomon码的编 码n对每4位数据存储2位冗余信息n可以容忍两个磁盘发生故障RAID 6:P+Q冗余PPPPPP高性能 可靠性差完全容错 成本高高数据传输率 大数据量高的总I/O率 适合随机读 大数据量高可靠性用于数据安全性不是 很重要的高性能应用相对于RAID5, RAI

14、D3很少使用适于日志文 件的存储相对于RAID1,具有 较低的存储开销,但 写操作开销高,因此 适于经常进行读而很 少写的应用适于数据安全十 分重要的应用数据库系统体系结构数据库系统体系结构n数据库系统体系结构概述n集中式数据库系统n数据库系统n并行数据库系统n分布式数据库系统数据库系统体系结构概述n数据库系统的体系结构与计算机系统的体系结 构密切相关n集中式体系结构 集中式数据库系统n计算机的联网 客户/服务器数据库系统n并行处理能力 并行数据库系统n分布计算能力 分布式数据库系统集中式体系结构集中式系统n集中式系统n运行在一台机器上,数据集中存储在一台计算机 中,并且不与其他计算机系统交互

15、的数据库系统n单用户系统n个人使用的桌面系统n单CPU,1至2个硬盘,OS可以只支持单用户n数据库系统不支持并发控制 ,故障恢复能力没有 或非常有限,用户接口类似QBEn多用户系统n服务大量用户,用户通过终端与之相连n多个磁盘,多个主存储器,多个CPU,多用户OSn具有并发控制、故障恢复等能力客户-服务器系统nPC的速度更快,能力更强,价格更低n连接到集中式系统的终端被PC代替;n以前由集中式系统执行的诸如用户界面功能由PC来处理;n集中式系统变成服务器系统的作用,来响应客户系统产生 的请求客户-服务器系统n集中式或分布式- 单服务器与多服务器系统n单服务器系统: 多个客户共享一个服务器n多服

16、务器系统: 一个客户可以对多个服务器进行访 问。客户-服务器系统n数据库功能的划分n后端(Back-end)n存取结构、查询计算和优化、并发控制、故障恢复n前端(Front-end)n表格生成工具、报表书写工具、图形用户界面工具n前端和后端的接口通过SQL或应用程序接口客户-服务器系统n客户/服务器优点n有利于充分利用网络中的计算资源n减少网络上的传输量n高性能/价格比n可扩展性n友好的用户接口n易维护客户-服务器系统n服务器系统的分类n事务服务器n又称查询服务器或SQL服务器n广泛用于关系数据库系统n客户向服务器发送请求,事务在服务器端执行 ,结果返回给客户端n可以以SQL表达请求,也可以通过应用程序接 口,使用远程过程调用(RPC)机制来表达请求nOpen Database Connectivity (ODBC)n使用ODBC接口的任何客户程序都可以与提供ODBC 接口的任何服务器连接客户-服务器系统n数据服务器n用于局域网中n客户与服务器之间具有高速连接n客户机与服务器的处理能力相当,并且其执行 的任务主要

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号