2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx

上传人:博****1 文档编号:563774687 上传时间:2023-12-03 格式:DOCX 页数:13 大小:18.47KB
返回 下载 相关 举报
2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx_第1页
第1页 / 共13页
2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx_第2页
第2页 / 共13页
2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx_第3页
第3页 / 共13页
2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx_第4页
第4页 / 共13页
2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx》由会员分享,可在线阅读,更多相关《2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计.docx(13页珍藏版)》请在金锄头文库上搜索。

1、 2022年计算机等级考试四级数据库技术复习笔记:存储技术与数据库物理设计第六章 存储技术与数据库物理设计 6.1 文件组织 6.1.1 数据库的物理构造 1、 数据库中的应用数据是以文件形式存储在外存上的,文件在规律上被组织成记录的序列,即每个DB文件可看作是规律记录的集合; 2、 一个文件在磁盘上占有肯定的物理存储空间,文件中的每个规律记录被映射存储到某个特定的磁盘块上,一个文件在物理上可以看作是由存放文件记录的一系列磁盘块组成,称为物理文件; 3、 文件的规律记录与磁盘间的映射关系是由操作系统或DBMS来治理的,当需要对一个文件的规律记录进展操作时,先要依据这种映射关系找到该规律记录所在

2、的磁盘块,然后再进展操作。 4、 从数据库物理构造角度需要解决如下问题: (1) 文件的组织; (2) 文件的构造; (3) 文件的存取; (4) 索引技术; 6.1.2 文件组织 1、 数据库与文件的对应关系 (1) 在外存中,数据库以文件形式组织,文件由规律记录组成,记录由多个域组成; (2) 一个关系数据库包括一张或多张关系表,关系表与文件的对应关系有如下方式: (A) 每张关系表单独用一个文件来存储,由DBMS通过OS的文件治理功能来治理; (B) 现代中大型DBMS是由OS直接安排一块大的磁盘空间,DBMS将该磁盘空间作为数据库磁盘文件直接收理,DB的全部关系表都存储在该文件中; (

3、1) 关系表在规律上由一系列元组组成,元组由多个属性组成,每个元组可以用磁盘文件中的一个规律记录来存储,记录包括多个域,对应元组的多个属性; 2、文件记录格式: (1) 数据库文件通常采纳两种规律记录格式:定长记录格式和变长记录格式; 6.2 文件构造与存取 6.2.1 堆文件 1、 堆文件也称无序文件,记录随机在存储在文件物理空间是,新插入的记录存储在文件的末尾; 2、 堆文件经常用作存储那些将来使用,但目前不清晰如何使用的记录,为了实现文件记录的有效存取,堆文件常常与附加的存取路径一起使用; 3、 查找操行平均需要搜寻(B+1)/2个磁盘块,效率比拟低; 4、 插入操作非常简洁,先读文件头

4、,找到最末磁盘地址,将最末磁盘块读入内存,将需插入的新记录写入磁盘块的末端,最终将修改正的磁盘块写回磁盘; 5、 删除比拟简单,可以先找到被删除记录所在的磁盘块,读入内存后在内存缓冲区删除记录,最终再写回磁盘;也可以在每个记录的磁盘空间增加一个删除标志位,当需要删除记录时,将标示位置1; 6.2.2 挨次文件 1、 挨次文件根据文件记录在查询码上的取值的大小挨次排列各个记录; 2、 挨次文件的每个记录中有一个指针字段,依据查询码大小用指针将各个记录按序连接起来; 3、 文件建立时,应尽量使记录的物理挨次与查找码的挨次全都,以削减访问磁盘块的次数; 4、 依据查询条件对挨次文件进展查询时,如查询

5、条件定义在查找码上,则使用二分法查找技术快速找到记录,如条件不在查找码上,则必需从头到尾依次扫描磁盘块,与堆文件全都,所以挨次文件的访问效率也不高; 5、 挨次文件插入工作包括定位和插入: (1) 定位:在指针链中找到插入的位置,即插入记录在哪个记录的前面; (2) 插入:如有自由空间,则在该位置插入新记录,如没有自由空间,则只能插入溢出块中,重新调整记录指针链关系,保证记录挨次; 6.2.3 聚拢文件 1、 聚拢文件是一种具有多种记录类型文件,存储了来自多个关系表的数据,每个关系表对应文件中的一种记录类型; 2、 当数据库中数据量效大时,对数据库查询需要屡次访问磁盘文件,严峻影响性能指标,为

6、了降低多表操作时的磁盘访问次数,提高多表查询速度,可采纳聚拢文件; 3、 聚拢文件将不同关系表中有关联关系的记录存储在同一磁盘块内,从而削减多表查询时磁盘块的访问次数,提高处理速度; 6.2.4 索引文件 是一种利用索引技术技术快速文件访问的文件组织和存取方法; 6.2.4 散列文件 是一种利用散列函数支持快速文件访问的文件组织和存取方法; 6.3 索引技术 6.3.1 根本概念 1、 索引技术:是一种快速文件访问技术,它将一个文件的每个记录在某个或某些域(属性)上的取值与该记录的物理地址直接联系起来,供应了一种依据记录域的取值快速访问文件记录的机制;它的关键是建立取值域到记录的物理地址刘的映

7、射关系,这种映射关系叫索引; 2、 索引技术分类: (1) 有序索引技术:利用索引文件实现记录域(查找码)取值到记录物理地址间的映射关系,索引文件由索引记录组成,每个记录中记载一个索引项,索引项记录了某个特定的查找码值和具有该值的数据文件记录的物理地址; (2) 散列技术:利用一个散列函数实现记录域取值到记录物理地址间的直接映射关系; (3) 有序索引:有序索引作为基于索引文件的索引技术,需要考虑两个问题:(1)如何组织索引文件中的索引记录;(2)如何从索引文件动身,访问数据文件中的数据记录; (A) 当需要采纳有序索引机制快速访问数据文件时,首先要为该数据文件建立一个索引文件,它是索引记录和

8、索引项的集合; (B) 索引文件建立的方法:首先选定某些记录域作为查找码,然后建立数据记录在查找码上的取值与物理地址间的映射关系,组成索引项。全部索引项作为索引记录存储在索引文件中,索引文件依据某个特定的查找码值的挨次组织为挨次文件; (C) 一个数据文件可以有多个查找码和索引文件; 6.3.2 有序索引的分类及特点 1、 聚拢索引与非聚拢索引 (1) 对数据文件和它的一个特定的索引文件,假如数据文件中数据记录的排列挨次与索引文件中索引项的排列挨次相全都,则该索引文件称为聚拢索引,否则称为非聚拢索引; (2) 在一个数据文件上除了建立一个聚拢索引外,还可建立多个非聚拢索引; 2、 稠密索引和稀

9、疏索引 假如数据文件中的每个查找码都在索引文件中都对应一个索引记录,称为稠密索引,假如只一局部对应,则称为稀疏索引; 3、 主索引和辅索引 在数据文件包含主码的属性集上建立索引称为主索引,在非主码属性上建立的索引称为辅索引; 4、单层索引和多层索引 (1) 单层索引(线性索引):索引项依据键值在索引文件中挨次排列,组织成一维线性构造,每个索引项直接指向数据文件中的数据记录; (2) 当数据文件很大时,即使采纳稀疏索引,建成的索引文件也很大,导致效率低下,为解决该问题,可对索引文件中的索引项本身再建立一级稀疏索引,组成2层索引构造;进一步地,可建立多层树型索引构造来快速定位; 6.4 散列技术

10、6.4.1 散列文件 1、 散列是一种快速查找技术,它利用定义在文件记录上的查找码,通过计算一个散列函数,以散列函数值作为记录的物理地址,实现对文件记录直接快速访问。 2、 首先指定文件记录的一个域作为查找码(散列域),然后定义一个查找码上的函数(散列函数),函数的输入为查找码值,输出为物理地址; 3、 一般使用桶作为根本的存储单位,一个桶可存放多个文件记录,物理地址可以是记录所在的桶号,散列函数的输出可以是桶号; 6.4.2 散列函数 1、 散列方法依靠于好的散列函数,它应当尽可能匀称地将查找码分布到各个桶中,详细要满意如下两个条件: (1) 地址的分布是匀称的; (2) 地址的分布是随机的

11、; 6.4.3 桶溢出 1、 产生桶溢出的两个缘由: (1) 文件初始设计时,为文件记录预留的存储空间缺乏; (2) 散列函数的匀称分布性不好; 2、 设计散列函数时,应依据文件大小打算物理空间,一般应有20%余量,再设计适宜的桶数目和桶大小,尽可能留有一些空闲桶,降低桶溢出的可能性; 3、 桶溢出的现象是难免的,需要DBS采纳相应的桶溢出处理机制; 4、 散列方法的缺点:为了避开桶溢出。必需选一适宜的散列函数,但这比拟简单,而且不象索引文件那样可以据数据记录变化动态调整。 6.5 数据字典 1、 数据字典(系统名目)中存储了数据库对象的各类描述信息和DBMS所需的掌握信息,全称数据库元数据;

12、 2、 数据库对象的各类描述信息:包括外模式、模式、内模式以及它们之间的映射的描述; 3、 DBMS所需的掌握信息:包括查询优化、安全性检查、用户权限验证等; 4、 数据字典主要包括: (1) 关系模式信息; (2) 与视图描述有关的信息; (3) 关系的存储构造和存取方法信息; (4) 完整性约束信息; (5) 安全性有关信息; (6) 数据库运行统计信息; 6.6 数据库物理设计 6.6.1 设计步骤和内容 1、 数据库物理构造设计:在详细的硬件环境、OS、DBMS约束下,依据数据库规律设计结果,设计适宜的数据库物理构造。目标是存储空间占用少、访问效率高和维护代价低; 2、 一旦选定了硬件

13、平台、OS和DBMS,数据库的数据存储和存取方式等可用的物理模式也就随之确定了; 3、 数据库物理设计主要包括以下步骤: (1) 数据库规律模式调整:将数据库规律模式及其视图转换为DBMS支持的根本表和视图,并利用DBMS供应的完整性机制设计业务规章; (2) 文件组织与存取设计:配置根本表的文件组织形式,据实际状况为根本表设计适宜的存取方法和路径; (3) 数据分布设计: (4) 安全模式设计: (5) 确定系统配置: (6) 物理模式评估: 6.6.2 数据库规律模式调整 1、 物理数据库设计首先需要依据数据库规律构造信息,设计目标DBMS平台支持的根本表的模式信息,这些模式信息代表了所要

14、开发的详细目标数据库的构造,这个过程称为数据库规律模式调整,主要包括如下设计内容: (1) 实现目标数据库根本表和视图:采纳目标DBMS所支持的建表方法,设计根本表及其面对模型的完整性约束; (2) 设计根本表业务规章; 6.6.3 DB文件组织与存取设计 1、分析事务的数据访问特性 (1) 使用事务-根本表穿插引用矩阵,分析系统内数据库事务对各个根本表的访问状况,确定事务访问了哪些根本表,对这些根本表执行了何种操作,并进一步分析各操作涉及到的根本表属性; (2) 估量各事务的执行频率; (3) 对每张根本表,汇总全部作用于该表上的各事务的操作频率信息; 2、 了解并选择数据库文件构造 (1) 假如数据库中的一个根本表中的数据量很少,并且操作特别频繁,该根本表可采纳堆文件组织方式; (2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号