关系数据理论与数据库设计

上传人:平*** 文档编号:48599751 上传时间:2018-07-17 格式:PPT 页数:69 大小:828.52KB
返回 下载 相关 举报
关系数据理论与数据库设计_第1页
第1页 / 共69页
关系数据理论与数据库设计_第2页
第2页 / 共69页
关系数据理论与数据库设计_第3页
第3页 / 共69页
关系数据理论与数据库设计_第4页
第4页 / 共69页
关系数据理论与数据库设计_第5页
第5页 / 共69页
点击查看更多>>
资源描述

《关系数据理论与数据库设计》由会员分享,可在线阅读,更多相关《关系数据理论与数据库设计(69页珍藏版)》请在金锄头文库上搜索。

1、第2章 关系数据库库设计设计 理 论论1本章概要 前面已经讲述了关系数据库、关系模型的基本概念 以及关系数据库的标准语言。 如何使用关系模型设计关系数据库,也就是面对一 个现实问题,如何选择一个比较好的关系模式的集合 ,每个关系又应该由哪些属性组成。这属于数据库设 计的问题,确切地讲是数据库逻辑设计的问题 本章讲述关系数据库规范化理论,这是数据库逻辑 设计的理论依据。 要求了解规范化理论的研究动机及其在数据库设计中的 作用 掌握函数依赖的有关概念 第一范式、第二范式、第三范式的定义 重点掌握并能够灵活运用关系模式规范化的方法和关系 模式分解的方法,这也是本章的难点。22.1 规范化问题的提出2

2、.1.1 规范化理论的主要内容 关系数据库的规范化理论最早是由关系数据 库的创始人E.F.Codd提出的 后经许多专家学者对关系数据库理论作了深 入的研究和发展,形成了一整套有关关系数据 库设计的理论 在该理论出现以前,层次和网状数据库的设 计只是遵循其模型本身固有的原则,而无具体 的理论依据可言,因而带有盲目性,可能在以 后的运行和使用中发生许多预想不到的问题3 在关系数据库系统中,关系模型包括一组关 系模式,各个关系不是完全孤立的,数据库的 设计较层次和网状模型更为重要。 如何设计一个适合的关系数据库系统,关键 是关系数据库模式的设计,一个好的关系数据 库模式应该包括多少关系模式,而每一个

3、关系 模式又应该包括哪些属性,又如何将这些相互 关联的关系模式组建一个适合的关系模型,这 些工作决定了到整个系统运行的效率,也是系 统成败的关键所在,所以必须在关系数据库的 规范化理论的指导下逐步完成。 4 关系数据库的规范化理论主要包括三个方面的内容 : 函数依赖 范式(Normal Form) 模式设计 其中,函数依赖起着核心的作用,是模式分解和模 式设计的基础,范式是模式分解的标准。 2.1.2 关系模式的存储异常问题 数据库的逻辑设计为什么要遵循一定的规范化理论 ? 什么是好的关系模式? 某些不好的关系模式可能导致哪些问题? 下面通过例子进行分析:5例如,要求设计教学管理数据库,其关系

4、模式SCD如 下: SCD(SNO,SN,AGE,DEPT,MN,CNO,SCORE) 其中,SNO表示学生学号,SN表示学生姓名,AGE表 示学生年龄,DEPT表示学生所在的系别,MN表示系主 任姓名,CNO表示课程号,SCORE表示成绩。 根据实际情况,这些数据有如下语义规定: 1. 一个系有若干个学生,但一个学生只属于一个系; 2. 一个系只有一名系主任,但一个系主任可以同时兼几 个系的系主任; 3. 一个学生可以选修多门功课,每门课程可有若干学生 选修; 4. 每个学生学习课程有一个成绩。 在此关系模式中填入一部分具体的数据,则可得到 SCD关系模式的实例,即一个教学管理数据库,如图

5、2.1所示。6图2.1 关系SCDSNOSNAGEDEPTMNCNOSCORES1赵亦17计算机刘伟C190S1赵亦17计算机刘伟C285S2钱尔18信息王平C557S2钱尔18信息王平C680S2钱尔18信息王平C7 70S2钱尔18信息王平C570S3孙珊20信息王平C10S3孙珊20信息王平C270S3孙珊20信息王平C485S4李思男自动化刘伟C1937 根据上述的语义规定,并分析以上关系中的数据, 我们可以看出:(SNO,CNO)属性的组合能唯一标识一个 元组,所以(SNO,CNO)是该关系模式的主关系键。但在 进行数据库的操作时,会出现以下几方面的问题。 1. 数据冗余。每个系名和

6、系主任的名字存储的 次数等于该系的学生人数乘以每个学生选修的课程门 数,同时学生的姓名、年龄也都要重复存储多次,数 据的冗余度很大,浪费了存储空间 2. 插入异常。如果某个新系没有招生,尚无学 生时,则系名和系主任的信息无法插入到数据库中。 因为在这个关系模式中,(SNO,CNO)是主关 系键。根据关系的实体完整性约束,主关系键的值不 能为空,而这时没有学生,SNO和CNO均无值,因此不 能进行插入操作。 另外,当某个学生尚未选课,即CNO未知,实 体完整性约束还规定,主关系键的值不能部分为空, 同样不能进行插入操作。83. 删除异常。 某系学生全部毕业而没有招生时,删除全部学 生的记录则系名

7、、系主任也随之删除,而这个系依然 存在,在数据库中却无法找到该系的信息。 另外,如果某个学生不再选修C1课程,本应该 只删去C1,但C1是主关系键的一部分,为保证实体完 整性,必须将整个元组一起删掉,这样,有关该学生 的其它信息也随之丢失。 4. 更新异常。 如果学生改名,则该学生的所有记录都要逐一 修改SN 又如某系更换系主任,则属于该系的学生记录 都要修改MN的内容,稍有不慎,就有可能漏改某些记 录,这就会造成数据的不一致性,破坏了数据的完整 性。9 由于存在以上问题,我们说,SCD是一个不好的关系 模式。产生上述问题的原因,直观地说,是因为关系 中“包罗万象”,内容太杂了。 那么,怎样才

8、能得到一个好的关系模式呢? 我们把关系模式SCD分解为下面三个结构简单的关系 模式,如图2.2所示。 学生关系S(SNO,SN,AGE,DEPT) 选课关系SC(SNO,CNO,SCORE) 系关系D(DEPT,MN)10S SCS SCSNOSNAGEDEPT SNOCNOSCORES1赵亦17计算机 S1C190S2钱尔18信息 S1C285S3孙珊20信息 S2C557S4李思21自动化 S2C680S2C7 D DS2C570DEPTMN S3C10计算机刘伟 S3C270信息王平 S3C485自动化刘伟 S4C193图3.2 分解后的关系模式 11 在以上三个关系模式中,实现了信息的

9、某种 程度的分离, S中存储学生基本信息,与所选课程及系主任 无关 D中存储系的有关信息,与学生无关 SC中存储学生选课的信息,而与所学生及系的 有关信息无关 与SCD相比,分解为三个关系模式后,数据 的冗余度明显降低。 当新插入一个系时,只要在关系D中添加一条 记录 当某个学生尚未选课,只要在关系S中添加一 条学生记录,而与选课关系无关,这就避免了插入异 常 当一个系的学生全部毕业时,只需在S中删除 该系的全部学生记录,而关系D中有关该系的信息仍 然保留,从而不会引起删除异常 同时,由于数据冗余度的降低,数据没有重复 存储,也不会引起更新异常。12 经过上述分析,我们说分解后的关系模式是 一

10、个好的关系数据库模式。 从而得出结论,一个好的关系模式应该具备 以下四个条件: 1. 尽可能少的数据冗余。 2. 没有插入异常。 3. 没有删除异常。4. 没有更新异常。 13 但要注意,一个好的关系模式并不是在任何 情况下都是最优的 如何按照一定的规范设计关系模式,将结构 复杂的关系分解成结构简单的关系,从而把不 好的关系数据库模式转变为好的关系数据库模 式,这就是关系的规范化,规范化又可以根据 不同的要求而分成若干级别 我们要设计的关系模式中的各属性是相互依 赖、相互制约的,这样才构成了一个结构严谨 的整体。因此在设计关系模式时,必须从语义 上分析这些依赖关系142.2 函数依赖2.2.1

11、 函数依赖的定义及性质 关系模式中的各属性之间相互依赖、相互制约的联 系称为数据依赖。 数据依赖一般分为函数依赖、多值依赖和连接依赖 。 其中,函数依赖是最重要的数据依赖。 函数依赖(Functional Dependency)是关系模式中 属性之间的一种逻辑依赖关系。 例如在上一节介绍的关系模式SCD中,SNO与SN、AGE、 DEPT之间都有一种依赖关系。 由于一个SNO只对应一个学生,而一个学生只能属于一个 系,所以当SNO的值确定之后,SN,AGE,DEPT的值也随之被唯 一的确定了。 这类似于变量之间的单值函数关系。设单值函数Y=F(X) ,自变量X的值可以决定一个唯一的函数值Y。

12、在这里,我们说SNO决定函数(SN,AGE,DEPT),或者 说(SN,AGE,DEPT)函数依赖于SNO。15下面给函数依赖的形式化定义。 2.2.1.1 函数依赖的定义 定义2.1 设关系模式R(U,F),U是属性全集,F是U 上的函数依赖集,X和Y是U的子集,如果对于R(U)的任 意一个可能的关系r,对于X的每一个具体值,Y都有唯 一的具体值与之对应,则称X函数决定Y,或Y函数依赖 于X,记作XY。我们称X为决定因素,Y为依赖因素。 当Y不函数依赖于X时,记作:X Y。当XY且YX时 ,则记作: X Y。 对于关系模式SCD U=SNO,SN,AGE,DEPT,MN,CNO,SCORE

13、F=SNOSN,SNOAGE,SNODEPT 一个SNO有多个SCORE的值与其对应,因此SCORE不能 唯一地确定,即SCORE不能函数依赖于SNO,所以有: SNO SCORE。 但是SCORE可以被(SNO,CNO)唯一地确定。所以可 表示为:(SNO,CNO)SCORE。 16有关函数依赖的几点说明: 1平凡的函数依赖与非平凡的函数依赖。 当属性集Y是属性集X的子集时,则必然存在着函数依赖 XY,这种类型的函数依赖称为平凡的函数依赖。 如果Y不是X的子集,则称XY为非平凡的函数依赖。 若不特别声明,我们讨论的都是非平凡的函数依赖。 2函数依赖是语义范畴的概念。 我们只能根据语义来确定一

14、个函数依赖,而不能按照其 形式化定义来证明一个函数依赖是否成立。 例如,对于关系模式S,当学生不存在重名的情况下,可 以得到: SNAGE SNDEPT 这种函数依赖关系,必须是在没有重名的学生条件下才 成立的,否则就不存在函数依赖了。 所以函数依赖反映了一种语义完整性约束。 173函数依赖与属性之间的联系类型有关。 (1)在一个关系模式中,如果属性X与Y有1:1联系时, 则存在函数依赖XY,YX,即X Y。 例如,当学生无重名时,SNO SN。 (2)如果属性X与Y有m:1的联系时,则只存在函数依赖 XY。例如,SNO与AGE,DEPT之间均为m:1联系,所以有 SNOAGE,SNODEPT

15、。 (3)如果属性X与Y有m: n的联系时,则X与Y之间不存在 任何函数依赖关系。例如,一个学生可以选修多门课程,一门课程又可 以为多个学生选修,所以SNO与CNO之间不存在函数依赖关系。 由于函数依赖与属性之间的联系类型有关,所以在 确定属性间的函数依赖关系时,可以从分析属性间的 联系类型入手,便可确定属性间的函数依赖。 184函数依赖关系的存在与时间无关。 因为函数依赖是指关系中的所有元组应该满足 的约束条件,而不是指关系中某个或某些元组所满足 的约束条件。 当关系中的元组增加、删除或更新后都不能破 坏这种函数依赖。 因此,必须根据语义来确定属性之间的函数依 赖,而不能单凭某一时刻关系中的实际数据值来判断 。 例如,对于关系模式S,假设没有给出无重名 的学生这种语义规定,则即使当前关系中没有重名的 记录,也只能存在函数依赖SNOSN,而不能存在 函数依赖SNSNO,因为如果新增加一个重名的学 生,函数依赖SNSNO必然不成立。 所以函数依赖关系的存在与时间无关,而只与 数据之间的语义规定有关。 195函数依赖可以保证关系分解的无损连接 性。 设R(X,Y,Z),X,Y,Z为不相交的属性集 合,如果XY或XZ,则有R(X,Y,Z)=RX,Y*RX ,Z, 其中,RX,Y表示关系R在属性

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号