数据库系统原理教程(第四章)清华大学

上传人:宝路 文档编号:47104970 上传时间:2018-06-29 格式:PPT 页数:138 大小:722.43KB
返回 下载 相关 举报
数据库系统原理教程(第四章)清华大学_第1页
第1页 / 共138页
数据库系统原理教程(第四章)清华大学_第2页
第2页 / 共138页
数据库系统原理教程(第四章)清华大学_第3页
第3页 / 共138页
数据库系统原理教程(第四章)清华大学_第4页
第4页 / 共138页
数据库系统原理教程(第四章)清华大学_第5页
第5页 / 共138页
点击查看更多>>
资源描述

《数据库系统原理教程(第四章)清华大学》由会员分享,可在线阅读,更多相关《数据库系统原理教程(第四章)清华大学(138页珍藏版)》请在金锄头文库上搜索。

1、第4章 关系数据库设计理论l问题的提出 关系数据库的基本概念 关系模型 关系数据库的标准语言 关系数据库逻辑设计 针对一个具体问题,应如 何构造一个适合于它的数据模式,即 应该构造几个关系,每个关系由哪些 属性组成等。 数据库逻辑设计的工具 关系数据库的规范化理论第4章 关系数据库设计理论4.1 数据依赖4.2 范式4.3 关系模式的规范化第4章 关系数据库设计理论4.1 数据依赖4.2 范式4.3 关系模式的规范化4.1 数据依赖内容提要l什么是数据依赖l数据依赖对关系模式有什么影响l数据依赖的形式化定义4.1 数据依赖4.1.1 关系模式中的数据依赖4.1.2 数据依赖对关系模式的影响4.

2、1.3 有关概念4.1 数据依赖4.1.1 关系模式中的数据依赖4.1.2 数据依赖对关系模式的影响4.1.3 有关概念4.1.1 关系模式中的数据依赖一、概念回顾二、关系模式的形式化定义三、什么是数据依赖四、关系模式的简化表示一、概念回顾l关系:描述实体及其属性、实体间的联系 。 从形式上看,它是一张二维表,是所涉 及属性的笛卡尔积的一个子集。l关系模式:用来定义关系。l关系数据库:基于关系模型的数据库,利 用关系来描述现实世界。 从形式上看,它由一组关系组成。l关系数据库的模式:定义这组关系的关系 模式的全体。二、关系模式的形式化定义关系模式由五部分组成,即它是一个五元组 :R(U, D,

3、 DOM, F)R: 关系名 U: 组成该关系的属性名集合 D: 属性组U中属性所来自的域 DOM:属性向域的映象集合 F: 属性间数据的依赖关系集合。 即限定了组成关系的各个元组必须满足 的完整性约束条件。三、什么是数据依赖1. 完整性约束的表现形式l限定属性取值范围:例如学生成绩必 须在0-100之间l定义属性值间的相互关连(主要体现 于值的相等与否),这就是数据依赖 ,它是数据库模式设计的关键。什么是数据依赖(续)2. 数据依赖l是通过一个关系中属性间值的相等与 否体现出来的数据间的相互关系l是现实世界属性间相互联系的抽象l是数据内在的性质l是语义的体现什么是数据依赖(续)3. 数据依赖

4、的主要类型l函数依赖(Functional Dependency, 简记为FD)l多值依赖(Multivalued Dependency ,简记为MVD)l连接依赖四、关系模式的简化表示在关系模式R(U, D, DOM, F)中,影 响数据库模式设计的主要是U和F,D 和DOM对其影响不大,为了方便讨论,我们将关系模式简化为一个三元 组:R(U, F)当且仅当U上的一个关系r满足F时, r称为关系模式R(U, F)的一个关系。5.1 数据依赖5.1.1 关系模式中的数据依赖5.1.2 数据依赖对关系模式的影响5.1.3 有关概念5.1.2 数据依赖对关系模式的影响例:建立一个描述学校的数据库。

5、涉及的对象包括: 学生的学号(Sno) 所在系(Sdept) 系主任姓名(Mname) 课程名(Cname) 成绩(Grade)数据依赖对关系模式的影响(续 )假设学校的数据库模式由一个单一的关系模式Student构成, 则该关系模式的属性集合为:U Sno, Sdept, Mname, Cname, Grade 数据依赖对关系模式的影响(续 )现实世界的已知事实告诉我们: 一个系有若干学生, 但一个学生只属 于一个系; 一个系只有一名主任; 一个学生可以选修多门课程, 每门课 程有若干学生选修; 每个学生所学的每门课程都有一个成 绩。数据依赖对关系模式的影响(续 )由此可得到属性组U上的一组

6、函数依赖F:F Sno Sdept, Sdept Mname, (Sno, Cname) Grade SnoCnameSdeptMnameGrade数据依赖对关系模式的影响(续 )关系模式Student中存在的问题: 数据冗余太大浪费大量的存储空间例:每一个系主任的姓名重复出现,重复 次数与该系所有学生的所有课程成绩出现 次数相同。数据依赖对关系模式的影响(续 ) 更新异常(Update Anomalies) 数据冗余 ,更新数据时,维护数据完整 性代价大。例:某系更换系主任后,系统必须修改与 该系学生有关的每一个元组。数据依赖对关系模式的影响(续 ) 插入异常(Insertion Anoma

7、lies) 该插的数据插不进去例,如果一个系刚成立,尚无学生,我们 就无法把这个系及其系主任的信息存入数 据库。数据依赖对关系模式的影响(续 ) 删除异常(Deletion Anomalies)不该删除的数据不得不删例,如果某个系的学生全部毕业了, 我们 在删除该系学生信息的同时,把这个系及 其系主任的信息也丢掉了。数据依赖对关系模式的影响(续 )结论:Student关系模式不是一个好的模式。 一个“好”的模式应当不会发生插入异常 、删除异常、更新异常,数据冗余应尽可能 少。原因:由存在于模式中的某些数据依赖引起 的。解决方法:通过分解关系模式来消除其中不 合适的数据依赖。数据依赖对关系模式的

8、影响(续 )规范化理论正是用来改造关系模式,通过分解关系模式来消除其中不合适的数据依赖,以解决插入异常、删除异常、更新异常和数据冗余问题。5.1 数据依赖5.1.1 关系模式中的数据依赖5.1.2 数据依赖对关系模式的影响5.1.3 有关概念5.1.3 有关概念一、函数依赖二、平凡函数依赖与非平凡函数依赖三、完全函数依赖与部分函数依赖四、传递函数依赖五、码一、函数依赖定义5.1 设R(U)是一个属性集U上的关 系模式,X和Y是U的子集。若对于 R(U)的任意一个可能的关系r,r中不 可能存在两个元组在X上的属性值相 等, 而在Y上的属性值不等, 则称 “X函数确定Y”或“Y函数依赖于X”, 记

9、作XY。 X称为这个函数依赖的 决定属性集(Determinant)。函数依赖(续)说明: 1. 函数依赖不是指关系模式R的某个或某些 关系实例满足的约束条件,而是指R的所 有关系实例均要满足的约束条件。2. 函数依赖是语义范畴的概念。只能根据数 据的语义来确定函数依赖。例如“姓名年龄”这个函数依赖只有在不 允许有同名人的条件下成立函数依赖(续)3. 数据库设计者可以对现实世界作强制的规 定。例如设计者可以强行规定不允许同名 人出现,因而使函数依赖“姓名年龄”成 立。但所插入的元组必须满足规定的函数 依赖,若发现有同名人存在, 则拒绝装入 该元组。 4. 若XY,并且YX, 则记为XY。5.

10、若Y不函数依赖于X, 则记为XY。函数依赖(续)例: Student(Sno, Sname, Ssex, Sage, Sdept)假设不允许重名,则有: Sno Ssex, Sno Sage Sno Sdept, Sno Sname Sname Ssex, Sname Sage Sname Sdept但Ssex Sage, Ssex Sdept, 二、平凡函数依赖与非平凡函数依赖定义5.2 在关系模式R(U)中,对于U的 子集X和Y,如果XY,但Y X, 则称XY是非平凡的函数依赖。若 XY,但Y X则称XY是平凡的 函数依赖。例:在关系SC(Sno, Cno, Grade)中,非平凡函数依赖

11、: (Sno, Cno) Grade平凡函数依赖: (Sno, Cno) Sno (Sno, Cno) Cno平凡函数依赖与非平凡函数依赖(续 )对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不特别声明, 我们总是讨论非平凡函数依赖。三、完全函数依赖与部分函数依赖定义5.3 在关系模式R(U)中,如果 XY,并且对于X的任何一个真子集 X,都有X Y, 则称Y完全函数依赖于X,记 作X Y。若XY,但Y不完全函数 依赖于X,则称Y部分函数依赖于X,记作X P Y。完全函数依赖与部分函数依赖(续)例: 在关系SC(Sno, Cno, Grade)中,有:由于:Sno Gr

12、ade,Cno Grade, 因此:(Sno, Cno) Grade但: (Sno, Cno) P Sno, (Sno, Cno) P Cno完全函数依赖与部分函数依赖(续)非平凡函数依赖必定是部分函数依赖平凡函数依赖也可能是部分函数依赖例: Student(Sno, Sname, Ssex, Sage, Sdept)Sno Sname, Sno Ssex, Sno Sage, Sno Sdept(Sno, Sname) P Sdept, (Sno, Ssex) P Sdept四、传递函数依赖定义5.4 在关系模式R(U)中,如果XY, YZ,且Y X,YX,则称Z传递函数 依赖于X。注: 如

13、果YX, 即XY,则Z直接依赖于 X。例: 在关系Std(Sno, Sdept, Mname)中,有: Sno Sdept,Sdept Mname,Mname 传递函数依赖于Sno。五、码定义5.5 设K为关系模式R中的属性或 属性组合。若KU,则K称为R的一个侯选 码(Candidate Key)。若关系模式R有多 个候选码,则选定其中的一个做为主码( Primary key)。l码是关系模式中一个重要概念。 候选码能够唯一地标别关系的元组,是 关系模式中一组最重要的属性。 主码又和外部码一起提供了一个表示关 系间联系的手段。第4章 关系数据库设计理论4.1 数据依赖4.2 范式4.3 关系

14、模式的规范化4.2 范式4.2.1 第一范式(1NF) 4.2.2 第二范式(2NF) 4.2.3 第三范式(3NF) 4.2.4 BC范式(BCNF) 4.2.5 多值依赖与第四范式(4NF)4.2 范式l范式是符合某一种级别的关系模式的集合 。 l关系数据库中的关系必须满足一定的要求 。满足不同程度要求的为不同范式。 l范式的种类:第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF)范式(续)l各种范式之间存在联系:l某一关系模式R为第n范式,可简 记为RnNF。4.2 范式4.2.1 第一范式(1NF) 4.2.2 第二

15、范式(2NF) 4.2.3 第三范式(3NF) 4.2.4 BC范式(BCNF) 4.2.5 多值依赖与第四范式(4NF)4.2.1 第一范式(1NF)l1NF的定义 定义5.6 如果一个关系模式R的所有属性都 是不可分的基本数据项,则R1NF。l第一范式是对关系模式的最起码的要求。 不满足第一范式的数据库模式不能称为关 系数据库。l但是满足第一范式的关系模式并不一定是 一个好的关系模式。第一范式(续)例: 关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade)Sloc为学生住处,假设每个系的学生住在 同一个地方。l函数依赖包括:(Sno, Cno) f GradeSno Sdept(Sno, Cno) P SdeptSno Sloc(Sno, Cno) P SlocSdept Sloc第一范式(续)lSLC的码为(Sno, Cno)SnoCnoGradeSdeptSlocSLC第一范式(续)l结论: 1. SLC满足第一范式。 2. 非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno)。lSLC存在的问题(1) 插入异常 假设Sno95102,SdeptIS,SlocN的 学生还未选课,因课程号是主属性,因此该学生的 信息无法插入SLC。第一范式(续)(2) 删除异常假定某个学生本来只选修了3号课程这

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号