关系数据库设计理论

上传人:平*** 文档编号:47496365 上传时间:2018-07-02 格式:PPT 页数:59 大小:132.02KB
返回 下载 相关 举报
关系数据库设计理论_第1页
第1页 / 共59页
关系数据库设计理论_第2页
第2页 / 共59页
关系数据库设计理论_第3页
第3页 / 共59页
关系数据库设计理论_第4页
第4页 / 共59页
关系数据库设计理论_第5页
第5页 / 共59页
点击查看更多>>
资源描述

《关系数据库设计理论》由会员分享,可在线阅读,更多相关《关系数据库设计理论(59页珍藏版)》请在金锄头文库上搜索。

1、第十一章 关系数据库设计理论n问题的提出n规范化问题的提出关系数据库逻辑设计n针对具体问题,如何构造一个适合于它的数据模式n数据库逻辑设计的工具关系数据库的规范化理论问题的提出一、概念回顾二、关系模式的形式化定义三、什么是数据依赖四、关系模式的简化定义五、数据依赖对关系模式影响一、概念回顾n关系:描述实体、属性、实体间的联系。n从形式上看,它是一张二维表,是所涉及属性的笛卡尔积的一个子集。n关系模式:用来定义关系。n关系数据库:基于关系模型的数据库,利用关系来描述现实世界。n从形式上看,它由一组关系组成。n关系数据库的模式:定义这组关系的关系模式的全体。二、关系模式的形式化定义关系模式由五部分

2、组成,即它是一个五元组:R(U, D, DOM, F)R: 关系名U: 组成该关系的属性名集合D: 属性组U中属性所来自的域DOM: 属性向域的映象集合F: 属性间数据依赖的集合三、什么是数据依赖1. 完整性约束的表现形式n限定属性取值范围:例如学生成绩必 须在0-100之间n定义属性值间的相互关连(主要体现 于值的相等与否),这就是数据依赖 ,它是数据库模式设计的关键什么是数据依赖(续)2. 数据依赖n是通过一个关系中属性间值的相等与 否体现出来的数据间的相互关系n是现实世界属性间相互联系的抽象n是数据内在的性质n是语义的体现什么是数据依赖(续)3. 数据依赖的类型n函数依赖(Functio

3、nal Dependency,简记为FD)n多值依赖(Multivalued Dependency,简记为MVD)四、关系模式的简化表示关系模式R(U, D, DOM, F)简化为一个三元组:R(U, F)当且仅当U上的一个关系r 满足F时,r称为关系模式 R(U, F)的一个关系五、数据依赖对关系模式的影响例:描述学校的数据库:学生的学号(Sno)、所在系( Sdept) 系主任姓名(Mname)、课程名( Cname) 成绩(Grade)单一的关系模式 : Student U Sno, Sdept, Mname, Cname, Grade 数据依赖对关系模式的影响(续)学校数据库的语义:

4、一个系有若干学生, 一个学生只属于一个系; 一个系只有一名主任; 一个学生可以选修多门课程, 每门课程有若干学生选修; 每个学生所学的每门课程都有一个成绩。数据依赖对关系模式的影响(续)属性组U上的一组函数依赖F:F Sno Sdept, Sdept Mname, (Sno, Cname) Grade SnoCnameSdeptMnameGrade关系模式Student中存在的问题 数据冗余太大n浪费大量的存储空间例:每一个系主任的姓名重复出现 更新异常(Update Anomalies)n数据冗余 ,更新数据时,维护数据完整性代价大。例:某系更换系主任后,系统必须修改与该系学生有关的每一个元

5、组关系模式Student中存在的问题 插入异常(Insertion Anomalies)n该插的数据插不进去例,如果一个系刚成立,尚无学生,我们就无法把这个系及其系主任的信息存入数据库。 删除异常(Deletion Anomalies)n不该删除的数据不得不删例,如果某个系的学生全部毕业了, 我们在删除该系学生信息的同时,把这个系及其系主任的信息也丢掉了。数据依赖对关系模式的影响(续)结论:Student关系模式不是一个好的模式。“好”的模式:不会发生插入异常、删除异常、更新 异常,数据冗余应尽可能少。原因:由存在于模式中的某些数据依赖引起 的解决方法:通过分解关系模式来消除其中不 合适的数据

6、依赖。规范化规范化理论正是用来改造 关系模式,通过分解关系模 式来消除其中不合适的数据 依赖,以解决插入异常、删 除异常、更新异常和数据冗 余问题。函数依赖一、函数依赖二、平凡函数依赖与非平凡函数依赖三、完全函数依赖与部分函数依赖四、传递函数依赖一、函数依赖定义1 设R(U)是一个属性集U上的关系模式,X和Y是U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等, 而在Y上的属性值不等, 则称 “X函数确定Y” 或 “Y函数依赖于X”,记作XY。 X称为这个函数依赖的决定属性集(Determinant)。Y=f(x)说明: 1. 函数依赖不是指关系模式R的某

7、个或某些关系实例满 足的约束条件,而是指R的所有关系实例均要满足的 约束条件。2. 函数依赖是语义范畴的概念。只能根据数据的语义来 确定函数依赖。例如“姓名年龄”这个函数依赖只有在不允许有相同 姓名人的条件下成立3. 数据库设计者可以对现实世界作强制的规定。例如规 定不允许同名人出现,函数依赖“姓名年龄”成立。 所插入的元组必须满足规定的函数依赖,若发现有同 名人存在, 则拒绝装入该元组。函数依赖(续)例: Student(Sno, Sname, Ssex, Sage, Sdept)假设不允许重名,则有:Sno Ssex, Sno Sage , Sno Sdept, Sno Sname, Sn

8、ame Ssex, Sname Sage Sname Sdept 但Ssex Sage若XY,并且YX, 则记为XY。若Y不函数依赖于X, 则记为XY。二、平凡函数依赖与非平凡函数依赖在关系模式R(U)中,对于U的子集X和Y,如果XY,但Y X,则称XY是非平凡的函数依赖若XY,但Y X, 则称XY是平凡的函数依赖例:在关系SC(Sno, Cno, Grade)中,非平凡函数依赖: (Sno, Cno) Grade平凡函数依赖: (Sno, Cno) Sno (Sno, Cno) Cno平凡函数依赖与非平凡函数依赖(续)n对于任一关系模式,平凡函数依赖都是必然成立的,它不反映新的语义,因此若不

9、特别声明, 我们总是讨论非平凡函数依赖。三、完全函数依赖与部分函数依赖定义2 在关系模式R(U)中,如果XY,并且对于X的任何一个真子集X,都有X Y, 则称Y完全函数依赖于X,记作X Y。若XY,但Y不完全函数依赖于X,则称Y部分函数依赖于X,记作X P Y。完全函数依赖与部分函数依赖(续)例: 在关系SC(Sno, Cno, Grade)中,由于:Sno Grade,Cno Grade, 因此:(Sno, Cno) Grade四、传递函数依赖定义3 在关系模式R(U)中,如果XY,YZ ,且Y X,YX,则称Z传递函数依赖于X 。注: 如果YX, 即XY,则Z直接依赖于X 。例: 在关系S

10、td(Sno, Sdept, Mname)中,有: Sno Sdept,Sdept MnameMname传递函数依赖于Sno码定义4 设K为关系模式R中的属性或属性组合。若K U,则K称为R的一个侯选码(Candidate Key)。若关系模式R有多个候选码,则选定其中的一个做为主码(Primary key)。n主属性与非主属性nALL KEY外部码定义5 关系模式 R 中属性或属性组X 并非 R 的码,但 X 是另一个关系模式的码,则称 X 是R 的外部码(Foreign key)也称外码n主码又和外部码一起提供了表示关系间联系的手段。范式n范式是符合某一种级别的关系模式的集合 。n关系数据

11、库中的关系必须满足一定的要求 。满足不同程度要求的为不同范式。n范式的种类:第一范式(1NF) 第二范式(2NF) 第三范式(3NF) BC范式(BCNF) 第四范式(4NF) 第五范式(5NF)范式n各种范式之间存在联系:n某一关系模式R为第n范式,可简 记为RnNF。1NFn1NF的定义 如果一个关系模式R的所有属性都是不可分 的基本数据项,则R1NF。n第一范式是对关系模式的最起码的要求。 不满足第一范式的数据库模式不能称为关 系数据库。n但是满足第一范式的关系模式并不一定是 一个好的关系模式。1NF例: 关系模式 SLC(Sno, Sdept, Sloc, Cno, Grade)Slo

12、c为学生住处,假设每个系的学生住 在同一个地方。n函数依赖包括:(Sno, Cno) f GradeSno Sdept(Sno, Cno) P SdeptSno Sloc(Sno, Cno) P SlocSdept Sloc1NFnSLC的码为(Sno, Cno)nSLC满足第一范式。n 非主属性Sdept和Sloc部分函数依赖于码(Sno, Cno)SnoCnoGradeSdeptSlocSLCSLC不是一个好的关系模式(1) 插入异常假设Sno95102,SdeptIS,Sloc N的学生还未选课,因课程号是主属性,因 此该学生的信息无法插入SLC。(2) 删除异常假定某个学生本来只选修了

13、3号课 程这一门课。现在因身体不适,他连3号课程 也不选修了。因课程号是主属性,此操作将导 致该学生信息的整个元组都要删除。SLC不是一个好的关系模式(3) 数据冗余度大如果一个学生选修了10门课程,那 么他的Sdept和Sloc值就要重复存储了10次。(4) 修改复杂例如学生转系,在修改此学生元组 的Sdept值的同时,还可能需要修改住处( Sloc)。如果这个学生选修了K门课,则必须 无遗漏地修改K个元组中全部Sdept、Sloc信息 。1NFSLC的码为(Sno, Cno)nSLC满足第一范式。n非主属性Sdept和Sloc部分函数依赖于码 (Sno, Cno)SnoCnoGradeSd

14、eptSlocSLC2NFn原因Sdept、 Sloc部分函数依赖于码。n解决方法SLC分解为两个关系模式,以消除这些部分函数依赖 SC(Sno, Cno, Grade)SL(Sno, Sdept, Sloc)2NF函数依赖图:SnoCnoGradeSCSLSnoSdeptSloc2NFn2NF的定义 定义6 若关系模式R1NF,并且每一个非 主属性都完全函数依赖于R的码,则 R2NF。例: SLC(Sno, Sdept, Sloc, Cno, Grade) 1NFSLC(Sno, Sdept, Sloc, Cno, Grade) 2NF SC(Sno, Cno, Grade ) 2NFSL(

15、Sno, Sdept, Sloc) 2NF第二范式(续)n采用投影分解法将一个1NF的关系分解为 多个2NF的关系,可以在一定程度上减轻 原1NF关系中存在的插入异常、删除异常 、数据冗余度大、修改复杂等问题。n将一个1NF关系分解为多个2NF的关系,并 不能完全消除关系模式中的各种异常情况 和数据冗余。2NF例:2NF关系模式SL(Sno, Sdept, Sloc) 中n函数依赖:SnoSdeptSdeptSlocSnoSloc Sloc传递函数依赖于Sno,即SL中存 在非主属性对码的传递函数依赖 。2NF函数依赖图:SLSnoSdeptSloc3NFn解决方法采用投影分解法,把SL分解为两个关系模式,以消除传递函数依赖: SD(Sno, Sdept)DL(Sdept, Sloc)SD的码为Sno, DL的码为Sdept。3NFSD的码为Sno, DL的码为Sdept 。SnoSdeptSDSdeptSlocDL3NFn3NF的定义定义8 关系模式R 中若不存在这样 的码X、属性组Y及非主属性Z(Z Y), 使 得XY,Y X,YZ,成立,则称R 3NF。 例, SL(Sno, Sdept, Sloc) 2NFSL(Sno, Sdept, Sloc) 3NF SD(Sno, Sdept) 3NFDL(Sdept, Sloc

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号