数据库原理及应用-电子教案-石玉强 chp4

上传人:E**** 文档编号:89470995 上传时间:2019-05-25 格式:PPT 页数:104 大小:1.02MB
返回 下载 相关 举报
数据库原理及应用-电子教案-石玉强 chp4_第1页
第1页 / 共104页
数据库原理及应用-电子教案-石玉强 chp4_第2页
第2页 / 共104页
数据库原理及应用-电子教案-石玉强 chp4_第3页
第3页 / 共104页
数据库原理及应用-电子教案-石玉强 chp4_第4页
第4页 / 共104页
数据库原理及应用-电子教案-石玉强 chp4_第5页
第5页 / 共104页
点击查看更多>>
资源描述

《数据库原理及应用-电子教案-石玉强 chp4》由会员分享,可在线阅读,更多相关《数据库原理及应用-电子教案-石玉强 chp4(104页珍藏版)》请在金锄头文库上搜索。

1、An Introduction to Database System,数据库原理及应用,Principles and Applications of the Database,第4章 关系规范化理论 仲恺农业工程学院 计算机科学与工程学院,仲恺农业工程学院,计算机科学与工程学院,第四章 关系规范化理论,本章导读 了解:规范化理论的重要性;Armstrong公理系统 理解:函数依赖、码的基本定义;各级范式的定义; 掌握:模式分解的等价性判定准则和分解算法思想,指导好的模式设计。,仲恺农业工程学院,计算机科学与工程学院,第四章 关系规范化理论,重点: 1函数依赖 2码 3分解的无损连接性和函数依赖

2、保持性 难点: 1模式分解等价性判定的三个准则 2模式分解算法,仲恺农业工程学院,计算机科学与工程学院,第四章 关系规范化理论,本章要点 函数依赖 范式 Armstrong公理系统 函数依赖集闭包和属性依赖集闭包 模式分解等价性判断准则和分解算法,仲恺农业工程学院,计算机科学与工程学院,第四章 关系规范化理论,4.1 问题的提出 4.2 规范化理论 4.3 关系模式的分解 本章小结,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,人们希望有一种形式化的设计方法可以从理论上判断某个关系模式“好”或是“不好”,对于“不好”的关系模式,如何产生一个等价的“好”的模式将其替代。 这些判断理

3、论就是本章学习的重点关系数据库的规范化理论。,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,先从一个实例出发,看看一个“不好”的关系模式可能给关系操作带来的不良影响。 例如:某学校要建立一个教务管理系统,其中有一个课程管理子系统,面临的对象有:教师、院系和课程。 于是有一组属性集合: U=教师编号,教师姓名,教师所属院系,院系负责人,课程编号,课程名称,学时数,授课地点,授课时间,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,由现实世界的已知事实可以得知上述对象间有如下对应关系: (1)一个院系有若干教师,但一个教师只能在一个院系工作; (2)一个院系只有一个负责人

4、; (3)一个教师可以担任多门课程,一门课程可由多个教师分别讲授。,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,可以得到以下的函数依赖图,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,不难看出属性之间存在如下的一些依赖关系: (1)教师编号确定,教师姓名和所在院系就被唯一确定; (2)课程编号确定,课程名称和学时数就被唯一确定; (3)所在院系的负责人也是由所在院系唯一确定; (4)一个教师讲授多门课程,而一门课程由多个教师讲授,所以要确定某个教师讲授某一门课程的授课时间和授课地点,必须由教师编号和课程编号共同来确定。,仲恺农业工程学院,计算机科学与工程学院,4.

5、1 问题的提出,可以设计哪些数据库模式的方案?,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,方案1:采用一个总的关系模式: TCP(教师编号,教师姓名,教师所属院系,院系负责人,课程编号,课程名称,学时数,授课地点,授课时间),仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,方案2:采用四个关系模式: T(教师编号,教师姓名,教师所属院系) DP(院系名称,院系负责人) C(课程编号,课程名称,学时数) TC(教师编号,课程编号,授课地点,授课时间),两个方案 存在问题吗,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,方案1 & 方案2 存在以下四个方

6、面的问题 (1)数据冗余度问题 (2)插入异常问题 (3)删除异常问题 (4)修改异常或潜在的不一致性问题,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,具体地,关系模式的非形式化设计准则包括: 准则1:设计一个关系模式要能够更容易的理解它的含义。 准则2:设计基本关系模式要使得关系中不出现插入、修改和删除异常。,仲恺农业工程学院,计算机科学与工程学院,4.1 问题的提出,准则3:设计一个关系模式要尽可能避免在其中放置经常为空值的属性。 准则4:设计关系模式要使得它们可以在作为主码或外码的属性上,进行连接,并且保证不会因为这种连接产生错误或无效的元组。,仲恺农业工程学院,计算机科

7、学与工程学院,第四章 关系规范化理论,4.1 问题的提出 4.2 规范化理论 4.3 关系模式的分解 本章小结,仲恺农业工程学院,计算机科学与工程学院,4.2 规范化理论,关系数据库中的关系模式不是随意构造的,通过不断地从模式中去掉某些属性间的依赖关系,使得关系模式不断地满足某些约束条件,逐步达到一个理想的关系模式。,4.2.1 函数依赖 4.2.2 码的形式化定义 4.2.3 范式 4.2.4 数据依赖的公理系统,仲恺农业工程学院,计算机科学与工程学院,4.2.1 函数依赖,1. 函数依赖的定义 定义4.1 设R(U)是属性集U上的关系模式,X、Y是属性集UA1,A2,An的任意子集。若对R

8、(U)的任何一个可能的关系r,当且仅当r中任意一个给定的X的值,r中存在唯一的Y值与之对应。也就是说,如果r中的任何两个元组u和v,只要有uXvX,则必须也有uYvY,则称Y函数依赖于X或X函数确定Y,记作X Y。,仲恺农业工程学院,计算机科学与工程学院,4.2.1 函数依赖,以下介绍几个函数依赖有关的基本术语。 (1)决定因素:若XY则X被称为决定因素。 (2)互相依赖:若XY,YX,称X和Y互相依赖,记作。 (3)若Y 不依赖于X,则记作X Y 。,仲恺农业工程学院,计算机科学与工程学院,4.2.1 函数依赖,以关系模式TCP为例,关系模式TCP中的属性集合以及存在的一些函数依赖关系 :

9、属性集合: U=教师编号,教师姓名,教师所属院系,院系负责人,课程编号,课程名称,学时数,授课地点,授课时间 函数依赖关系: 教师编号 教师姓名 课程编号 课程名称 教师编号,课程编号 授课地点,授课时间,仲恺农业工程学院,计算机科学与工程学院,4.2.1 函数依赖,2其他类型的函数依赖 定义4.2 一个函数依赖 如果满足 ,则称此函数依赖为非平凡函数依赖(Nontrivial Dependency),但是 ,则称为平凡函数依赖(Trivial Dependency)。,例如: 教师编号 教师姓名,课程编号课程名称都是非平凡的函数依赖。 教师编号,课程名称 课程名称 则是平凡函数依赖。,仲恺农

10、业工程学院,计算机科学与工程学院,4.2.1 函数依赖,定义4.3 在R(U)中,如果存在 ,且不存在X的任何一个真子集X(X X),都有 成立,则称对完全函数依赖(Full Dependency),记作 。,例如: (教师编号,课程编号) 授课地点 是完全函数依赖。,仲恺农业工程学院,计算机科学与工程学院,4.2.1 函数依赖,例如: (教师编号,课程编号) 教师所属院系,因为存在教师编号教师所属院系,所以是部分函数依赖。,定义4.4 在R(U)中,如果存在 ,且X中存在一个真子集X(X X),有 成立,则称Y对X部分函数依赖,记作 。,仲恺农业工程学院,计算机科学与工程学院,4.2.1 函

11、数依赖,定义4.5 在R(U)中,X、Y、Z是U的不同的属性子集,如果Y X( ), , ,则称Z对X传递函数依赖。,例如: 关系模式TCP中,因为存在函数依赖 教师编号教师所属院系,教师所属院系教师编号,教师所属院系院系负责人,所以可以得到 教师编号院系负责人,是传递函数依赖关系。,仲恺农业工程学院,计算机科学与工程学院,4.2 规范化理论,4.2.1 函数依赖 4.2.2 码的形式化定义 4.2.3 范式 4.2.4 数据依赖的公理系统,仲恺农业工程学院,计算机科学与工程学院,4.2.2 码的形式化定义,定义4.6 设K为关系模式R中的属性或属性组,若 则K为R的候选码(Candidate

12、 Key)。简称为码(Key) 码是在关系模式R中,可以唯一标识一个元组的属性或属性。 定义4.7 一个关系模式R中,可以有若干个候选码,则选定其中的一个作为 主码(Primary Key)。,仲恺农业工程学院,计算机科学与工程学院,4.2.2 码的形式化定义,关系模式R(学生编号,学生身份证号,学生姓名,课程编号,成绩) 候选码有: 主属性是:,K1=学生编号+课程编号; K2=学生身份证号+课程编号,学生编号、学生身份证号,课程编号,仲恺农业工程学院,计算机科学与工程学院,4.2.2 码的形式化定义,关系模式的每个候选码具有下列两个特性: (1)唯一性:在关系模式R(U)中,K为R的候选码

13、,对于关系模式R对应的任何一个关系r,都不存在候选码属性值相同的两个元组,即候选码的取值是唯一的。 (2)最小特性:在关系模式R(U)中,K为R的候选码,在不破坏候选码的唯一性的情况下,没有任何一个属性能从候选码里面删除。,仲恺农业工程学院,计算机科学与工程学院,4.2.2 码的形式化定义,定义4.8 关系模式R中属性或属性组X并非R的码,而是另一个关系模式的候选码,则称X是R的外码(Foreign Key)。,TC(教师编号,课程编号,授课地点,授课时间) T(教师编号,教师姓名,教师所属院系) 哪个是外码呢?,仲恺农业工程学院,计算机科学与工程学院,4.2 规范化理论,4.2.1 函数依赖

14、 4.2.2 码的形式化定义 4.2.3 范式 4.2.4 数据依赖的公理系统,仲恺农业工程学院,计算机科学与工程学院,4.2.3 范式,当关系模式满足某级别范式要求的约束条件时,就称这个关系模式属于这个级别的范式,记作RxNF。 范式实际上表示关系模式满足的某种级别。,仲恺农业工程学院,计算机科学与工程学院,4.2.3 范式,通过模式分解,可以将一个满足低一级别范式的关系模式转换为满足若干更高级别范式的关系模式,这种过程就叫做规范化。 在实际规范过程中,应注意以下几点: (1)1NF和2NF一般作为规范化过程的过渡范式。 (2)规范化程度,不一定越高越好。 (3)4NF和5NF主要用于理论研

15、究,设计关系模式时,一般只要求达到3NF或BCNF。,仲恺农业工程学院,计算机科学与工程学院,4.2.3 范式,1第一范式(1NF) 如果一个关系模式R,每个关系r的属性值都是不可再分的原子值,则称R为第一范式(First Normal Form),简记为R1NF。 关系数据库语言(如SQL、Oracle)都只支持第一范式。因此,满足第一范式是最基本的规范化要求。,仲恺农业工程学院,计算机科学与工程学院,4.2.3 范式,【例4-1】关系模式雇员EMP_Sala1关系 表4-1 EMP_Sala1,以上EMP_Sala1关系中“工资”属性包含基本工资、补贴、奖金三个子属性,即属性的属性名可以再

16、分,所以EMP_Sala1,。,仲恺农业工程学院,计算机科学与工程学院,4.2.3 范式,存在的问题。关系模式EMP_Sala1中若要求查询“10001”号雇员的“工资”时,原关系模式EMP_Sala1无法从“工资”属性中直接获得结果,所以,不满足一范式的模式将直接影响到对模式的操作,因此,规范化理论要求关系模式最起码要满足1NF。 解决的办法。用子属性代替原来非原子的属性。修改后的关系模式可以对每个属性直接操作,仲恺农业工程学院,计算机科学与工程学院,4.2.3 范式,【例4-2】表4-3的模式EMP_PRO1,表示职工编号和负责的项目之间的对应关系。 表4-3 EMP_PRO1,由于 “项目编号”属性的值不唯一,不是原子属性值,所以 EMP_PRO1,。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号