《精编》关系数据库设计理论培训教程

上传人:tang****xu1 文档编号:133249816 上传时间:2020-05-25 格式:PPT 页数:29 大小:142.50KB
返回 下载 相关 举报
《精编》关系数据库设计理论培训教程_第1页
第1页 / 共29页
《精编》关系数据库设计理论培训教程_第2页
第2页 / 共29页
《精编》关系数据库设计理论培训教程_第3页
第3页 / 共29页
《精编》关系数据库设计理论培训教程_第4页
第4页 / 共29页
《精编》关系数据库设计理论培训教程_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《《精编》关系数据库设计理论培训教程》由会员分享,可在线阅读,更多相关《《精编》关系数据库设计理论培训教程(29页珍藏版)》请在金锄头文库上搜索。

1、关系数据库设计理论本章学习目标本章主要讲解函数依赖和以函数为基础的几种关系范式 通过本章的学习 读者应掌握以下内容 函数依赖关系范式1NF 2NF 3NF 7 1引言7 1 1讨论范围数据库是一组相关数据的集合 它不仅包括数据本身 而且还包括数据之间的联系 即数据模型 给出一组数据 如何构造一个适当的数据模型 在关系数据库中应该组织成几个关系模式 每个关系模式包括哪些属性 这些都是数据库逻辑设计要解决的问题 在具体数据库系统实现之前 尚未录入实际数据时 组建较好的数据模型是关系到整个系统运行效率 甚至系统成败的关键 在以关系模型为基础的数据库中 用关系来描述现实世界 关系具有概念单一性的特点

2、一个关系既可以描述一个实体 也可以描述实体间的联系 一个关系模型包括一组关系模式 各个关系不是完全孤立的 只有它们相互间存在关联 才能构成一个模型 这些关系模式的全体定义构成关系数据库模式 关系模型有严格的理论基础 也是目前应用最广泛的数据模型 指导数据库逻辑设计的是关系数据库规范化理论 关系数据库设计理论主要包括三个方面的内容 数据依赖 范式和模式设计方法 数据依赖起着核心的作用 我们重点讨论函数依赖的概念 然后再介绍模式分解的标准 即范式 为数据库的设计准备一定的基本理论基础 这里力求以大家都熟悉的实例说明问题 7 1引言7 1 2存储异常问题有 教学 关系模式 教学 教师号 教师姓名 职

3、称 教师地址 系号 系名称 系地址 课程号 课程名 教学水平 学分 表7 1 教学 关系 7 1引言7 1 2存储异常问题主码是 教师号 课程号 但该关系在使用过程中存在以下几个问题 1 数据冗余 每当教师开设一门课程时 该教师的职称 地址等信息就重复存储一次 一般一个系有很多教师 每位教师都开设多门课 每位教师的职称 地址要多次重复存储 这样会使关系中的数据冗余度很大 2 更新异常 由于数据的重复存储 会给更新带来麻烦 如果一位任3门课的教师改变了地址 3个元组的地址都要更新 一旦一个元组的地址未修改就会导致数据不一致 如果某个系改变办公地址 所要修改的数据量会更大 3 插入异常 如果学校新

4、调入一个教师 暂时未主讲任何课程 由于缺少主码的一部分 而主码不允许出现空值 新教师的相关信息就不能插入到此关系中去 只有当他开设了课程之后才能插入 这是不合理的 4 删除异常 与插入异常相反 如果某些教师致力于科研 不担任教学任务了 就要从当前数据库中删除有关记录 那么关于这些教师的其他信息将无法记载 这也是极不合理的 7 1引言7 1 2存储异常问题用下面4个关系模式代替原来的一个关系模式 上述4个方面的问题就基本解决了 教师 教师号 教师姓名 职称 教师地址 系号 系 系号 系名称 系地址 课程 课程号 课程名 学分 选修 教师号 课程号 教学水平 新关系模型包括4个关系模式 教师 和

5、系 通过 教师 中的外码 系号 相联系 教师 与 课程 之间多对多的联系可以通过 选修 中的外码 教师号 课程号 相联系 需要时再进行自然联接 则恢复了原来的关系 但是将 教学 分解成 教师 系 课程 选修 四个模式是否最佳 并不是绝对的 例如 要频繁地查询讲授某门课程教师的情况 就要对这两个关系做联接操作 而联接是以机时为代价的 在原来的关系模式中则可以直接查到 到底哪个关系模型更好 要根据数据库的规模 数据的共享程度和应用需求来权衡 7 2函数依赖7 2 1属性之间的联系实体内部各属性间的联系分为3类 一对一 一对多和多对多 设图书管理关系数据模型包括以下3个关系模式 图书 总编号 分类号

6、 书名 作者 出版单位 单价 读者 借书证号 姓名 性别 单位 职称 地址 借阅 借书证号 总编号 借阅日期 备注 1 一对一联系在读者关系中 借书证号是惟一的 设X Y为关系中的属性或属性组 它们的所有可能取值组成两个集合 为简便起见 也叫X Y 如果对于X中的任一具体值 Y中至多有一个值与之对应 并且对于Y中的任一具体值 X中也至多有一个值与之对应 称X Y这两个属性之间是一对一联系 7 2函数依赖7 2 1属性之间的联系2 一对多联系在图书关系中 一本书有若干副本 它们有相同的书名 作者 分类号等 但每本书有惟一的总编号 书名与总编号之间是1 m 即同一个书名有多个总编号与之对应 如果属

7、性值集合X中的任一具体值 至多与Y中的一个值对应 而Y中的任一具体值却可以和X中的多个值相对应 则称两个属性间从X到Y为m 1的联系 或从Y到X是1 m的联系 3 多对多联系在借阅关系中 一个读者可以借阅多本书 即同一个借书证号有若干个图书总编号与之对应 由总编号标识的一本书在不同日期可以被不同的读者借阅 又如在选修关系中一个学生可以选修几门课 同一门课有多个学生同时选修 在X Y两个属性值集中 如果任一个值都可以至多和另一个属性集中的多个值对应 反之亦然 则称属性X和Y是m n关系 显然 3类联系之间存在着包含关系 1 1是1 m的特例 1 m又是m n的特例 关系中属性值之间这种相互依赖又

8、相互制约的联系称为数据依赖 数据依赖主要有两种 函数依赖和多值依赖 7 2函数依赖7 2 2函数依赖1 函数依赖的概念定义7 1用U表示属性集的全集 A1 A2 An 设R U 是属性集U上的关系模式 X和Y是U的子集 对于R U 的所有具体关系r都满足如下约束 对于X的每一个具体值 Y有惟一的具体值与之对应 则称 X函数确定Y 或 Y函数依赖于X 记作X Y X称做决定因素 在关系模式R U 中 对于U的子集X和Y 如果X Y 但Y X 则称X Y是非平凡依赖 若Y X 则称X Y为平凡依赖 例1有关系工资 职工号 基本工资 奖金 一个职工号惟一确定一个基本工资数额或一个奖金额 即一个人不能

9、拿两种工资或奖金 但几个人的工资可能相同 具体数字如表7 2所示 表7 2 工资 表 7 2函数依赖7 2 2函数依赖设属性A是职工号 属性B是基本工资 属性C是奖金 可以看出 每个A的值对应一个B的值和一个C的值 因此 属性B和C都函数依赖于属性A 但反过来则不存在这种关系 如基本工资390对应两个职工号051和054 用符号表示为 A B A C B A C A B C 根据函数依赖的定义 可以找出下面规律 1 在一个关系模式中 如果属性X Y有1 1联系 则存在函数依赖X Y Y X 可记作X Y 2 如果属性X Y是1 m的联系 则存在函数依赖Y X 但X Y 3 如果属性X Y是n

10、m的联系 则X与Y之间不存在任何函数依赖 必须注意 函数依赖是指关系R模式的所有元组均应满足的约束条件 而不是指关系模式R的某个或某些元组满足的约束条件 当关系中的元组增加或者更新后都不能破坏函数依赖 因此 必须根据语义来确定数据之间的函数依赖 而不能单凭某一时刻关系中的实际数据值来判断 7 2函数依赖7 2 2函数依赖2 完全函数依赖与部分函数依赖定义7 2设X Y是关系模式R U 的一个函数依赖 如果存在X的真子集X 使得X Y成立 则称Y部分依赖于X 记作 否则称Y完全依赖于X 记作 例2设有关系模式选课 学号 课程号 成绩 学分 在 选课 关系中 由于一个学生可以选修多门课程 一门课程

11、可有多个学生选修 因此 学号 或 课程号 都不能单独确定 成绩 成绩 只能由属性组合 学号 课程号 来确定 学分 可由 课程号 来确定 由此可知 学号 课程号 成绩 学号 课程号 学分3 传递依赖定义7 3在同一关系模式R U 中 如果存在非平凡函数依赖X Y Y Z 且Y X 则X Z 即称Z传递依赖于X 例3设关系模式学生 学号 姓名 系号 系名 系地址 存在函数依赖 学号 系号 系号 学号 系号 系地址 根据传递依赖的定义可知 学号 系地址实际上 部分依赖必然是传递依赖 在选修 学号 课程号 成绩 学分 关系中 学号 课程号 课程号 课程号 学分 形成传递依赖 学号 课程号 学分 7 2

12、函数依赖7 2 4码1 主码 候选码 外码定义7 5关系模式R U 中 K是U中的属性或属性组 如果KU 则称K为R U 的一个候选码 若关系模式R U 中有多个候选码 可以选中其中的一个做为主码 若K不是本关系的主码 而是其他关系的主码 则称K为外码 候选码有两个性质 1 标识的惟一性 对于R U 中的每一个元组 K的值确定后 该元组就相应地确定了 2 无冗余性 当K是属性组的情况下 K的任何一部分都不能惟一标识该元组 这是定义中完全依赖的意义 2 主属性和非主属性定义7 6包含在任意一个候选码中的属性 称为主属性 不包含在任何候选码中的属性称为非主属性 关系选修 学号 课程号 成绩 学号

13、课程号 是候选码也是主码 学号 课程号 是主属性 成绩 是非主属性 7 3关系模式的规范化7 3 1第一范式 INF 定义7 7在关系模式R中的每一个具体关系r中 如果每个属性值都是不可再分的最小数据单位 则称R是第一范式的关系 记为R 1NF 不是1NF的关系称为非规范化关系 数据库理论研究的都是规范化关系 如何将普通的复式表格规范为关系呢 下面通过例子来说明 例1表7 3所示的数据不是1NF 因为 电话号码 可以分为 办公室电话 和 家庭电话 两个属性 请将表7 3规范成1NF 表7 3非规范化 职工 表 7 3关系模式的规范化7 3 1第一范式 INF 将上表规范成1NF可以有三种方法

14、第一种方法 重复存储职工号和姓名 如表7 3 a 所示 在这样的关系中 主码只能是电话号码 如果单独查阅此关系问题不大 若通过职工号与其他关系联接 由于职工号不是主码 则可能造成大量冗余 表7 3 a 规范化 职工1 表 7 3关系模式的规范化7 3 1第一范式 INF 第二种方法 保留职工号的主码地位 把电话号码拆分成单位电话和住宅电话两个属性 如表7 7 b 所示 这样会使只有一个电话号码的元组出现空属性值 由于电话号码不是候选码 允许有空值 表7 7 b 规范化 职工2 表 7 3关系模式的规范化7 3 1第一范式 INF 第三种方法 保留职工号的主码地位 维持原模式不变 但强制每个元组

15、只能录入一个电话号码 如表7 3 c 所示 表7 3 c 规范化 职工3 表 7 3关系模式的规范化7 3 2第二范式 2NF 满足第一范式的关系仍有可能出现问题 例2设有关系模式选修 学号 课程号 成绩 学分 存在函数依赖 学号 课程号 成绩 学号 课程号 学分 主码是 学号 课程号 如表3 4所示 7 3关系模式的规范化7 3 2第二范式 2NF 满足第一范式的关系仍有可能出现问题 例2设有关系模式选修 学号 课程号 成绩 学分 存在函数依赖 学号 课程号 成绩 学号 课程号 学分 主码是 学号 课程号 如表3 4所示 表3 4选修 7 3关系模式的规范化7 3 2第二范式 2NF 该关系

16、模式在实际应用中会再现下列问题 1 数据冗余 每当一名学生选修一门课程时 该课程的 学分 就重复存储一次 假设同一门课被40名学生选修 学分就重复40次 2 更新异常 如果调整了课程的学分 每个相应元组的 学分 值都必须更新 这不仅增加了更新代价 更严重的是有潜在的数据不一致性 3 插入异常 如果学校计划增开新课 应当把新课的课程号及学分数插入到 选修 中 但是由于缺少主码的一部分 将不能插入 4 删除异常 如果学生已经结业 从当前数据库中删除选修记录 某些课程新生尚未选修 那么关于这些课程的学分记载将无法保留 这是极不合理的 定义3 7若关系模式R 1NF 并且每一个非主属性都完全依赖于R的任一候选码 则称关系R是第二范式的 记为R 2NF 将上述非2NF的关系SC1规范化为2NF关系 通过投影分解为以下两个关系模式 选修2 学号 课程号 成绩 课程 课程号 学分 7 3关系模式的规范化7 3 3第三范式 3NF 满足第二范式的关系仍然可能出现问题 其原因是由于关系中存在传递依赖 定义3 9如果关系模式R U F 中的所有非主属性对任何码都不存在传递依赖 则称关系R是第三范式的 记为

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号