atabase System第六章 数据

上传人:豆浆 文档编号:2659531 上传时间:2017-07-26 格式:PPT 页数:63 大小:124.50KB
返回 下载 相关 举报
atabase System第六章 数据_第1页
第1页 / 共63页
atabase System第六章 数据_第2页
第2页 / 共63页
atabase System第六章 数据_第3页
第3页 / 共63页
atabase System第六章 数据_第4页
第4页 / 共63页
atabase System第六章 数据_第5页
第5页 / 共63页
点击查看更多>>
资源描述

《atabase System第六章 数据》由会员分享,可在线阅读,更多相关《atabase System第六章 数据(63页珍藏版)》请在金锄头文库上搜索。

1、数据库系统概论An Introduction to Database System第六章 数据库设计(续-2),第六章 数据库设计,6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结,6.4 逻辑结构设计,逻辑结构设计的任务概念结构是各种数据模型的共同基础为了能够用某一DBMS实现用户需求,还必须将概念结构进一步转化为相应的数据模型,这正是数据库逻辑结构设计所要完成的任务。,6.4 逻辑结构设计,逻辑结构设计的步骤将概念结构转化为一般的关系、网状、层次模型将转化来的关系、网状、层次模型向特

2、定DBMS支持下的数据模型转换对数据模型进行优化,6.4 逻辑结构设计,6.4.1 E-R图向关系模型的转换6.4.2 向特定DBMS规定的模型进行转换6.4.3 数据模型的优化6.4.4 设计用户子模式,6.4.1 E-R图向关系模型的转换,转换内容转换原则,E-R图向关系模型的转换(续),转换内容E-R图由实体、实体的属性和实体之间的联系三个要素组成关系模型的逻辑结构是一组关系模式的集合将E-R图转换为关系模型:将实体、实体的属性和实体之间的联系转化为关系模式。,E-R图向关系模型的转换(续),转换原则 一个实体型转换为一个关系模式。关系的属性:实体型的属性关系的码:实体型的码例,学生实体

3、可以转换为如下关系模式:学生(学号,姓名,出生日期,所在系, 年级,平均成绩) 性别、宿舍、班级、档案材料、教师、课程、教室、教科书都分别转换为一个关系模式。,E-R图向关系模型的转换(续), 一个m:n联系转换为一个关系模式。关系的属性:与该联系相连的各实体的码以及联系本身的属性关系的码:各实体码的组合例,“选修”联系是一个m:n联系,可以将它转换为如下关系模式,其中学号与课程号为关系的组合码:选修(学号,课程号,成绩),E-R图向关系模型的转换(续), 一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。1) 转换为一个独立的关系模式关系的属性:与该联系相连的各实体

4、的码以及联系本身的属性关系的码:n端实体的码,E-R图向关系模型的转换(续), 一个1:n联系可以转换为一个独立的关系模式,也可以与n端对应的关系模式合并。2) 与n端对应的关系模式合并合并后关系的属性:在n端关系中加入1端关系的码和联系本身的属性合并后关系的码:不变可以减少系统中的关系个数,一般情况下更倾向于采用这种方法,E-R图向关系模型的转换(续),例,“组成”联系为1:n联系。将其转换为关系模式的两种方法: 1)使其成为一个独立的关系模式:组成(学号,班级号) 2)将其学生关系模式合并:学生(学号,姓名,出生日期,所在系, 年级,班级号,平均成绩),E-R图向关系模型的转换(续), 一

5、个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。1) 转换为一个独立的关系模式关系的属性:与该联系相连的各实体的码以及联系本身的属性关系的候选码:每个实体的码均是该关系的候选码,E-R图向关系模型的转换(续), 一个1:1联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。2) 与某一端对应的关系模式合并合并后关系的属性:加入对应关系的码和联系本身的属性合并后关系的码:不变,E-R图向关系模型的转换(续),例,“管理”联系为1:1联系,可以有三种转换方法:(1)转换为一个独立的关系模式: 管理(职工号,班级号) 或管理(职工号,班级号)(2)“管

6、理”联系与班级关系模式合并,则只需在班级关系中加入教师关系的码,即职工号:班级:(班级号,学生人数,职工号)(3)“管理”联系与教师关系模式合并,则只需在教师关系中加入班级关系的码,即班级号:教师:(职工号,姓名,性别,职称,班级号, 是否为优秀班主任),E-R图向关系模型的转换(续),注意:从理论上讲,1:1联系可以与任意一端对应的关系模式合并。但在一些情况下,与不同的关系模式合并效率会大不一样。因此究竟应该与哪端的关系模式合并需要依应用的具体情况而定。由于连接操作是最费时的操作,所以一般应以尽量减少连接操作为目标。 例如,如果经常要查询某个班级的班主任姓名,则将管理联系与教师关系合并更好些

7、。,E-R图向关系模型的转换(续), 三个或三个以上实体间的一个多元联系转换为一个关系模式。关系的属性:与该多元联系相连的各实体的码以及联系本身的属性关系的码:各实体码的组合例,“讲授”联系是一个三元联系,可以将它转换为如下关系模式,其中课程号、职工号和书号为关系的组合码:讲授(课程号,职工号,书号),E-R图向关系模型的转换(续), 同一实体集的实体间的联系,即自联系,也可按上述1:1、1:n和m:n三种情况分别处理。例,如果教师实体集内部存在领导与被领导的1:n自联系,我们可以将该联系与教师实体合并,这时主码职工号将多次出现,但作用不同,可用不同的属性名加以区分:教师:职工号,姓名,性别,

8、职称,系主任,E-R图向关系模型的转换(续), 具有相同码的关系模式可合并。目的:减少系统中的关系个数。合并方法:将其中一个关系模式的全部属性加入到另一个关系模式中,然后去掉其中的同义属性(可能同名也可能不同名),并适当调整属性的次序。,E-R图向关系模型的转换(续),例,“拥有”关系模式:拥有(学号,性别)与学生关系模式: 学生(学号,姓名,出生日期,所在系,年级, 班级号,平均成绩)都以学号为码,可以将它们合并为一个关系模式:学生(学号,姓名,性别,出生日期,所在系, 年级,班级号,平均成绩),E-R图向关系模型的转换(续),实例按照上述七条原则,学生管理子系统中的18个实体和联系可以转换

9、为下列关系模型: 学生(学号,姓名,性别,出生日期,所在系, 年级,班级号,平均成绩,档案号)性别(性别,宿舍楼) 宿舍(宿舍编号,地址,性别,人数)班级(班级号,学生人数) 教师(职工号,姓名,性别,职称,班级号, 是否为优秀班主任),E-R图向关系模型的转换(续),教学(职工号,学号)课程(课程号,课程名,学分,教室号)选修(学号,课程号,成绩)教科书(书号,书名,价钱)教室(教室编号,地址,容量)讲授(课程号,教师号,书号)档案材料(档案号,),E-R图向关系模型的转换(续),该关系模型由12个关系模式组成。其中:学生关系模式包含了“拥有”联系、“组成”联系、“归档”联系所对应的关系模式

10、教师关系模式包含了“管理”联系所对应的关系模式;宿舍关系模式包含了“住宿”联系所对应的关系模式;课程关系模式包含了“开设”联系所对应的关系模式。,6.4 逻辑结构设计,6.4.1 E-R图向关系模型的转换6.4.2 向特定DBMS规定的模型进行转换6.4.3 数据模型的优化6.4.4 设计用户子模式,6.4.2 向特定DBMS规定的模型进行转换,一般的数据模型还需要向特定DBMS规定的模型进行转换。转换的主要依据是所选用的DBMS的功能及限制。没有通用规则。对于关系模型来说,这种转换通常都比较简单。,6.4 逻辑结构设计,6.4.1 E-R图向关系模型的转换6.4.2 向特定DBMS规定的模型

11、进行转换6.4.3 数据模型的优化6.4.4 设计用户子模式,6.4.3 数据模型的优化,数据库逻辑设计的结果不是唯一的。得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据模型的优化。关系数据模型的优化通常以规范化理论为指导。,数据模型的优化(续),优化数据模型的方法 确定数据依赖按需求分析阶段所得到的语义,分别写出每个关系模式内部各属性之间的数据依赖以及不同关系模式属性之间数据依赖。,数据模型的优化(续),例,课程关系模式内部存在下列数据依赖: 课程号课程名 课程号学分 课程号教室号 选修关系模式中存在下列数据依赖: (学号,课程号)成绩,

12、数据模型的优化(续),学生关系模式中存在下列数据依赖: 学号姓名 学号性别 学号出生日期 学号所在系 学号年级 学号班级号 学号平均成绩 学号档案号,数据模型的优化(续),学生关系模式的学号与选修关系模式的学号之间存在数据依赖: 学生.学号选修.学号,数据模型的优化(续), 对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。,数据模型的优化(续), 按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多值依赖等,确定各关系模式分别属于第几范式。 例如经过分析可知,课程关系模式属于BC范式。,数据模型的优化(续), 按照需求分析阶段得到的各种应用对数据处

13、理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行合并或分解。,数据模型的优化(续),并不是规范化程度越高的关系就越优。当一个应用的查询中经常涉及到两个或多个关系模式的属性时,系统必须经常地进行联接运算,而联系运算的代价是相当高的,可以说关系模型低效的主要原因就是做联接运算引起的,因此在这种情况下,第二范式甚至第一范式也许是最好的。,数据模型的优化(续),非BCNF的关系模式虽然从理论上分析会存在不同程度的更新异常,但如果在实际应用中对此关系模式只是查询,并不执行更新操作,则就不会产生实际影响。对于一个具体应用来说,到底规范化进行到什么程度,需要权衡响应时间和潜在问题两者的

14、利弊才能决定。一般说来,第三范式就足够了。,数据模型的优化(续),例:在关系模式 学生成绩单(学号,英语,数学,语文,平均成绩) 中存在下列函数依赖: 学号英语 学号数学 学号语文 学号平均成绩 (英语, 数学, 语文)平均成绩,数据模型的优化(续),显然有: 学号(英语,数学,语文)因此该关系模式中存在传递函数信赖,是2NF关系。 虽然平均成绩可以由其他属性推算出来,但如果应用中需要经常查询学生的平均成绩,为提高效率,我们仍然可保留该冗余数据,对关系模式不再做进一步分解。,数据模型的优化(续), 按照需求分析阶段得到的各种应用对数据处理的要求,对关系模式进行必要的分解或合并,以提高数据操作的效率和存储空间的利用率常用分解方法水平分解垂直分解,数据模型的优化(续),水平分解什么是水平分解把(基本)关系的元组分为若干子集合,定义每个子集合为一个子关系,以提高系统的效率。,数据模型的优化(续),水平分解的适用范围1. 满足“80/20原则”的应用80/20原则:一个大关系中,经常被使用的数据只是关系的一部分,约20%把经常使用的数据分解出来,形成一个子关系,可以减少查询的数据量。,数据模型的优化(续),水平分解的适用范围2. 并发事务经常存取不相交的数据如果关系R上具有n个事务,而且多数事务存取的数据不相交,则R可分解为少于或等于n个子关系,使每个事务存取的数据对应一个关系。,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号