数据库系统概论(第四版)王珊Part.ppt

上传人:ni****g 文档编号:571263206 上传时间:2024-08-09 格式:PPT 页数:310 大小:902KB
返回 下载 相关 举报
数据库系统概论(第四版)王珊Part.ppt_第1页
第1页 / 共310页
数据库系统概论(第四版)王珊Part.ppt_第2页
第2页 / 共310页
数据库系统概论(第四版)王珊Part.ppt_第3页
第3页 / 共310页
数据库系统概论(第四版)王珊Part.ppt_第4页
第4页 / 共310页
数据库系统概论(第四版)王珊Part.ppt_第5页
第5页 / 共310页
点击查看更多>>
资源描述

《数据库系统概论(第四版)王珊Part.ppt》由会员分享,可在线阅读,更多相关《数据库系统概论(第四版)王珊Part.ppt(310页珍藏版)》请在金锄头文库上搜索。

1、数据库系统概论数据库系统概论AnIntroductiontoDatabaseSystem第六章第六章 数据库设计数据库设计第六章第六章 数据库设计数据库设计6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结6.1 数据库设计概述数据库设计概述6.1.1 数据库和信息系统6.1.2 数据库设计的特点6.1.3 数据库设计方法简述6.1.4 数据库设计的基本步骤数据库设计概述(续)数据库设计概述(续)n什么是数据库设计n数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其

2、应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求)n在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。6.1.1 数据库和信息系统数据库和信息系统n数据库是信息系统的核心和基础n把信息系统中大量的数据按一定的模型组织起来n提供存储、维护、检索数据的功能n使信息系统可以方便、及时、准确地从数据库中获得所需的信息n数据库是信息系统的各个部分能否紧密地结合在一起以及如何结合的关键所在n数据库设计是信息系统开发和建设的重要组成部分数据库设计人员应该具备的技术和知识数据库设计人员应该具备的技术和知识n数据库的基本知识和数据库设计技术n计算机科学的基础知识和程序设

3、计的方法和技巧n软件工程的原理和方法n应用领域的知识6.1 数据库设计概述数据库设计概述6.1.1 数据库和信息系统6.1.2 数据库设计的特点6.1.3 数据库设计方法简述6.1.4 数据库设计的基本步骤6.1.2 数据库设计的特点数据库设计的特点n数据库建设是硬件、软件和干件的结合n三分技术,七分管理,十二分基础数据n技术与管理的界面称之为“干件”n 数据库设计应该与应用系统设计相结合n结构(数据)设计:设计数据库框架或数据库结构n行为(处理)设计:设计应用程序、事务处理等数据库设计的特点(续)数据库设计的特点(续)n结构和行为分离的设计n传统的软件工程忽视对应用中数据语义的分析和抽象,只

4、要有可能就尽量推迟数据结构设计的决策n早期的数据库设计致力于数据模型和建模方法研究,忽视了对行为的设计数据库设计的特点(续)数据库设计的特点(续)现实世界现实世界概念模型设计概念模型设计子模式设计子模式设计物理数据库设计物理数据库设计逻辑数据库设计逻辑数据库设计建立数据库建立数据库数据分析数据分析功能分析功能分析功能模型功能模型功能说明功能说明事务设计事务设计程序说明程序说明应用程序设计应用程序设计程序编码调试程序编码调试6.1 数据库设计概述数据库设计概述6.1.1 数据库和信息系统6.1.2 数据库设计的特点6.1.3 数据库设计方法简述6.1.4 数据库设计的基本步骤6.1.3 数据库设

5、计方法简述数据库设计方法简述n手工试凑法n设计质量与设计人员的经验和水平有直接关系n缺乏科学理论和工程方法的支持,工程的质量难以保证n数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价数据库设计方法简述(续)数据库设计方法简述(续)n规范设计法n手工设计方法n基本思想n过程迭代和逐步求精数据库设计方法简述(续)数据库设计方法简述(续)n规范设计法(续)n典型方法n新奥尔良(New Orleans)方法n 将数据库设计分为四个阶段nS.B.Yao方法n将数据库设计分为五个步骤nI.R.Palmer方法n把数据库设计当成一步接一步的过程数据库设计方法简述(续)数据库设计方法简述(续)

6、n计算机辅助设计nORACLE Designer 2000nSYBASE PowerDesigner6.1 数据库设计概述数据库设计概述6.1.1 数据库和信息系统6.1.2 数据库设计的特点6.1.3 数据库设计方法简述6.1.4 数据库设计的基本步骤6.1.4 数据库设计的基本步骤数据库设计的基本步骤一、数据库设计的准备工作 选定参加设计的人员1. 数据库分析设计人员n数据库设计的核心人员n自始至终参与数据库设计n其水平决定了数据库系统的质量6.1.4 数据库设计的基本步骤数据库设计的基本步骤2. 用户n在数据库设计中也是举足轻重的n主要参加需求分析和数据库的运行维护n用户积极参与带来的好

7、处n加速数据库设计n提高数据库设计的质量数据库设计的基本步骤(续)数据库设计的基本步骤(续)3. 程序员n在系统实施阶段参与进来,负责编制程序4. 操作员n在系统实施阶段参与进来,准备软硬件环境数据库设计的基本步骤(续)数据库设计的基本步骤(续)二、数据库设计的过程(六个阶段) 需求分析阶段n准确了解与分析用户需求(包括数据与处理)n是整个设计过程的基础,是最困难、最耗费时间的一步数据库设计的基本步骤(续)数据库设计的基本步骤(续)概念结构设计阶段n是整个数据库设计的关键n通过对用户需求进行综合、归纳与抽象,形成一个独立于具体DBMS的概念模型数据库设计的基本步骤(续)数据库设计的基本步骤(续

8、)逻辑结构设计阶段n将概念结构转换为某个DBMS所支持的数据模型n对其进行优化数据库设计的基本步骤(续)数据库设计的基本步骤(续)数据库物理设计阶段n为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)数据库设计的基本步骤(续)数据库设计的基本步骤(续)数据库实施阶段n运用DBMS提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果n建立数据库n编制与调试应用程序n组织数据入库n并进行试运行数据库设计的基本步骤(续)数据库设计的基本步骤(续)数据库运行和维护阶段n数据库应用系统经过试运行后即可投入正式运行。n在数据库系统运行过程中必须不断地对其进行评价、调整与修改。

9、数据库设计的基本步骤(续)数据库设计的基本步骤(续) 设计一个完善的数据库应用系统往往是上述六个阶段的不断反复。 P206图6.2设计特点设计特点n在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来n将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计n设计过程各个阶段的设计描述:P208图6.3IPO表输入:输出:处理:CreatLoadMain()ifthenend分区1分区2概念结概念结构设计构设计逻辑逻辑结构结构设计设计物理物理设计设计设设计计阶阶段段设设计计描描述述数数据据处处理理需需 求求分分析析数据字典、全系统中数据项、

10、数据字典、全系统中数据项、数据流、数据存储的描述数据流、数据存储的描述数数据据流流图图和和判判定定表表(判判定定树树)、数数据字典中处理过程的描述据字典中处理过程的描述概念模型(概念模型(E-R图)图)数据字典数据字典系统说明书包括:系统说明书包括:新系统要求、新系统要求、方案和概图方案和概图反映新系统信息反映新系统信息流的数据流图流的数据流图某种数据模型某种数据模型关系关系非关系非关系系统结构图系统结构图(模块结构)(模块结构)存储安排存储安排方法选择方法选择存取路径建立存取路径建立模块设计模块设计IPO表表实施实施阶段阶段编写模式编写模式装入数据装入数据数据库试运行数据库试运行程序编码、程

11、序编码、编译联结、编译联结、测试测试运运行行、维护维护性能监测、转储性能监测、转储/恢复恢复数据库重组和重构数据库重组和重构新新旧旧系系统统转转换换、运运行行、维维护护(修修正正性性、适应性、改善性维护)适应性、改善性维护)数据库设计的基本步骤(续)数据库设计的基本步骤(续)n数据库各级模式的形成过程(P209图6.4)n需求分析阶段n 综合各个用户的应用需求n概念设计阶段n 形成独立于机器特点,独立于各个DBMS产品的概念模式(E-R图)数据库设计的基本步骤(续)数据库设计的基本步骤(续)n逻辑设计阶段n首先将E-R图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式n然后

12、根据用户处理的要求、安全性的考虑,在基本表的基础上再建立必要的视图(View),形成数据的外模式数据库设计的基本步骤(续)数据库设计的基本步骤(续)n物理设计阶段n根据DBMS特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式第六章第六章 数据库设计数据库设计6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结6.2 需求分析需求分析6.2.1 需求分析的任务6.2.2 需求分析的方法6.2.3 数据字典需求分析(续)需求分析(续)n需求分析就是分析用户的需要与要求n需求分析是设

13、计数据库的起点n需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用6.2 需求分析需求分析6.2.1 需求分析的任务6.2.2 需求分析的方法6.2.3 数据字典6.2.1 需求分析的任务需求分析的任务一、需求分析的任务二、需求分析的重点三、需求分析的难点一、需求分析的任务一、需求分析的任务n 通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求n 在此基础上确定新系统的功能。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库二、需求分析的重点

14、二、需求分析的重点n需求分析的重点是调查、收集与分析用户在数据管理中的信息要求、处理要求、安全性与完整性要求。n 信息要求n用户需要从数据库中获得信息的内容与性质n由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据需求分析的重点(续)需求分析的重点(续)n处理要求n对处理功能的要求n对处理的响应时间的要求n对处理方式的要求(批处理 / 联机处理)n新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求。三、需求分析的难点三、需求分析的难点n确定用户最终需求的难点n用户缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求

15、,他们所提出的需求往往不断地变化。n设计人员缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。n新的硬件、软件技术的出现也会使用户需求发生变化。需求分析的难点需求分析的难点(续续)n解决方法n设计人员必须采用有效的方法,与用户不断深入地进行交流,才能逐步得以确定用户的实际需求6.2 需求分析需求分析6.2.1 需求分析的任务6.2.2 需求分析的方法6.2.3 数据字典6.2.2 需求分析的方法需求分析的方法n调查清楚用户的实际需求并进行初步分析n 与用户达成共识n 进一步分析与表达这些需求一、一、 调查与初步分析用户需求调查与初步分析用户需求 调查组织机构情况n 组织部门的组成

16、情况n 各部门的职责等调查与初步分析用户需求(续)调查与初步分析用户需求(续) 调查各部门的业务活动情况。调查重点之一。n 各个部门输入和使用什么数据n 如何加工处理这些数据n 输出什么信息n 输出到什么部门n 输出结果的格式是什么调查与初步分析用户需求(续)调查与初步分析用户需求(续) 在熟悉业务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。n 信息要求n 处理要求n 完全性与完整性要求调查与初步分析用户需求(续)调查与初步分析用户需求(续) 对前面调查的结果进行初步分析n确定新系统的边界n确定哪些功能由计算机完成或将来准备让计算机完成n确定哪些活动由人工完成 由计算机完成的功

17、能就是新系统应该实现的功能。二、常用调查方法二、常用调查方法n做需求调查时,往往需要同时采用多种方法n无论使用何种调查方法,都必须有用户的积极参与和配合n设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果共同承担责任常用调查方法(续)常用调查方法(续)n常用调查方法跟班作业n通过亲身参加业务工作了解业务活动的情况n能比较准确地理解用户的需求,但比较耗时开调查会n通过与用户座谈来了解业务活动情况及用户需求请专人介绍常用调查方法(续)常用调查方法(续)询问n对某些调查中的问题,可以找专人询问设计调查表请用户填写n如果调查表设计合理,则很有效,

18、且易于为用户接受查阅记录n查阅与原系统有关的数据记录三、进一步分析和表达用户需求三、进一步分析和表达用户需求n分析和表达用户的需求的常用方法n自顶向下的结构化分析方法(Structured Analysis,简称SA方法)nSA方法从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并用数据流图和数据字典描述系统。进一步分析和表达用户需求(续)进一步分析和表达用户需求(续)1首先把任何一个系统都抽象为:数据流数据流数据流数据流数据数据存储存储信息要求信息要求数据数据来源来源处理处理数据数据输出输出处理要求处理要求进一步分析和表达用户需求(续)进一步分析和表达用户需求(续)2分解处理功能和数

19、据(1)分解处理功能n将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。(2)分解数据n在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图n 数据流图表达了数据和处理过程的关系进一步分析和表达用户需求(续)进一步分析和表达用户需求(续)(3)表达方法n 处理过程:用判定表或判定树来描述n 数据:用数据字典来描述 进一步分析和表达用户需求(续)进一步分析和表达用户需求(续)3将分析结果再次提交给用户,征得用户的认可四、需求分析小结四、需求分析小结nP211图6.6需求分析小结(续)需求分析小结(续)实例:假设我们要开发一个学校管

20、理系统。1经过可行性分析和初步需求调查,抽象出该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。2进一步细化各个子系统。其中学生管理子系统开发小组通过进行进一步的需求调查,明确了该子系统的主要功能是进行学籍管理和课程管理,包括学生报到、入学、毕业的管理,学生上课情况的管理。通过详细的信息流程分析和数据收集后,他们生成了该子系统的数据流图。6.2 需求分析需求分析6.2.1 需求分析的任务6.2.2 需求分析的方法6.2.3 数据字典6.2.3 数据字典数据字典一、数据字典的用途二、数据字典的内容一、数据字典的用途一、数据字典的用途

21、n数据字典是各类数据描述的集合n数据字典是进行详细的数据收集和数据分析所获得的主要结果n数据字典在数据库设计中占有很重要的地位二、数据字典的内容二、数据字典的内容n数据字典的内容n数据项n数据结构n数据流n数据存储n处理过程n 数据项是数据的最小组成单位n 若干个数据项可以组成一个数据结构n 数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。 数据项数据项n数据项是不可再分的数据单位n 对数据项的描述数据项描述数据项名,数据项含义说明, 别名,数据类型,长度,取值范围, 取值含义,与其他数据项的逻辑关系n取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件 数据结构数

22、据结构n数据结构反映了数据之间的组合关系。n 一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。n 对数据结构的描述数据结构描述数据结构名,含义说明, 组成:数据项或数据结构 数据流数据流n 数据流是数据结构在系统内传输的路径。n 对数据流的描述数据流描述数据流名,说明,数据流来源, 数据流去向,组成:数据结构, 平均流量,高峰期流量n数据流来源是说明该数据流来自哪个过程n数据流去向是说明该数据流将到哪个过程去n平均流量是指在单位时间(每天、每周、每月等)里的传输次数n高峰期流量则是指在高峰时期的数据流量 数据存储数据存储n数据存储是数据结构停

23、留或保存的地方,也是数据流的来源和去向之一。n对数据存储的描述数据存储描述数据存储名,说明,编号, 流入的数据流 ,流出的数据流 , 组成:数据结构,数据量,存取方式n流入的数据流:指出数据来源n流出的数据流:指出数据去向n数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息n存取方法:批处理 / 联机处理;检索 / 更新;顺序检索 / 随机检索 处理过程处理过程n处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息n处理过程说明性信息的描述处理过程描述处理过程名,说明, 输入:数据流,输出:数据流, 处理:简要说明处理过程(续)处理过程(续)

24、n简要说明:主要说明该处理过程的功能及处理要求n功能:该处理过程用来做什么n处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等n处理要求是后面物理设计的输入及性能评价的标准处理过程(续)处理过程(续)例:学生学籍管理子系统的数据字典。数据项,以“学号”为例: 数据项:学号 含义说明:唯一标识每个学生别名:学生编号 类型:字符型 长度: 8 取值范围:00000000至99999999取值含义:前两位标别该学生所在年级, 后六位按顺序编号与其他数据项的逻辑关系:处理过程(续处理过程(续)数据结构 以“学生”为例 “学生”是该系统中的一个核心数据结构: 数据结构:学生

25、含义说明:是学籍管理子系统的主体数据结 构,定义了一个学生的有关信息 组成:学号,姓名,性别,年龄, 所在系,年级处理过程(续)处理过程(续)数据流“体检结果”可如下描述: 数据流:体检结果 说明:学生参加体格检查的最终结果 数据流来源:体检 数据流去向:批准 组成:平均流量:高峰期流量:处理过程(续)处理过程(续)数据存储“学生登记表”可如下描述: 数据存储:学生登记表 说明:记录学生的基本情况流入数据流: 流出数据流: 组成: 数据量:每年3000张 存取方式:随机存取 处理过程(续)处理过程(续)处理过程“分配宿舍”可如下描述:处理过程:分配宿舍说明:为所有新生分配学生宿舍输入:学生,宿

26、舍,输出:宿舍安排处理:在新生报到后,为所有新生分配学 生宿舍。要求同一间宿舍只能安排 同一性别的学生,同一个学生只能 安排在一个宿舍中。每个学生的居 住面积不小于3平方米。安排新生 宿舍其处理时间应不超过15分钟。 下课了。下课了。休息一会儿。休息一会儿。数据库系统概论数据库系统概论AnIntroductiontoDatabaseSystem第六章第六章 数据库设计数据库设计( (续续-1)-1)6.3 概念结构设计概念结构设计6.3.1 概念结构设计概述6.3.2 概念结构设计的方法与步骤6.3.3 数据抽象与局部视图设计6.3.4 视图的集成6.3.1 概念结构概念结构n什么是什么是概念

27、结构设计概念结构设计n需求分析阶段描述的用户应用需求是现实世需求分析阶段描述的用户应用需求是现实世界的具体需求界的具体需求n将需求分析得到的用户需求抽象为信息结构将需求分析得到的用户需求抽象为信息结构即即概念模型概念模型的过程就是概念结构设计的过程就是概念结构设计n概念结构是各种数据模型的共同基础,它比概念结构是各种数据模型的共同基础,它比数据模型数据模型更独立于机器更独立于机器、更抽象,从而更加、更抽象,从而更加稳定。稳定。n概念结构设计是整个数据库设计的关键概念结构设计是整个数据库设计的关键概念结构(续)概念结构(续)现实世界现实世界机器世界机器世界信息世界信息世界需求分析需求分析概念结构

28、设计概念结构设计概念结构(续)概念结构(续)n概念结构设计的特点概念结构设计的特点(1)能真实、充分地反映现实世界,包括事物)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。要求。是对现实世界的一个真实模型。(2)易于理解易于理解,从而可以用它和不熟悉计算机,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的的用户交换意见,用户的积极参与是数据库的设计成功的关键。设计成功的关键。概念结构(续)概念结构(续)n概念结构设计的特点概念结构设计的特点(续续)(3)易于更改,当应用环境

29、和应用要求改变时,)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。容易对概念模型修改和扩充。(4)易于向关系、网状、层次易于向关系、网状、层次等各种数据模型等各种数据模型转换。转换。概念结构(续)概念结构(续)n描述概念模型的工具nE-R模型6.3 概念结构设计概念结构设计6.3.1 概念结构设计概述6.3.2 概念结构设计的方法与步骤6.3.3 数据抽象与局部视图设计6.3.4 视图的集成6.3.2 概念结构设计的方法与步骤概念结构设计的方法与步骤n设计概念结构的四类方法设计概念结构的四类方法n自顶向下自顶向下n 首先定义全局概念结构的框架,然后逐首先定义全局概念结构的框架

30、,然后逐步细化步细化n自底向上自底向上n 首先定义各局部应用的概念结构,然后首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构将它们集成起来,得到全局概念结构概念结构设计的方法与步骤(续)概念结构设计的方法与步骤(续)n逐步扩张逐步扩张n 首先定义最重要的核心概念结构,然后首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构概念结构,直至总体概念结构n混合策略混合策略n 将自顶向下和自底向上相结合,用自顶将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,向下策略设计一个全局概念结

31、构的框架,以它为骨架集成由自底向上策略中设计的以它为骨架集成由自底向上策略中设计的各局部概念结构。各局部概念结构。概念结构设计的方法与步骤(续)概念结构设计的方法与步骤(续) 自顶向下策略概念结构设计的方法与步骤(续)概念结构设计的方法与步骤(续) 自底向上策略 概念结构设计的方法与步骤(续)概念结构设计的方法与步骤(续) 逐步扩张逐步扩张概念结构设计的方法与步骤(续)概念结构设计的方法与步骤(续)n常用策略(P215图6.8)n自顶向下地进行需求分析n自底向上地设计概念结构n自底向上设计概念结构的步骤 (P216图6.9)n第1步:抽象数据并设计局部视图n第2步:集成局部视图,得到全局概念结

32、构6.3 概念结构设计概念结构设计6.3.1 概念结构设计概述6.3.2 概念结构设计的方法与步骤6.3.3 数据抽象与局部视图设计6.3.4 视图的集成6.3.3 数据抽象与局部视图设计数据抽象与局部视图设计n数据抽象n局部视图设计一、数据抽象一、数据抽象n概念结构是对现实世界的一种抽象n从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节n把这些特性用各种概念精确地加以描述n这些概念组成了某种模型数据抽象(续)数据抽象(续)n三种常用抽象1. 分类(Classification)n定义某一类概念作为现实世界中一组对象的类型n这些对象具有某些共同的特性和行为n它抽象了对象值和型之

33、间的“is member of”的语义n在E-R模型中,实体型就是这种抽象例:P216图6.10数据抽象(续)数据抽象(续)2. 聚集(Aggregation)n定义某一类型的组成成分n它抽象了对象内部类型和成分之间“is part of”的语义n在E-R模型中若干属性的聚集组成了实体型,就是这种抽象例:P217图6.11,图6.12数据抽象(续)数据抽象(续)3. 概括(Generalization)n定义类型之间的一种子集联系n它抽象了类型之间的“is subset of”的语义n概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象。 例:P217图6.13数据抽象(续)数据抽象(

34、续)注:原E-R模型不具有概括,本书对E-R模型作了扩充,允许定义超类实体型和子类实体型。n 用双竖边的矩形框表示子类,n 用直线加小圆圈表示超类-子类的联系数据抽象(续)数据抽象(续)n数据抽象的用途n对需求分析阶段收集到的数据进行分类、组织(聚集),形成n实体n实体的属性,标识实体的码n确定实体之间的联系类型(1:1,1:n,m:n)二、局部视图设计二、局部视图设计设计分E-R图的步骤:选择局部应用逐一设计分E-R图 选择局部应用选择局部应用n需求分析阶段,已用多层数据流图和数据字典描述了整个系统。n设计分E-R图首先需要根据系统的具体情况,在多层的数据流图中选择一个适当层次的数据流图,让

35、这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分E-R图。 选择局部应用(续)选择局部应用(续)例:由于学籍管理、课程管理等都不太复杂,因此可以它们入手设计学生管理子系统的分E-R图。如果局部应用比较复杂,则可以从更下层的数据流图入手。 逐一设计分逐一设计分E-R图图n任务n标定局部应用中的实体、属性、码,实体间的联系n将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型(1:1,1:n,m:n)逐一设计分逐一设计分E-R图(续)图(续)n如何抽象实体和属性如何抽象实体和属性n实体实

36、体:现实世界中一组具有某些共同特性和:现实世界中一组具有某些共同特性和行为的对象就可以抽象为一个实体。对象和行为的对象就可以抽象为一个实体。对象和实体之间是实体之间是“is member of的关系。的关系。 例:在学校环境中,可把张三、李四等对象抽例:在学校环境中,可把张三、李四等对象抽象为学生实体。象为学生实体。逐一设计分逐一设计分E-R图(续)图(续)n属性属性:对象类型的:对象类型的组成成分组成成分可以抽象为实体可以抽象为实体的属性。组成成分与对象类型之间是的属性。组成成分与对象类型之间是“is part of的关系。的关系。例:学号、姓名、专业、年级等可以抽象为学例:学号、姓名、专业

37、、年级等可以抽象为学生实体的属性。其中学号为标识学生实体的码。生实体的属性。其中学号为标识学生实体的码。逐一设计分逐一设计分E-R图(续)图(续)n如何区分实体和属性如何区分实体和属性n实体与属性是相对而言的实体与属性是相对而言的。同一事物,在一种。同一事物,在一种应用环境中作为应用环境中作为“属性属性”,在另一种应用环境,在另一种应用环境中就必须作为中就必须作为“实体实体”。例:学校中的系,在某种应用环境中,它只是例:学校中的系,在某种应用环境中,它只是作为作为“学生学生”实体的一个属性,表明一个学生实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考属于哪个系;而在另一种环

38、境中,由于需要考虑一个系的系主任、教师人数、学生人数、办虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。公地点等,这时它就需要作为实体了。逐一设计分逐一设计分E-R图(续)图(续)n一般原则一般原则n属性不能再具有需要描述的性质。即属性属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些必须是不可分的数据项,不能再由另一些属性组成。属性组成。n属性不能与其他实体具有联系。联系只发属性不能与其他实体具有联系。联系只发生在实体之间。生在实体之间。n符合上述两条特性的事物一般作为属性对待。符合上述两条特性的事物一般作为属性对待。n为了简化为了简化E-R图

39、的处置,现实世界中的事物图的处置,现实世界中的事物凡能够作为属性对待的,应尽量作为属性。凡能够作为属性对待的,应尽量作为属性。逐一设计分逐一设计分E-R图(续)图(续)n举例举例例例1:“学生学生”由学号、姓名等属性进一步描述,由学号、姓名等属性进一步描述,根据准则,根据准则,“学生学生”只能作为实体,不能只能作为实体,不能作为属性。作为属性。例例2:职称通常作为教师实体的属性,但在涉及:职称通常作为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,也就是住房分配时,由于分房与职称有关,也就是说职称与住房实体之间有联系,根据准则,说职称与住房实体之间有联系,根据准则,这时把职称作为实体来

40、处理会更合适些。这时把职称作为实体来处理会更合适些。(教程(教程194图图6-10)逐一设计分逐一设计分E-R图(续)图(续)n设计分E-R图的步骤n(1)以数据字典为出发点定义E-R图。n 数据字典中的“数据结构”、“数据流”和“数据存储”等已是若干属性的有意义的聚合n(2)按上面给出的准则进行必要的调整。逐一设计分逐一设计分E-R图(续)图(续)例:学籍管理局部应用中主要涉及的实体包括学生、宿舍、档案材料、班级、班主任。实体之间的联系:n由于一个宿舍可以住多个学生,而一个学生只能住在某一个宿舍中,因此宿舍与学生之间是1:n的联系。n由于一个班级往往有若干名学生,而一个学生只能属于一个班级,

41、因此班级与学生之间也是1:n的联系。逐一设计分逐一设计分E-R图(续)图(续)n由于班主任同时还要教课,因此班主任与学生之间存在指导联系,一个班主任要教多名学生,而一个学生只对应一个班主任,因此班主任与学生之间也是1:n的联系。n而学生和他自己的档案材料之间,班级与班主任之间都是1:1的联系。学籍管理局部应用的分E-R图草图:教程195图611逐一设计分逐一设计分E-R图(续)图(续) 接下来需要进一步斟酌该接下来需要进一步斟酌该E-R图,做适当调整。图,做适当调整。n(1) 在一般情况下,性别通常作为学生实体的在一般情况下,性别通常作为学生实体的属性,但在本局部应用中,由于宿舍分配与学属性,

42、但在本局部应用中,由于宿舍分配与学生性别有关,根据准则,应该把性别作为实生性别有关,根据准则,应该把性别作为实体对待。体对待。n(2) 数据存储数据存储“学生登记表学生登记表”,由于是手工填,由于是手工填写,供存档使用,其中有用的部分已转入学生写,供存档使用,其中有用的部分已转入学生档案材料中,因此这里就不必作为实体了。档案材料中,因此这里就不必作为实体了。最后得到学籍管理局部应用的分最后得到学籍管理局部应用的分E-R图:教程图:教程195如图如图6-12。逐一设计分逐一设计分E-R图(续)图(续)该该E-R图中省略了各个实体的属性描述:图中省略了各个实体的属性描述:学生:学生:学号学号,姓名

43、,出生日期,姓名,出生日期性别:性别:性别性别档案材料:档案材料:档案号档案号, 班级:班级:班级号班级号,学生人数,学生人数班主任:班主任:职工号职工号,姓名,性别,姓名,性别, 是否为优秀班主任是否为优秀班主任 宿舍:宿舍:宿舍编号宿舍编号,地址,人数,地址,人数 其中有下划线的属性为实体的码。其中有下划线的属性为实体的码。逐一设计分逐一设计分E-R图(续)图(续)同样方法可以得到课程管理局部应用的分同样方法可以得到课程管理局部应用的分E-R图,图,(图(图6-13)各实体的属性分别为:各实体的属性分别为:学生:姓名,学生:姓名,学号学号,性别,年龄,所在系,性别,年龄,所在系, 年级,平

44、均成绩年级,平均成绩课程:课程:课程号课程号,课程名,学分,课程名,学分教师:教师:职工号职工号,姓名,性别,职称,姓名,性别,职称教科书:教科书:书号书号,书名,价钱,书名,价钱教室:教室:教室编号教室编号,地址,容量,地址,容量题目题目n设有一局部应用,包括设有一局部应用,包括3个实体,个实体,“科室科室”、“医医生生”和和“病人病人”,且有以下事实:,且有以下事实:n每位医生属于且仅属于一个科室;每个科室有多每位医生属于且仅属于一个科室;每个科室有多位医生可接诊病人;病人根据自己的症状选择相位医生可接诊病人;病人根据自己的症状选择相应的科室就诊;一位病人在同一科室中多次看病应的科室就诊;

45、一位病人在同一科室中多次看病时,每次可能由不同的医生为其诊断。时,每次可能由不同的医生为其诊断。n设科室的属性包括科室代码、科室名称,医生的设科室的属性包括科室代码、科室名称,医生的属性包括工号、姓名、职称,病人的属性包括姓属性包括工号、姓名、职称,病人的属性包括姓名、年龄、工作单位,试设计局部名、年龄、工作单位,试设计局部ER图。图。6.3 概念结构设计概念结构设计6.3.1 概念结构概念结构6.3.2 概念结构设计的方法与步骤概念结构设计的方法与步骤6.3.3 数据抽象与局部视图设计数据抽象与局部视图设计6.3.4 视图的集成视图的集成6.3.4 视图的集成视图的集成n各个局部视图即各个局

46、部视图即分分E-R图图建立好后,还需建立好后,还需要对它们进行要对它们进行合并合并,集成为一个整体的,集成为一个整体的数据概念结构即数据概念结构即总总E-R图图。视图的集成(续)视图的集成(续)n视图集成的两种方式n一次集成(P224图6.25(a))n一次集成多个分E-R图n通常用于局部视图比较简单时n逐步累积式(P224图6.25(b))n首先集成两个局部视图(通常是比较关键的两个局部视图)n以后每次将一个新的局部视图集成进来视图的集成(续)视图的集成(续)n集成局部集成局部E-R图的步骤图的步骤1. 合并合并2. 修改与重构修改与重构视图的集成(续)视图的集成(续)一、合并分一、合并分E

47、-R图,生成初步图,生成初步E-R图图n各分图存在冲突n各个局部应用所面向的问题不同由不同的设计人员进行设计各个分E-R图之间必定会存在许多不一致的地方n合并分E-R图的主要工作与关键所在:合理消除各分E-R图的冲突合并分合并分E-R图,生成初步图,生成初步E-R图(续)图(续)n冲突的种类n属性冲突属性冲突n命名冲突命名冲突n结构冲突结构冲突 属性冲突属性冲突n两类属性冲突两类属性冲突n属性域冲突属性域冲突:属性值的类型、取值范围或取:属性值的类型、取值范围或取值集合不同。值集合不同。例例1, 由于学号是数字,因此由于学号是数字,因此某些部门某些部门(即局(即局部应用)将学号定义为整数形式,

48、而由于学号部应用)将学号定义为整数形式,而由于学号不用参与运算,因此不用参与运算,因此另一些部门另一些部门(即局部应用)(即局部应用)将学号定义为字符型形式。将学号定义为字符型形式。例例2, 某些部门(即局部应用)以出生日期形某些部门(即局部应用)以出生日期形式表示学生的年龄,而另一些部门(即局部应式表示学生的年龄,而另一些部门(即局部应用)用整数形式表示学生的年龄。用)用整数形式表示学生的年龄。属性冲突(续)属性冲突(续)n属性取值单位冲突属性取值单位冲突。例:学生的身高,有的以米为单位,有的以厘例:学生的身高,有的以米为单位,有的以厘米为单位,有的以尺为单位。米为单位,有的以尺为单位。属性

49、冲突(续)属性冲突(续)n属性冲突的解决方法属性冲突的解决方法n通常用讨论、协商等行政手段加以解决通常用讨论、协商等行政手段加以解决 命名冲突命名冲突n两类命名冲突两类命名冲突n同名异义同名异义:不同意义的对象在不同的局部应:不同意义的对象在不同的局部应用中具有相同的名字用中具有相同的名字 例,局部应用例,局部应用A中将教室称为房间中将教室称为房间 局部应用局部应用B中将学生宿舍称为房间中将学生宿舍称为房间n异名同义(一义多名)异名同义(一义多名):同一意义的对象在:同一意义的对象在不同的局部应用中具有不同的名字不同的局部应用中具有不同的名字 例,有的部门把教科书称为课本例,有的部门把教科书称

50、为课本 有的部门则把教科书称为教材有的部门则把教科书称为教材命名冲突(续)命名冲突(续)n命名冲突可能发生在属性级、实体级、命名冲突可能发生在属性级、实体级、联系级上。其中属性的命名冲突更为常联系级上。其中属性的命名冲突更为常见。见。n命名冲突的解决方法命名冲突的解决方法n通过讨论、协商等行政手段加以解决通过讨论、协商等行政手段加以解决 结构冲突结构冲突n三类结构冲突三类结构冲突n同一对象在不同应用中具有不同的抽象同一对象在不同应用中具有不同的抽象 例,例,“课程课程”在某一局部应用中被当作实体在某一局部应用中被当作实体 在另一局部应用中则被当作属性在另一局部应用中则被当作属性n解决方法:通常

51、是把属性变换为实体或把解决方法:通常是把属性变换为实体或把实体变换为属性,使同一对象具有相同的实体变换为属性,使同一对象具有相同的抽象。变换时要遵循两个准则。抽象。变换时要遵循两个准则。结构冲突(续)结构冲突(续)n同一实体在不同局部视图中所包含的属性不同一实体在不同局部视图中所包含的属性不完全相同,或者属性的排列次序不完全相同完全相同,或者属性的排列次序不完全相同。n产生原因:不同的局部应用关心的是该实产生原因:不同的局部应用关心的是该实体的不同侧面。体的不同侧面。n解决方法:使该实体的属性取各分解决方法:使该实体的属性取各分E-R图图中属性的并集,再适当设计属性的次序中属性的并集,再适当设

52、计属性的次序。结构冲突(续)结构冲突(续)学生学生学号学号姓名姓名性别性别平均成绩平均成绩(a)在局部应用在局部应用A中中结构冲突(续)结构冲突(续)学生学生学号学号姓名姓名出生日期出生日期年级年级(b)在局部应用在局部应用B中中所在系所在系结构冲突(续)结构冲突(续)学生学生学号学号姓名姓名政治面貌政治面貌(c)在局部应用在局部应用C中中结构冲突(续)结构冲突(续)学生学生政治政治面貌面貌学号学号出生出生日期日期年级年级(d)合并后合并后所在系所在系平均平均成绩成绩姓名姓名性别性别结构冲突(续)结构冲突(续)n实体之间的联系在不同局部视图中呈现不同的类实体之间的联系在不同局部视图中呈现不同的

53、类型型例例1, 实体实体E1与与E2在局部应用在局部应用A中是多对多联系,中是多对多联系,而在局部应用而在局部应用B中是一对多联系中是一对多联系例例2, 在局部应用在局部应用X中中E1与与E2发生联系,而在局发生联系,而在局部应用部应用Y中中E1、E2、E3三者之间有联系。三者之间有联系。n解决方法:根据应用语义对实体联系的类型进解决方法:根据应用语义对实体联系的类型进行综合或调整。行综合或调整。(P226图图6.27)合并分合并分E-R图,生成初步图,生成初步E-R图实例图实例例:生成学校管理系统的初步例:生成学校管理系统的初步E-R图图以合并学籍管理局部视图以合并学籍管理局部视图, 课程管

54、理局部视图为课程管理局部视图为例例这两个分这两个分E-R图存在着多方面的冲突:图存在着多方面的冲突:合并分合并分E-R图,生成初步图,生成初步E-R图实例图实例(1) 班主任实际上也属于教师,也就是说学籍管班主任实际上也属于教师,也就是说学籍管理中的班主任实体与课程管理中的教师实体在理中的班主任实体与课程管理中的教师实体在一定程度上属于异名同义,可以应将学籍管理一定程度上属于异名同义,可以应将学籍管理中的班主任实体与课程管理中的教师实体统一中的班主任实体与课程管理中的教师实体统一称为教师,统一后教师实体的属性构成为:称为教师,统一后教师实体的属性构成为:教师:教师:职工号职工号,姓名,性别,职

55、称,姓名,性别,职称, 是否为优秀班主任是否为优秀班主任合并分合并分E-R图,生成初步图,生成初步E-R图实例(续)图实例(续)(2) 将班主任改为教师后,教师与学生之间的联将班主任改为教师后,教师与学生之间的联系在两个局部视图中呈现两种不同的类型,一系在两个局部视图中呈现两种不同的类型,一种是学籍管理中教师与学生之间的指导联系,种是学籍管理中教师与学生之间的指导联系,一种是课程管理中教师与学生之间的教学联系,一种是课程管理中教师与学生之间的教学联系,由于指导联系实际上可以包含在教学联系之中,由于指导联系实际上可以包含在教学联系之中,因此可以将这两种联系综合为教学联系。因此可以将这两种联系综合

56、为教学联系。合并分合并分E-R图,生成初步图,生成初步E-R图实例(续)图实例(续)(3) 性别在两个局部应用中具有不同的抽象,它性别在两个局部应用中具有不同的抽象,它在学籍管理中为实体,在课程管理中为属性,在学籍管理中为实体,在课程管理中为属性,按照前面提到的两个原则,在合并后的按照前面提到的两个原则,在合并后的E-R图图中性别只能作为实体,否则它无法与宿舍实体中性别只能作为实体,否则它无法与宿舍实体发生联系。发生联系。合并分合并分E-R图,生成初步图,生成初步E-R图实例(续)图实例(续)(4) 在两个局部在两个局部E-R图中,学生实体属性组成及图中,学生实体属性组成及次序都存在差异,应将

57、所有属性综合,并重新次序都存在差异,应将所有属性综合,并重新调整次序。假设调整结果为:调整次序。假设调整结果为:学生:学生:学号学号,姓名,出生日期,年龄,所在,姓名,出生日期,年龄,所在系,年级,平均成绩系,年级,平均成绩解决上述冲突后,学籍管理分解决上述冲突后,学籍管理分E-R图与课程管图与课程管理分理分E-R图合并为图合并为198图图6-16的形式。的形式。二、修改与重构二、修改与重构n基本任务n消除不必要的冗余,设计生成基本E-R图合并合并初步初步E-R图图分分E-R图图可能存在冗余的数据可能存在冗余的数据和冗余的实体间联系和冗余的实体间联系基本基本E-R图图消除不必要的冗余消除不必要

58、的冗余修改与重构(续)修改与重构(续)1冗余冗余2消除冗余的方法消除冗余的方法1冗余冗余n冗余的数据是指可由基本数据导出的数据,冗余的数据是指可由基本数据导出的数据,冗余的联系是指可由其他联系导出的联系。冗余的联系是指可由其他联系导出的联系。 n冗余数据和冗余联系容易破坏数据库的完整性,冗余数据和冗余联系容易破坏数据库的完整性,给数据库维护增加困难给数据库维护增加困难n并不是所有的冗余数据与冗余联系都必须加以并不是所有的冗余数据与冗余联系都必须加以消除,有时为了提高某些应用的效率,不得不消除,有时为了提高某些应用的效率,不得不以冗余信息作为代价。以冗余信息作为代价。 冗余(续)冗余(续)n设计

59、数据库概念结构时,哪些冗余信息必须消设计数据库概念结构时,哪些冗余信息必须消除,哪些冗余信息允许存在,需要根据用户的除,哪些冗余信息允许存在,需要根据用户的整体需求来确定。整体需求来确定。n消除不必要的冗余后的初步消除不必要的冗余后的初步E-R图称为基本图称为基本E-R图。图。2消除冗余的方法消除冗余的方法n分析方法分析方法n以数据字典和数据流图为依据,根据数据字以数据字典和数据流图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除典中关于数据项之间逻辑关系的说明来消除冗余。冗余。 消除冗余的方法消除冗余的方法(续续)例,教师工资单中包括该教师的基本工资、各例,教师工资单中包括该教师的基

60、本工资、各种补贴、应扣除的房租水电费以及实发工资。种补贴、应扣除的房租水电费以及实发工资。由于实发工资可以由前面各项推算出来,因此由于实发工资可以由前面各项推算出来,因此可以去掉,在需要查询实发工资时根据基本工可以去掉,在需要查询实发工资时根据基本工资、各种补贴、应扣除的房租水电费数据临时资、各种补贴、应扣除的房租水电费数据临时生成。生成。消除冗余的方法(续)消除冗余的方法(续)n如果是为了提高效率,人为地保留了一些冗如果是为了提高效率,人为地保留了一些冗余数据,则应把数据字典中数据关联的说明余数据,则应把数据字典中数据关联的说明作为完整性约束条件。作为完整性约束条件。n一种更好的方法是把冗余

61、数据定义在视图中一种更好的方法是把冗余数据定义在视图中消除冗余的方法(续)消除冗余的方法(续)n规范化理论规范化理论n函数依赖的概念提供了消除冗余联系的形式函数依赖的概念提供了消除冗余联系的形式化工具化工具消除冗余的方法(续)消除冗余的方法(续)n方法方法1. 确定分确定分E-R图实体之间的数据依赖图实体之间的数据依赖FL 。实实体之间一对一、一对多、多对多的联系可以体之间一对一、一对多、多对多的联系可以用实体码之间的函数依赖来表示。用实体码之间的函数依赖来表示。例:例:班级和学生之间一对多的联系:班级和学生之间一对多的联系: 学号学号班级号班级号学生和课程之间多对多的联系:学生和课程之间多对

62、多的联系: (学号,课程号)(学号,课程号) 成绩成绩消除冗余的方法(续)消除冗余的方法(续)2. 求求FL的最小覆盖的最小覆盖GL ,差集为差集为 D = FL-GL。 逐一考察逐一考察D中的函数依赖,确定是否是冗余中的函数依赖,确定是否是冗余的联系,若是,就把它去掉。的联系,若是,就把它去掉。消除冗余的方法(续)消除冗余的方法(续)n由于规范化理论受到泛关系假设的限制,应由于规范化理论受到泛关系假设的限制,应注意下面两个问题:注意下面两个问题:1.冗余的联系一定在冗余的联系一定在D中,而中,而D中的联系不一中的联系不一定是冗余的;定是冗余的;2.当实体之间存在多种联系时要将实体之间的当实体

63、之间存在多种联系时要将实体之间的联系在形式上加以区分。联系在形式上加以区分。例例P229图图6.30中中部门和职工之间两种联系表示为:部门和职工之间两种联系表示为:负责人负责人.职工号职工号部门号部门号部门号部门号负责人负责人.职工号职工号泛关系假设泛关系假设n假设存在着一个单一的关系模式假设存在着一个单一的关系模式 “假假设设已已知知一一个个模模式式S,它它仅仅由由单单个个关关系系模模式式组组成成,问问题题是是要要设设计计一一个个模模式式SD,它它与与S等价等价,但在某些方面更好一些,但在某些方面更好一些”n从从一一个个关关系系模模式式出出发发,而而不不是是从从一一组组关关系系模模式出发实行

64、分解式出发实行分解n“等等价价”的的定定义义也也是是一一组组关关系系模模式式与与一一个个关关系模式的系模式的“等价等价”泛关系假设泛关系假设(续续)n泛关系假设是运用规范化理论时的障碍泛关系假设是运用规范化理论时的障碍n承承认认了了泛泛关关系系假假设设,就就等等于于承承认认了了现现实实世世界界各实体间只能有一种联系各实体间只能有一种联系消除冗余,设计生成基本消除冗余,设计生成基本E-R图实例图实例教程教程198图图6-16的初步的初步E-R图中存在着冗余图中存在着冗余数据和冗余联系:数据和冗余联系:(1) 学生实体中的年龄属性可以由出生日期推学生实体中的年龄属性可以由出生日期推算出来,属于冗余

65、数据,应该去掉。这样不仅算出来,属于冗余数据,应该去掉。这样不仅可以节省存储空间,而且当某个学生的出生日可以节省存储空间,而且当某个学生的出生日期有误,进行修改后,无须相应修改年龄,减期有误,进行修改后,无须相应修改年龄,减少了产生数据不一致的机会。少了产生数据不一致的机会。学生:学生:学号学号,姓名,出生日期,所在系,姓名,出生日期,所在系, 年级,平均成绩年级,平均成绩消除冗余,设计生成基本消除冗余,设计生成基本E-R图实例(续)图实例(续)(2) 教室实体与班级实体的上课联系可以由教室教室实体与班级实体的上课联系可以由教室与课程之间的开设联系、课程与学生之间的选与课程之间的开设联系、课程

66、与学生之间的选修联系、学生与班级之间的组成联系三者推导修联系、学生与班级之间的组成联系三者推导出来,因此属于冗余联系,可以消去。出来,因此属于冗余联系,可以消去。消除冗余,设计生成基本消除冗余,设计生成基本E-R图实例(续)图实例(续)(3) 学生实体中的平均成绩可以从选修联系中的学生实体中的平均成绩可以从选修联系中的成绩属性中推算出来成绩属性中推算出来n由于应用中需要经常查询某个学生的平均成由于应用中需要经常查询某个学生的平均成绩,每次都进行这种计算效率就会太低,因绩,每次都进行这种计算效率就会太低,因此为提高效率,保留该冗余数据此为提高效率,保留该冗余数据n但定义一个触发器来保证学生的平均

67、成绩等但定义一个触发器来保证学生的平均成绩等于该学生各科成绩的平均值。于该学生各科成绩的平均值。n任何一科成绩修改后,或该学生学了新的科任何一科成绩修改后,或该学生学了新的科目并有成绩后,就触发该触发器去修改该学目并有成绩后,就触发该触发器去修改该学生的平均成绩属性值。生的平均成绩属性值。消除冗余,设计生成基本消除冗余,设计生成基本E-R图实例(续)图实例(续) 教程200图17是对图16进行修改和重构后生成的基本E-R图。学生管理子系统的基本E-R图与教师管理子系统以及后勤管理子系统的基本E-R图合并后,生成整个学校管理系统的基本E-R图三、验证整体概念结构三、验证整体概念结构n视图集成后形

68、成一个整体的数据库概念结构,视图集成后形成一个整体的数据库概念结构,对该整体概念结构还必须进行进一步验证,确对该整体概念结构还必须进行进一步验证,确保它能够满足下列条件保它能够满足下列条件:n整体概念结构内部必须具有一致性,不存在整体概念结构内部必须具有一致性,不存在互相矛盾的表达。互相矛盾的表达。n整体概念结构能准确地反映原来的每个视图整体概念结构能准确地反映原来的每个视图结构,包括属性、实体及实体间的联系。结构,包括属性、实体及实体间的联系。n整体概念结构能满足需要分析阶段所确定的整体概念结构能满足需要分析阶段所确定的所有要求。所有要求。验证整体概念结构(续)验证整体概念结构(续)n整体概

69、念结构最终还应该提交给用户,整体概念结构最终还应该提交给用户,征求用户和有关人员的意见,进行评审、征求用户和有关人员的意见,进行评审、修改和优化,然后把它确定下来,作为修改和优化,然后把它确定下来,作为数据库的概念结构,作为进一步设计数数据库的概念结构,作为进一步设计数据库的依据据库的依据。数据库设计数据库设计n数据库的设计过程n需求分析n概念结构设计n逻辑结构设计n物理数据库设计n实施n运行维护设计过程中往往还会有许多反复。概念结构设计小结概念结构设计小结n什么是概念结构设计现实世界现实世界机器世界机器世界信息世界信息世界需求分析需求分析概念结构设计概念结构设计概念结构设计小结概念结构设计小

70、结n概念结构设计的步骤n抽象数据并设计局部视图n集成局部视图,得到全局概念结构n验证整体概念结构概念结构设计小结概念结构设计小结n数据抽象n分类n聚集n概括概念结构设计小结概念结构设计小结n设计局部视图n 选择局部应用n 逐一设计分E-R图n标定局部应用中的实体、属性、码,实体间的联系n用E-R图描述出来概念结构设计小结概念结构设计小结n集成局部视图n1.合并分E-R图,生成初步E-R图n消除冲突n属性冲突n命名冲突n结构冲突n2. 修改与重构n消除不必要的冗余,设计生成基本E-R图n分析方法n规范化理论 下课了。下课了。休息一会儿。休息一会儿。数据库系统概论数据库系统概论AnIntroduc

71、tiontoDatabaseSystem第六章第六章 数据库设计数据库设计( (续续-2)-2)第六章第六章 数据库设计数据库设计6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结6.4 逻辑结构设计逻辑结构设计n逻辑结构设计的任务n概念结构是各种数据模型的共同基础n为了能够用某一DBMS实现用户需求,还必须将概念结构进一步转化为相应的数据模型,这正是数据库逻辑结构设计所要完成的任务。6.4 逻辑结构设计逻辑结构设计n逻辑结构设计的步骤n将概念结构转化为一般的关系、网状、层次模型n将转化来

72、的关系、网状、层次模型向特定DBMS支持下的数据模型转换n对数据模型进行优化 逻辑结构设计逻辑结构设计转化为转化为一般数一般数据模型据模型转化为特转化为特定定DBMS支持下的支持下的据模型据模型优化模优化模型型概念结概念结构设计构设计数据库数据库物理设计物理设计基本基本E-R图图转换规转换规则则特定特定DBMS的的特点与限特点与限制制优化方优化方法如规法如规范化理范化理论论逻辑逻辑模型模型6.4 逻辑结构设计逻辑结构设计6.4.1 E-R图向关系模型的转换6.4.2 向特定DBMS规定的模型进行转换6.4.3 数据模型的优化6.4.4 设计用户子模式6.4.1 E-R图向关系模型的转换图向关系

73、模型的转换n转换内容n转换原则E-R图向关系模型的转换(续)图向关系模型的转换(续)n转换内容转换内容nE-R图由实体、实体的属性和实体之间的联图由实体、实体的属性和实体之间的联系三个要素组成系三个要素组成n关系模型的逻辑结构是一组关系模式的集合关系模型的逻辑结构是一组关系模式的集合n将将E-R图转换为图转换为关系模型关系模型:将实体、实体的:将实体、实体的属性和实体之间的联系转化为关系模式。属性和实体之间的联系转化为关系模式。E-R图向关系模型的转换(续)图向关系模型的转换(续)n转换原则 一个实体型转换为一个关系模式。n n关系的属性关系的属性:实体型的属性n n关系的码关系的码:实体型的

74、码例,学生实体可以转换为如下关系模式:学生(学号,姓名,出生日期,所在系, 年级,平均成绩) 性别、宿舍、班级、档案材料、教师、课程、教室、教科书都分别转换为一个关系模式。 学生学生学号学号出生出生日期日期年级年级所在系所在系平均平均成绩成绩姓名姓名E-R图向关系模型的转换(续)图向关系模型的转换(续) 一个m:n联系转换为一个关系模式。n n关系的属性关系的属性:与该联系相连的各实体的码以及联系本身的属性n n关系的码关系的码:各实体码的组合例,“选修”联系是一个m:n联系,可以将它转换为如下关系模式,其中学号与课程号为关系的组合码:选修(学号,课程号,成绩)E-R图向关系模型的转换(续)图

75、向关系模型的转换(续) 一个一个1:n联系联系可以转换为一个独立的关系模式,可以转换为一个独立的关系模式,也可以与也可以与n端对应的关系模式合并。端对应的关系模式合并。n1) 转换为一个独立的关系模式转换为一个独立的关系模式n n关系的属性关系的属性关系的属性关系的属性:与该联系相连的各实体的码:与该联系相连的各实体的码以及联系本身的属性以及联系本身的属性n n关系的码关系的码关系的码关系的码:n端实体的码端实体的码E-R图向关系模型的转换(续)图向关系模型的转换(续)2) 与与n端对应的关系模式合并端对应的关系模式合并n n合并后关系的属性合并后关系的属性合并后关系的属性合并后关系的属性:在

76、:在n端关系中加入端关系中加入1端端关系的码和联系本身的属性关系的码和联系本身的属性n n合并后关系的码合并后关系的码合并后关系的码合并后关系的码:不变:不变n可以减少系统中的关系个数,一般情况下更可以减少系统中的关系个数,一般情况下更倾向于采用这种方法倾向于采用这种方法E-R图向关系模型的转换(续)图向关系模型的转换(续)例,例,“组成组成”联系为联系为1:n联系。联系。将其转换为关系模式的两种方法:将其转换为关系模式的两种方法: 1)使其成为一个独立的关系模式:使其成为一个独立的关系模式:组成(组成(学号学号,班级号),班级号) 2)将其学生关系模式合并:将其学生关系模式合并:学生(学生(

77、学号学号,姓名,出生日期,所在系,姓名,出生日期,所在系, 年级,年级,班级号班级号,平均成绩),平均成绩)E-R图向关系模型的转换(续)图向关系模型的转换(续) 一个一个1:1联系可以转换为一个独立的关系模式,联系可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。也可以与任意一端对应的关系模式合并。n1) 转换为一个独立的关系模式转换为一个独立的关系模式n n关系的属性关系的属性关系的属性关系的属性:与该联系相连的各实体的码:与该联系相连的各实体的码以及联系本身的属性以及联系本身的属性n n关系的候选码关系的候选码关系的候选码关系的候选码:每个实体的码均是该关系:每个实体的码

78、均是该关系的候选码的候选码E-R图向关系模型的转换(续)图向关系模型的转换(续)2) 与某一端对应的关系模式合并与某一端对应的关系模式合并n n合并后关系的属性合并后关系的属性合并后关系的属性合并后关系的属性:加入对应关系的码和:加入对应关系的码和联系本身的属性联系本身的属性n n合并后关系的码合并后关系的码合并后关系的码合并后关系的码:不变:不变E-R图向关系模型的转换(续)图向关系模型的转换(续)例,例,“管理管理”联系为联系为1:1联系,可以有三种转换方法:联系,可以有三种转换方法:(1)转换为一个独立的关系模式:)转换为一个独立的关系模式: 管理(管理(职工号职工号,班级号),班级号)

79、 或或管理(职工号,管理(职工号,班级号班级号)(2)“管理管理”联系与班级关系模式合并,则只需在班联系与班级关系模式合并,则只需在班级关系中加入教师关系的码,即职工号:级关系中加入教师关系的码,即职工号: 班级:(班级:(班级号班级号,学生人数,学生人数,职工号职工号)(3)“管理管理”联系与教师关系模式合并,则只需在教联系与教师关系模式合并,则只需在教师关系中加入班级关系的码,即班级号:师关系中加入班级关系的码,即班级号:教师:(教师:(职工号职工号,姓名,性别,职称,姓名,性别,职称,班级号班级号, 是否为优秀班主任)是否为优秀班主任)E-R图向关系模型的转换(续)图向关系模型的转换(续

80、)注意:注意:u从理论上讲,从理论上讲,1:1联系可以与任意一端对应的关系模联系可以与任意一端对应的关系模式合并。式合并。u但在一些情况下,与不同的关系模式合并效率会大但在一些情况下,与不同的关系模式合并效率会大不一样。因此究竟应该与哪端的关系模式合并需要不一样。因此究竟应该与哪端的关系模式合并需要依应用的具体情况而定。依应用的具体情况而定。u由于连接操作是最费时的操作,所以一般应以尽量由于连接操作是最费时的操作,所以一般应以尽量减少连接操作为目标。减少连接操作为目标。 例如,如果经常要查询某个班级的班主任姓名,则例如,如果经常要查询某个班级的班主任姓名,则将管理联系与教师关系合并更好些。将管

81、理联系与教师关系合并更好些。E-R图向关系模型的转换(续)图向关系模型的转换(续) 三个或三个以上实体间的一个三个或三个以上实体间的一个多元联系多元联系转换为转换为一个关系模式。一个关系模式。n n关系的属性关系的属性关系的属性关系的属性:与该多元联系相连的各实体的:与该多元联系相连的各实体的码以及联系本身的属性码以及联系本身的属性n n关系的码关系的码关系的码关系的码:各实体码的组合:各实体码的组合例,例,“讲授讲授”联系是一个三元联系,可以将它联系是一个三元联系,可以将它转换为如下关系模式,其中课程号、职工号和转换为如下关系模式,其中课程号、职工号和书号为关系的组合码:书号为关系的组合码:

82、讲授(讲授(课程号,职工号,书号课程号,职工号,书号)E-R图向关系模型的转换(续)图向关系模型的转换(续) 同一实体集的实体间的联系,即同一实体集的实体间的联系,即自联系自联系,也可,也可按上述按上述1:1、1:n和和m:n三种情况分别处理。三种情况分别处理。例,如果教师实体集内部存在领导与被领导的例,如果教师实体集内部存在领导与被领导的1:n自联系,我们可以将该联系与教师实体合自联系,我们可以将该联系与教师实体合并,这时主码职工号将多次出现,但作用不同,并,这时主码职工号将多次出现,但作用不同,可用不同的属性名加以区分:可用不同的属性名加以区分:教师:教师:职工号职工号,姓名,性别,职称,

83、姓名,性别,职称,系主任系主任E-R图向关系模型的转换(续)图向关系模型的转换(续) 具有相同码的关系模式可合并。具有相同码的关系模式可合并。n目的:减少系统中的关系个数。目的:减少系统中的关系个数。n合并方法:将其中一个关系模式的全部属性合并方法:将其中一个关系模式的全部属性加入到另一个关系模式中,然后去掉其中的加入到另一个关系模式中,然后去掉其中的同义属性(可能同名也可能不同名),并适同义属性(可能同名也可能不同名),并适当调整属性的次序。当调整属性的次序。E-R图向关系模型的转换(续)图向关系模型的转换(续)例,例,“拥有拥有”关系模式:关系模式:拥有(拥有(学号学号,性别),性别)与学

84、生关系模式:与学生关系模式: 学生(学生(学号学号,姓名,出生日期,所在系,年级,姓名,出生日期,所在系,年级, 班级号,平均成绩)班级号,平均成绩)都以学号为码,可以将它们合并为一个关系模式:都以学号为码,可以将它们合并为一个关系模式:学生(学生(学号学号,姓名,性别,出生日期,所在系,姓名,性别,出生日期,所在系, 年级,班级号,平均成绩)年级,班级号,平均成绩)E-R图向关系模型的转换(续)图向关系模型的转换(续)实例实例n按照上述七条原则,学生管理子系统中的按照上述七条原则,学生管理子系统中的18个实个实体和联系可以转换为下列关系模型:体和联系可以转换为下列关系模型: 学生(学生(学号

85、学号,姓名,性别,出生日期,所在系,姓名,性别,出生日期,所在系, 年级,班级号,平均成绩,档案号)年级,班级号,平均成绩,档案号)性别(性别(性别性别,宿舍楼),宿舍楼) 宿舍(宿舍(宿舍编号宿舍编号,地址,性别,人数),地址,性别,人数)班级(班级(班级号班级号,学生人数),学生人数) 教师(教师(职工号职工号,姓名,性别,职称,班级号,姓名,性别,职称,班级号, 是否为优秀班主任)是否为优秀班主任)E-R图向关系模型的转换(续)图向关系模型的转换(续) 教学(教学(职工号,学号职工号,学号)课程(课程(课程号课程号,课程名,学分,教室号),课程名,学分,教室号)选修(选修(学号,课程号学

86、号,课程号,成绩),成绩)教科书(教科书(书号书号,书名,价钱),书名,价钱)教室(教室(教室编号教室编号,地址,容量),地址,容量)讲授(讲授(课程号,教师号,书号课程号,教师号,书号)档案材料(档案材料(档案号,档案号,)E-R图向关系模型的转换(续)图向关系模型的转换(续)n该关系模型由12个关系模式组成。其中:n学生关系模式包含了“拥有”联系、“组成”联系、“归档”联系所对应的关系模式n教师关系模式包含了“管理”联系所对应的关系模式;n宿舍关系模式包含了“住宿”联系所对应的关系模式;n课程关系模式包含了“开设”联系所对应的关系模式。6.4 逻辑结构设计逻辑结构设计6.4.1 E-R图向

87、关系模型的转换6.4.2 向特定DBMS规定的模型进行转换6.4.3 数据模型的优化6.4.4 设计用户子模式6.4.2 向特定向特定DBMS规定的模型进行转换规定的模型进行转换n一般的数据模型还需要向特定DBMS规定的模型进行转换。n转换的主要依据是所选用的DBMS的功能及限制。没有通用规则。n对于关系模型来说,这种转换通常都比较简单。6.4 逻辑结构设计逻辑结构设计6.4.1 E-R图向关系模型的转换6.4.2 向特定DBMS规定的模型进行转换6.4.3 数据模型的优化6.4.4 设计用户子模式6.4.3 数据模型的优化数据模型的优化n数据库逻辑设计的结果不是唯一的。数据库逻辑设计的结果不

88、是唯一的。n得到初步数据模型后,还应该适当地修得到初步数据模型后,还应该适当地修改、调整数据模型的结构,以进一步提改、调整数据模型的结构,以进一步提高数据库应用系统的性能,这就是数据高数据库应用系统的性能,这就是数据模型的优化。模型的优化。n关系数据模型的优化通常以关系数据模型的优化通常以规范化理论规范化理论为指导。为指导。数据模型的优化(续)数据模型的优化(续)n优化数据模型的方法优化数据模型的方法 确定数据依赖确定数据依赖n按需求分析阶段所得到的语义,分别写出按需求分析阶段所得到的语义,分别写出每个关系模式内部各属性之间的数据依赖每个关系模式内部各属性之间的数据依赖以及不同关系模式属性之间

89、数据依赖以及不同关系模式属性之间数据依赖。 数据模型的优化(续)数据模型的优化(续)例,课程关系模式内部存在下列数据依赖: 课程号课程名 课程号学分 课程号教室号 选修关系模式中存在下列数据依赖: (学号,课程号)成绩数据模型的优化(续)数据模型的优化(续) 对于各个关系模式之间的数据依赖进行极小对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。化处理,消除冗余的联系。数据模型的优化(续)数据模型的优化(续) 按照数据依赖的理论对关系模式逐一进行分析,按照数据依赖的理论对关系模式逐一进行分析,考查是否存在部分函数依赖、传递函数依赖、多考查是否存在部分函数依赖、传递函数依赖、多值依赖

90、等,确定各关系模式分别属于第几范式。值依赖等,确定各关系模式分别属于第几范式。例如经过分析可知,课程关系模式属于例如经过分析可知,课程关系模式属于BC范式。范式。数据模型的优化(续)数据模型的优化(续) 按照需求分析阶段得到的各种应用对数据处按照需求分析阶段得到的各种应用对数据处理的要求,分析对于这样的应用环境这些模理的要求,分析对于这样的应用环境这些模式是否合适,确定是否要对它们进行式是否合适,确定是否要对它们进行合并合并或或分解分解。数据模型的优化(续)数据模型的优化(续)n并不是规范化程度越高的关系就越优。并不是规范化程度越高的关系就越优。n当一个应用的查询中经常涉及到两个或当一个应用的

91、查询中经常涉及到两个或多个关系模式的属性时,系统必须经常多个关系模式的属性时,系统必须经常地进行联接运算,而联系运算的代价是地进行联接运算,而联系运算的代价是相当高的,可以说关系模型低效的主要相当高的,可以说关系模型低效的主要原因就是做联接运算引起的,因此在这原因就是做联接运算引起的,因此在这种情况下,第二范式甚至第一范式也许种情况下,第二范式甚至第一范式也许是最好的。是最好的。数据模型的优化(续)数据模型的优化(续)n非非BCNF的关系模式虽然从理论上分析会的关系模式虽然从理论上分析会存在不同程度的更新异常,但如果在实际存在不同程度的更新异常,但如果在实际应用中对此关系模式只是查询,并不执行

92、应用中对此关系模式只是查询,并不执行更新操作,则就不会产生实际影响。更新操作,则就不会产生实际影响。n对于一个具体应用来说,到底规范化进行对于一个具体应用来说,到底规范化进行到什么程度,需要权衡响应时间和潜在问到什么程度,需要权衡响应时间和潜在问题两者的利弊才能决定。一般说来,第三题两者的利弊才能决定。一般说来,第三范式就足够了。范式就足够了。数据模型的优化(续)数据模型的优化(续)例:在关系模式例:在关系模式 学生成绩单学生成绩单(学号学号,英语英语,数学数学,语文语文,平均成绩平均成绩) 中存在下列函数依赖:中存在下列函数依赖: 学号学号英语英语 学号学号数学数学 学号学号语文语文 学号学

93、号平均成绩平均成绩 (英语英语, 数学数学, 语文语文)平均成绩平均成绩数据模型的优化(续)数据模型的优化(续) 显然有:显然有: 学号学号(英语英语,数学数学,语文语文)因此该关系模式中存在传递函数信赖,是因此该关系模式中存在传递函数信赖,是2NF关系。关系。 虽然平均成绩可以由其他属性推算出来,但虽然平均成绩可以由其他属性推算出来,但如果应用中需要经常查询学生的平均成绩,如果应用中需要经常查询学生的平均成绩,为提高效率,我们仍然可保留该冗余数据,为提高效率,我们仍然可保留该冗余数据,对关系模式不再做进一步分解。对关系模式不再做进一步分解。数据模型的优化(续)数据模型的优化(续) 按照需求分

94、析阶段得到的各种应用对数据处理的按照需求分析阶段得到的各种应用对数据处理的要求,对关系模式进行必要的分解或合并,以提要求,对关系模式进行必要的分解或合并,以提高数据操作的效率和存储空间的利用率高数据操作的效率和存储空间的利用率n常用分解方法常用分解方法n水平分解水平分解n垂直分解垂直分解数据模型的优化(续)数据模型的优化(续)n水平分解水平分解n什么是水平分解什么是水平分解n把把(基基本本)关关系系的的元元组组分分为为若若干干子子集集合合,定定义义每每个个子子集集合合为为一一个个子子关关系系,以以提提高系统的效率。高系统的效率。数据模型的优化(续)数据模型的优化(续)n水平分解的适用范围水平分

95、解的适用范围n1. 满足满足“80/20原则原则”的应用的应用n80/20原则:一个大关系中,经常被使用的原则:一个大关系中,经常被使用的数据只是关系的一部分,约数据只是关系的一部分,约20%n把把经经常常使使用用的的数数据据分分解解出出来来,形形成成一一个个子子关关系,可以减少查询的数据量。系,可以减少查询的数据量。 数据模型的优化(续)数据模型的优化(续)n水平分解的适用范围水平分解的适用范围n2. 并发事务经常存取不相交的数据并发事务经常存取不相交的数据n如如果果关关系系R上上具具有有n个个事事务务,而而且且多多数数事事务务存存取取的的数数据据不不相相交交,则则R可可分分解解为为少少于于

96、或或等等于于n个个子子关关系系,使使每个事务存取的数据对应一个关系。每个事务存取的数据对应一个关系。数据模型的优化(续)数据模型的优化(续)n水平分解水平分解n什么是水平分解什么是水平分解n把把(基基本本)关关系系的的元元组组分分为为若若干干子子集集合合,定定义义每每个个子子集集合合为为一一个个子子关关系系,以以提提高系统的效率。高系统的效率。n水平分解的适用范围水平分解的适用范围n满足满足“80/20原则原则”的应用的应用n并发事务经常存取不相交的数据并发事务经常存取不相交的数据数据模型的优化(续)数据模型的优化(续)n满足满足“80/20原则原则”的应用的应用n80/20原则:一个大关系中

97、,经常被使用原则:一个大关系中,经常被使用的数据只是关系的一部分,约的数据只是关系的一部分,约20%n把把经经常常使使用用的的数数据据分分解解出出来来,形形成成一一个个子子关系,可以减少查询的数据量。关系,可以减少查询的数据量。 n并发事务经常存取不相交的数据并发事务经常存取不相交的数据n如如果果关关系系R上上具具有有n个个事事务务,而而且且多多数数事事务务存存取取的的数数据据不不相相交交,则则R可可分分解解为为少少于于或或等等于于n个个子子关关系系,使使每每个个事事务务存存取取的的数数据据对对应一个关系。应一个关系。数据模型的优化(续)数据模型的优化(续)n垂直分解垂直分解n什么是垂直分解什

98、么是垂直分解n把把关关系系模模式式R的的属属性性分分解解为为若若干干子子集集合,形成若干子关系模式。合,形成若干子关系模式。n垂直分解的原则垂直分解的原则n经经常常在在一一起起使使用用的的属属性性从从R中中分分解解出出来形成一个子关系模式。来形成一个子关系模式。数据模型的优化(续)数据模型的优化(续)n垂直分解的垂直分解的优点优点n可以提高某些事务的效率可以提高某些事务的效率n垂直分解的垂直分解的缺点缺点n可可能能使使另另一一些些事事务务不不得得不不执执行行连连接接操操作,从而降低了效率。作,从而降低了效率。数据模型的优化(续)数据模型的优化(续)n垂直分解的适用范围垂直分解的适用范围n取取决

99、决于于分分解解后后R上上的的所所有有事事务务的的总总效效率率是是否得到了提高。否得到了提高。n进行垂直分解的方法进行垂直分解的方法n简单情况:直观分解简单情况:直观分解n复杂情况:用第五章中的模式分解算法复杂情况:用第五章中的模式分解算法n垂垂直直分分解解必必须须不不损损失失关关系系模模式式的的语语义义(保保持无损连接性和保持函数依赖持无损连接性和保持函数依赖)。6.4 逻辑结构设计逻辑结构设计6.4.1 E-R图向关系模型的转换6.4.2 向特定DBMS规定的模型进行转换6.4.3 数据模型的优化6.4.4 设计用户子模式6.4.4 设计用户子模式设计用户子模式n定义数据库模式主要是从系统的

100、时间效率、空定义数据库模式主要是从系统的时间效率、空间效率、易维护等角度出发。间效率、易维护等角度出发。n定义定义用户外模式用户外模式时应该更注重考虑用户的习惯时应该更注重考虑用户的习惯与方便。包括三个方面:与方便。包括三个方面: 设计用户子模式(续)设计用户子模式(续)(1) 使用更符合用户习惯的别名使用更符合用户习惯的别名n合并各分合并各分E-R图曾做了消除命名冲突的工作,图曾做了消除命名冲突的工作,以使数据库系统中同一关系和属性具有唯一以使数据库系统中同一关系和属性具有唯一的名字。这在设计数据库整体结构时是非常的名字。这在设计数据库整体结构时是非常必要的。必要的。n但对于某些局部应用,由

101、于改用了不符合用但对于某些局部应用,由于改用了不符合用户习惯的属性名,可能会使他们感到不方便,户习惯的属性名,可能会使他们感到不方便,设计用户子模式(续)设计用户子模式(续)n因此在设计用户的子模式时可以重新定义某因此在设计用户的子模式时可以重新定义某些属性名,使其与用户习惯一致。些属性名,使其与用户习惯一致。n当然,为了应用的规范化,我们也不应该一当然,为了应用的规范化,我们也不应该一味地迁就用户。味地迁就用户。例:负责学籍管理的用户习惯于称教师模式的例:负责学籍管理的用户习惯于称教师模式的职工号为教师编号。因此可以定义视图,在职工号为教师编号。因此可以定义视图,在视图中职工号重定义为教师编

102、号视图中职工号重定义为教师编号设计用户子模式(续)设计用户子模式(续) (2) 针对不同级别的用户定义不同的外模式,以针对不同级别的用户定义不同的外模式,以满足系统对安全性的要求。满足系统对安全性的要求。设计用户子模式(续)设计用户子模式(续)例:例:教师关系模式中包括职工号、姓名、性别、出生日教师关系模式中包括职工号、姓名、性别、出生日期、婚姻状况、学历、学位、政治面貌、职称、职期、婚姻状况、学历、学位、政治面貌、职称、职务、工资、工龄、教学效果等属性。务、工资、工龄、教学效果等属性。 学籍管理应用学籍管理应用只能查询教师的职工号、姓名、只能查询教师的职工号、姓名、性别、职称数据;性别、职称

103、数据; 课程管理应用课程管理应用只能查询教师的职工号、姓名、只能查询教师的职工号、姓名、性别、学历、学位、职称、教学效果数据;性别、学历、学位、职称、教学效果数据; 教师管理应用教师管理应用则可以查询教师的全部数据。则可以查询教师的全部数据。设计用户子模式(续)设计用户子模式(续)定义两个外模式:定义两个外模式:教师教师_学籍管理学籍管理(职工号,姓名,性别,职称职工号,姓名,性别,职称)教师教师_课程管理课程管理(工号,姓名,性别,学历,工号,姓名,性别,学历, 学位,职称,教学效果学位,职称,教学效果)授权学籍管理应用只能访问教师授权学籍管理应用只能访问教师_学籍管理视图学籍管理视图授权课

104、程管理应用只能访问教师授权课程管理应用只能访问教师_课程管理视图课程管理视图授权教师管理应用能访问教师表授权教师管理应用能访问教师表这样就可以防止用户非法访问本来不允许他们查询这样就可以防止用户非法访问本来不允许他们查询的数据,保证了系统的安全性。的数据,保证了系统的安全性。设计用户子模式(续)设计用户子模式(续)(3) 简化用户对系统的使用简化用户对系统的使用n如果某些局部应用中经常要使用某些很复杂如果某些局部应用中经常要使用某些很复杂的查询,为了方便用户,可以将这些复杂查的查询,为了方便用户,可以将这些复杂查询定义为视图。询定义为视图。逻辑结构设计逻辑结构设计小结小结n任务n将概念结构转化

105、为具体的数据模型n逻辑结构设计的步骤n将概念结构转化为一般的关系、网状、层次模型n将转化来的关系、网状、层次模型向特定DBMS支持下的数据模型转换n对数据模型进行优化n设计用户子模式逻辑结构设计小结逻辑结构设计小结nE-R图向关系模型的转换内容图向关系模型的转换内容n将将E-R图转换为关系模型:将实体、实体的图转换为关系模型:将实体、实体的属性和实体之间的联系转化为关系模式。属性和实体之间的联系转化为关系模式。逻辑结构设计小结逻辑结构设计小结nE-R图向关系模型的转换原则图向关系模型的转换原则 一个一个实体型实体型转换为一个关系模式。转换为一个关系模式。 一个一个m:n联系联系转换为一个关系模

106、式。转换为一个关系模式。 一个一个1:n联系联系可以转换为一个独立的关系模式,可以转换为一个独立的关系模式,也可以与也可以与n端对应的关系模式合并。端对应的关系模式合并。 一个一个1:1联系联系可以转换为一个独立的关系模式,可以转换为一个独立的关系模式,也可以与任意一端对应的关系模式合并。也可以与任意一端对应的关系模式合并。逻辑结构设计小结逻辑结构设计小结 三个或三个以上实体间的一个三个或三个以上实体间的一个多元联系多元联系转换为转换为一个关系模式。一个关系模式。 同一实体集的实体间的联系,即同一实体集的实体间的联系,即自联系自联系,也可,也可按上述按上述1:1、1:n和和m:n三种情况分别处

107、理。三种情况分别处理。 具有具有相同码相同码的关系模式可合并。的关系模式可合并。逻辑结构设计小结逻辑结构设计小结n优化数据模型的方法优化数据模型的方法 确定数据依赖确定数据依赖 对于各个关系模式之间的数据依赖进行极小对于各个关系模式之间的数据依赖进行极小化处理,消除冗余的联系。化处理,消除冗余的联系。 确定各关系模式分别属于第几范式。确定各关系模式分别属于第几范式。 分析对于应用环境这些模式是否合适,确定分析对于应用环境这些模式是否合适,确定是否要对它们进行合并或分解。是否要对它们进行合并或分解。 对关系模式进行必要的分解或合并对关系模式进行必要的分解或合并逻辑结构设计小结逻辑结构设计小结n设

108、计用户子模式设计用户子模式1. 使用更符合用户习惯的别名使用更符合用户习惯的别名2. 针对不同级别的用户定义不同的外模式,以针对不同级别的用户定义不同的外模式,以满足系统对安全性的要求。满足系统对安全性的要求。3. 简化用户对系统的使用简化用户对系统的使用第六章第六章 数据库设计数据库设计6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结6.5 数据库的物理设计数据库的物理设计n什么是数据库的物理设计什么是数据库的物理设计n数据库在数据库在物理设备物理设备上的上的存储结构存储结构与与存取方

109、法存取方法称为数据库的物理结构,它依赖于给定的计称为数据库的物理结构,它依赖于给定的计算机系统。算机系统。n为一个给定的逻辑数据模型选取一个最适合为一个给定的逻辑数据模型选取一个最适合应用环境的物理结构的过程,就是数据库的应用环境的物理结构的过程,就是数据库的物理设计。物理设计。6.5 数据库的物理设计数据库的物理设计n数据库物理设计的步骤数据库物理设计的步骤n确定数据库的物理结构确定数据库的物理结构n对物理结构进行评价,评价的重点是时间和对物理结构进行评价,评价的重点是时间和空间效率空间效率n如果评价结果满足原设计要求则可进入到物如果评价结果满足原设计要求则可进入到物理实施阶段,否则,就需要

110、重新设计或修改理实施阶段,否则,就需要重新设计或修改物理结构,有时甚至要返回逻辑设计阶段修物理结构,有时甚至要返回逻辑设计阶段修改数据模型。改数据模型。 数据库物理设计数据库物理设计确定数确定数据库的据库的物理结物理结构构评价数据评价数据库的物理库的物理结构结构逻辑结逻辑结构设计构设计数据库数据库实施实施物理物理模型模型逻辑逻辑模型模型6.5 数据库的物理设计数据库的物理设计6.5.1 数据库的物理设计的内容和方法数据库的物理设计的内容和方法6.5.2 关系模式存取方法选择关系模式存取方法选择6.5.3 确定数据库的存储结构确定数据库的存储结构6.5.4 评价物理结构评价物理结构6.5 数据库

111、的物理设计数据库的物理设计6.5.1 数据库的物理设计的内容和方法6.5.2 关系模式存取方法选择6.5.3 确定数据库的存储结构6.5.4 评价物理结构6.5.1 数据库的物理设计的内容和方法数据库的物理设计的内容和方法n设计物理数据库结构的准备工作n 1. 充分了解应用环境,详细分析要运行的事务,以获得选择物理数据库设计所需参数n 2. 充分了解所用RDBMS的内部特征,特别是系统提供的存取方法和存储结构数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续)n选择物理数据库设计所需参数n 数据库查询事务n查询的关系n 查询条件所涉及的属性n 连接条件所涉及的属性n 查询的投影属

112、性 数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续)n选择物理数据库设计所需参数(续)n数据更新事务n被更新的关系n每个关系上的更新操作条件所涉及的属性n 修改操作要改变的属性值n 每个事务在各关系上运行的频率和性能要求数据库的物理设计的内容和方法(续数据库的物理设计的内容和方法(续)n关系数据库物理设计的内容关系数据库物理设计的内容n1. 为关系模式选择为关系模式选择存取方法存取方法(建立存取路径建立存取路径)n2. 设计关系、索引等数据库文件的设计关系、索引等数据库文件的物理存物理存储结构储结构6.5 数据库的物理设计数据库的物理设计6.5.1 数据库的物理设计的内容和方

113、法数据库的物理设计的内容和方法6.5.2 关系模式存取方法选择关系模式存取方法选择6.5.3 确定数据库的存储结构确定数据库的存储结构6.5.4 评价物理结构评价物理结构6.5.2 关系模式存取方法选择关系模式存取方法选择n数据库系统是多用户共享的系统,对同数据库系统是多用户共享的系统,对同一个关系要建立多条存取路径才能满足一个关系要建立多条存取路径才能满足多用户的多种应用要求。多用户的多种应用要求。n物理设计的第一个任务就是要确定选择物理设计的第一个任务就是要确定选择哪些存取方法,即建立哪些存取路径。哪些存取方法,即建立哪些存取路径。关系模式存取方法选择(续)关系模式存取方法选择(续)nDB

114、MS常用存取方法常用存取方法n索引方法,目前主要是索引方法,目前主要是B+树索引方法树索引方法n聚簇(聚簇(Cluster)方法方法nHASH方法方法一、索引存取方法的选择一、索引存取方法的选择n选择索引存取方法的主要内容选择索引存取方法的主要内容根据应用要求确定根据应用要求确定n 对哪些属性列建立索引对哪些属性列建立索引n 对哪些属性列建立组合索引对哪些属性列建立组合索引n 对哪些索引要设计为唯一索引对哪些索引要设计为唯一索引索引存取方法的选择(续)索引存取方法的选择(续)n选择索引存取方法的一般规则选择索引存取方法的一般规则n如果一个如果一个(或一组或一组)属性经常在属性经常在查询查询条件

115、中出条件中出现,则考虑在这个现,则考虑在这个(或这组或这组)属性上建立索引属性上建立索引(或组合索引或组合索引)n如果一个属性经常作为如果一个属性经常作为最大值和最小值最大值和最小值等聚等聚集函数的参数,则考虑在这个属性上建立索集函数的参数,则考虑在这个属性上建立索引引n如果一个如果一个(或一组或一组)属性经常在属性经常在连接连接操作的连操作的连接条件中出现,则考虑在这个接条件中出现,则考虑在这个(或这组或这组)属性属性上建立索引上建立索引索引存取方法的选择(续)索引存取方法的选择(续)n关系上定义的索引数关系上定义的索引数过多过多会带来较会带来较多的额外开销多的额外开销n 维护索引的开销维护

116、索引的开销n 查找索引的开销查找索引的开销二、聚簇存取方法的选择二、聚簇存取方法的选择n什么是聚簇什么是聚簇n为了提高某个属性(或属性组)的查询速度,为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块称为聚同值的元组集中存放在连续的物理块称为聚簇簇n许多关系型许多关系型DBMS都提供了聚簇功能都提供了聚簇功能n聚簇存放与聚簇索引的区别聚簇存放与聚簇索引的区别建立建立聚簇聚簇索引索引 (复习)(复习)n聚簇索引聚簇索引n建建立立聚聚簇簇索索引引后后,基基表表中中数数据据也也需需要要按按指指定定的的聚

117、聚簇簇属属性性值值的的升升序序或或降降序序存存放放。也也即即聚聚簇簇索索引引的索引项顺序与表中元组的物理顺序一致。的索引项顺序与表中元组的物理顺序一致。例:例:CREATE CLUSTER INDEX Stusname ON Student(Sname); 在在Student表表的的Sname(姓姓名名)列列上上建建立立一一个个聚聚簇簇索索引引,而而且且Student表表中中的的记记录录将将按按照照Sname值值的升序存放的升序存放 建立建立聚簇聚簇索引索引 (复习)(复习)n在一个基本表上最多只能建立一个聚簇索引在一个基本表上最多只能建立一个聚簇索引n聚簇索引的用途:对于某些类型的查询,可聚

118、簇索引的用途:对于某些类型的查询,可以提高查询效率以提高查询效率n聚簇索引的适用范围聚簇索引的适用范围n 很少对基表进行增删操作很少对基表进行增删操作n 很少对其中的变长列进行修改操作很少对其中的变长列进行修改操作 聚簇存取方法的选择(续)聚簇存取方法的选择(续)n聚簇的用途n1. 大大提高按聚簇属性进行查询的效率例:假设学生关系按所在系建有索引,现在要查询信息系的所有学生名单。n信息系的500名学生分布在500个不同的物理块上时,至少要执行500次I/O操作。n如果将同一系的学生元组集中存放,则每读一个物理块可得到多个满足查询条件的元组,从而显著地减少了访问磁盘的次数。聚簇存取方法的选择(续

119、)聚簇存取方法的选择(续)n2. 节省存储空间n聚簇以后,聚簇码相同的元组集中在一起了,因而聚簇码值不必在每个元组中重复存储,只要在一组中存一次就行了聚簇存取方法的选择(续)聚簇存取方法的选择(续)n聚簇的局限性n1. 聚簇只能提高某些特定应用的性能n2. 建立与维护聚簇的开销相当大n对已有关系建立聚簇,将导致关系中元组移动其物理存储位置,并使此关系上原有的索引无效,必须重建。n当一个元组的聚簇码改变时,该元组的存储位置也要做相应移动。聚簇存取方法的选择(续)聚簇存取方法的选择(续)n聚簇的适用范围n1. 既适用于单个关系独立聚簇,也适用于多个关系组合聚簇例:假设用户经常要按系别查询学生成绩单

120、,这一查询涉及学生关系和选修关系的连接操作,即需要按学号连接这两个关系,为提高连接操作的效率,可以把具有相同学号值的学生元组和选修元组在物理上聚簇在一起。这就相当于把多个关系按“预连接”的形式存放,从而大大提高连接操作的效率。聚簇存取方法的选择(续)聚簇存取方法的选择(续)n2. 当通过聚簇码进行访问或连接是该关系的主要应用,与聚簇码无关的其他访问很少或者是次要的时,可以使用聚簇。n尤其当SQL语句中包含有与聚簇码有关的ORDER BY,GROUP BY,UNION,DISTINCT等子句或短语时,使用聚簇特别有利,可以省去对结果集的排序操作聚簇存取方法的选择(续)聚簇存取方法的选择(续)n选

121、择聚簇存取方法n1. 设计候选聚簇n对经常在一起进行连接操作的关系可以建立组合聚簇;n如果一个关系的一组属性经常出现在相等比较条件中,则该单个关系可建立聚簇;n如果一个关系的一个(或一组)属性上的值重复率很高,则此单个关系可建立聚簇。即对应每个聚簇码值的平均元组数不太少。太少了,聚簇的效果不明显。聚簇存取方法的选择(续)聚簇存取方法的选择(续)n2. 检查候选聚簇中的关系,取消其中不必要的关系n从独立聚簇中删除经常进行全表扫描的关系;n从独立/组合聚簇中删除更新操作远多于查询操作的关系;n从独立/组合聚簇中删除重复出现的关系n当一个关系同时加入多个聚簇时,必须从这多个聚簇方案(包括不建立聚簇)

122、中选择一个较优的,即在这个聚簇上运行各种事务的总代价最小。三、三、HASH存取方法的选择存取方法的选择n选择HASH存取方法的规则n当一个关系满足下列两个条件时,可以选择HASH存取方法n该关系的属性主要出现在等值连接条件中或主要出现在相等比较选择条件中n该关系的大小可预知,而且不变; 或 该关系的大小动态改变,但所选用的DBMS提供了动态HASH存取方法。6.5 数据库的物理设计数据库的物理设计6.5.1 数据库的物理设计的内容和方法6.5.2 关系模式存取方法选择6.5.3 确定数据库的存储结构6.5.4 评价物理结构6.5.3 确定数据库的存储结构确定数据库的存储结构n确定数据库物理结构

123、的内容n1. 确定数据的存放位置和存储结构n 关系n 索引n 聚簇n 日志n 备份n2. 确定系统配置1. 确定数据的存放位置确定数据的存放位置n影响数据存放位置和存储结构的因素n硬件环境n应用需求n存取时间n存储空间利用率n维护代价 这三个方面常常是相互矛盾的 例:消除一切冗余数据虽能够节约存储空间和减少维护代价,但往往会导致检索代价的增加 必须进行权衡,选择一个折中方案。确定数据的存放位置(续)确定数据的存放位置(续)n基本原则n根据应用情况将n易变部分与稳定部分n存取频率较高部分与存取频率较低部分 分开存放,以提高系统性能确定数据的存放位置(续)确定数据的存放位置(续)例:n数据库数据备

124、份、日志文件备份等由于只在故障恢复时才使用,而且数据量很大,可以考虑存放在磁带上。n如果计算机有多个磁盘,可以考虑将表和索引分别放在不同的磁盘上,在查询时,由于两个磁盘驱动器分别在工作,因而可以保证物理读写速度比较快。确定数据的存放位置(续)确定数据的存放位置(续)例(续):n可以将比较大的表分别放在两个磁盘上,以加快存取速度,这在多用户环境下特别有效。n可以将日志文件与数据库对象(表、索引等)放在不同的磁盘以改进系统的性能。2. 确定系统配置确定系统配置nDBMS产品一般都提供了一些存储分配参数产品一般都提供了一些存储分配参数n 同时使用数据库的用户数同时使用数据库的用户数n 同时打开的数据

125、库对象数同时打开的数据库对象数n 使用的缓冲区长度、个数使用的缓冲区长度、个数n 时间片大小时间片大小n 数据库的大小数据库的大小n 装填因子装填因子n 锁的数目锁的数目n 等等等等6.5 数据库的物理设计数据库的物理设计6.5.1 数据库的物理设计的内容和方法6.5.2 关系模式存取方法选择6.5.3 确定数据库的存储结构6.5.4 评价物理结构6.5.4 评价物理结构评价物理结构n评价内容n对数据库物理设计过程中产生的多种方案进行细致的评价,从中选择一个较优的方案作为数据库的物理结构6.5.4 评价物理结构评价物理结构n评价方法n定量估算各种方案n 存储空间n 存取时间n 维护代价n对估算

126、结果进行权衡、比较,选择出一个较优的合理的物理结构n如果该结构不符合用户需求,则需要修改设计第六章第六章 数据库设计数据库设计6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结6.6 数据库的实施数据库的实施n数据库实施的工作内容n用DDL定义数据库结构n组织数据入库n编制与调试应用程序n数据库试运行数据库实施数据库实施定义数定义数据库结据库结构构数据数据装载装载数据库数据库试运行试运行数据库物数据库物理设计理设计数据库运数据库运行和维护行和维护物理物理模型模型编制与编制与调试应调试应用程

127、序用程序数据库数据库系统系统一、定义数据库结构一、定义数据库结构n确定了数据库的逻辑结构与物理结构后,就可以用所选用的DBMS提供的数据定义语言(DDL)来严格描述数据库结构。定义数据库结构(续)定义数据库结构(续)例,对于前面的例子,可以用SQL语句如下定义表结构:CREATE TABLE 学生 (学号 CHAR(8), );CREATE TABLE 课程 ( ); 定义数据库结构(续)定义数据库结构(续) 接下来是在这些基本表上定义视图:CREATE VIEW . ( ); 如果需要使用聚簇,在建基本表之前,应先用CREATE CLUSTER语句定义聚族。二、数据装载二、数据装载n数据库结

128、构建立好后,就可以向数据库中装载数据了。组织数据入库是数据库实施阶段最主要的工作。n数据装载方法n人工方法n计算机辅助数据入库数据装载(续)数据装载(续)n人工方法:适用于小型系统n步骤1) 筛选数据。需要装入数据库中的数据通常都分散在各个部门的数据文件或原始凭证中,所以首先必须把需要入库的数据筛选出来。2) 转换数据格式。筛选出来的需要入库的数据,其格式往往不符合数据库要求,还需要进行转换。这种转换有时可能很复杂。 3) 输入数据。将转换好的数据输入计算机中。 4) 校验数据。检查输入的数据是否有误。数据装载(续)数据装载(续)n计算机辅助数据入库:适用于中大型系统n步骤1) 筛选数据2)

129、输入数据。由录入员将原始数据直接输入计算机中。数据输入子系统应提供输入界面。3) 校验数据。数据输入子系统采用多种检验技术检查输入数据的正确性。数据装载(续)数据装载(续)4) 转换数据。数据输入子系统根据数据库系统的要求,从录入的数据中抽取有用成分,对其进行分类,然后转换数据格式。抽取、分类和转换数据是数据输入子系统的主要工作,也是数据输入子系统的复杂性所在。5) 综合数据。数据输入子系统对转换好的数据根据系统的要求进一步综合成最终数据。数据装载(续)数据装载(续)n如果数据库是在老的文件系统或数据库系统的基础上设计的,则数据输入子系统只需要完成转换数据、综合数据两项工作,直接将老系统中的数

130、据转换成新系统中需要的数据格式。n为了保证数据能够及时入库,应在数据库物理设计的同时编制数据输入子系统。三、编制与调试应用程序三、编制与调试应用程序n数据库应用程序的设计应该与数据设计并行进行。n在数据库实施阶段,当数据库结构建立好后,就可以开始编制与调试数据库的应用程序。调试应用程序时由于数据入库尚未完成,可先使用模拟数据。四、数据库试运行四、数据库试运行n应用程序调试完成,并且已有一小部分数据入库后,就可以开始数据库的试运行。n数据库试运行也称为联合调试,其主要工作包括:1)功能测试:实际运行应用程序,执行对数据库的各种操作,测试应用程序的各种功能。2)性能测试:测量系统的性能指标,分析是

131、否符合设计目标。数据库试运行(续)数据库试运行(续)n数据库性能指标的测量n数据库物理设计阶段在评价数据库结构估算时间、空间指标时,作了许多简化和假设,忽略了许多次要因素,因此结果必然很粗糙。n数据库试运行则是要实际测量系统的各种性能指标(不仅是时间、空间指标),如果结果不符合设计目标,则需要返回物理设计阶段,调整物理结构,修改参数;有时甚至需要返回逻辑设计阶段,调整逻辑结构。数据库试运行(续)数据库试运行(续)n数据的分期入库n重新设计物理结构甚至逻辑结构,会导致数据重新入库。n由于数据入库工作量实在太大,所以可以采用分期输入数据的方法n先输入小批量数据供先期联合调试使用n待试运行基本合格后

132、再输入大批量数据n逐步增加数据量,逐步完成运行评价数据库试运行(续)数据库试运行(续)n数据库的转储和恢复n在数据库试运行阶段,系统还不稳定,硬、软件故障随时都可能发生n系统的操作人员对新系统还不熟悉,误操作也不可避免n因此必须做好数据库的转储和恢复工作,尽量减少对数据库的破坏。第六章第六章 数据库设计数据库设计6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结6.7 数据库运行与维护数据库运行与维护n数据库试运行结果符合设计目标后,数据库就数据库试运行结果符合设计目标后,数据库就可以真正

133、投入运行了。可以真正投入运行了。n数据库投入运行标着开发任务的基本完成和维数据库投入运行标着开发任务的基本完成和维护工作的开始护工作的开始n对数据库设计进行评价、调整、修改等维护工对数据库设计进行评价、调整、修改等维护工作是一个长期的任务,也是设计工作的继续和作是一个长期的任务,也是设计工作的继续和提高。提高。n应用环境在不断变化应用环境在不断变化n数据库运行过程中物理存储会不断变化数据库运行过程中物理存储会不断变化数据库运行与维护(续)数据库运行与维护(续)n在数据库运行阶段,对数据库经常性的维护工作主要是由DBA完成的,包括: 数据库的转储和恢复n转储和恢复是系统正式运行后最重要的维护工作

134、之一。nDBA要针对不同的应用要求制定不同的转储计划,定期对数据库和日志文件进行备份。n一旦发生介质故障,即利用数据库备份及日志文件备份,尽快将数据库恢复到某种一致性状态。数据库运行与维护(续)数据库运行与维护(续)数据库的安全性、完整性控制nDBA必须根据用户的实际需要授予不同的操作权限n在数据库运行过程中,由于应用环境的变化,对安全性的要求也会发生变化,DBA需要根据实际情况修改原有的安全性控制。n由于应用环境的变化,数据库的完整性约束条件也会变化,也需要DBA不断修正,以满足用户要求。数据库运行与维护(续)数据库运行与维护(续)数据库性能的监督、分析和改进n在数据库运行过程中, DBA必

135、须监督系统运行,对监测数据进行分析,找出改进系统性能的方法。n利用监测工具获取系统运行过程中一系列性能参数的值n通过仔细分析这些数据,判断当前系统是否处于最佳运行状态n如果不是,则需要通过调整某些参数来进一步改进数据库性能数据库运行与维护(续)数据库运行与维护(续)数据库的重组织和重构造1)数据库的重组织n为什么要重组织数据库n数据库运行一段时间后,由于记录的不断增、删、改,会使数据库的物理存储变坏,从而降低数据库存储空间的利用率和数据的存取效率,使数据库的性能下降。数据库运行与维护(续)数据库运行与维护(续)n重组织的形式n全部重组织n部分重组织n只对频繁增、删的表进行重组织n重组织的目标n

136、提高系统性能数据库运行与维护(续)数据库运行与维护(续)n重组织的工作n按原设计要求n重新安排存储位置n回收垃圾n减少指针链n数据库的重组织不会改变原设计的数据逻辑结构和物理结构数据库运行与维护(续)数据库运行与维护(续)2)数据库的重构造n为什么要进行数据库的重构造n数据库应用环境发生变化,会导致实体及实体间的联系也发生相应的变化,使原有的数据库设计不能很好地满足新的需求n增加新的应用或新的实体n取消某些已有应用n改变某些已有应用数据库运行与维护(续)数据库运行与维护(续)n数据库重构造的主要工作n根据新环境调整数据库的模式和内模式n增加新的数据项n改变数据项的类型n改变数据库的容量n增加或

137、删除索引n修改完整性约束条件数据库运行与维护(续)数据库运行与维护(续)n重构造数据库的程度是有限的n若应用变化太大,已无法通过重构数据库来满足新的需求,或重构数据库的代价太大,则表明现有数据库应用系统的生命周期已经结束,应该重新设计新的数据库系统,开始新数据库应用系统的生命周期了。第六章第六章 数据库设计数据库设计6.1 数据库设计概述6.2 需求分析6.3 概念结构设计6.4 逻辑结构设计6.5 数据库的物理设计6.6 数据库实施6.7 数据库运行与维护6.8 小结6.8 小结小结n数据库的设计过程n需求分析n概念结构设计n逻辑结构设计n物理设计n实施n运行维护设计过程中往往还会有许多反复

138、。小结(续)小结(续)n数据库各级模式的形成n数据库的各级模式是在设计过程中逐步形成的n需求分析阶段综合各个用户的应用需求(现实世界的需求)。n概念设计阶段形成独立于机器特点、独立于各个DBMS产品的概念模式(信息世界模型),用E-R图来描述。小结(续)小结(续)n在逻辑设计阶段将E-R图转换成具体的数据库产品支持的数据模型如关系模型,形成数据库逻辑模式。然后根据用户处理的要求,安全性的考虑,在基本表的基础上再建立必要的视图(VIEW)形成数据的外模式。n在物理设计阶段根据DBMS特点和处理的需要,进行物理存储安排,设计索引,形成数据库内模式。复习题复习题1、ER图一般用于描述()阶段的工作成

139、果。A、需求分析B、概念结构设计C、逻辑结构设计D、物理结构设计n2、下列模型中,适宜作为设计人员与用户间交流工具的是()nA、概念模型nB、逻辑模型nC、物理模型nD、关系模型nER图的三要素是()nA、实体、属性、实体集nB、实体、键、联系nC、实体、属性、联系nD、实体、域、候选键设有两个实体集设有两个实体集A和和B,A中实体可能与中实体可能与B中零中零个或多个实体相联系,而个或多个实体相联系,而B中实体至多和中实体至多和A中一个实体有联系,则称中一个实体有联系,则称A和和B具有()联具有()联系系A、一对一、一对一B、一对多、一对多C、多对多、多对多D、多对一、多对一先从中层数据流图出

140、发设计系统的局部先从中层数据流图出发设计系统的局部ER图,图,再对各局部再对各局部ER图进行集成和优化,这种方图进行集成和优化,这种方法属于概念结构设计中的()方法法属于概念结构设计中的()方法A、自顶向下、自顶向下B、自底向上、自底向上C、自内向外、自内向外D、混合策略、混合策略下列对下列对ER图设计的说法错误的是()图设计的说法错误的是()A、设计局部、设计局部ER图中,能作为属性处理的客观事图中,能作为属性处理的客观事物应尽量作为属性处理物应尽量作为属性处理B、局部、局部ER图中的属性均应为原子属性,即不能图中的属性均应为原子属性,即不能再细分为子属性的组合再细分为子属性的组合C、对局部

141、、对局部ER图集成时既可以一次实现全部集成,图集成时既可以一次实现全部集成,也可以两两集成,逐步进行也可以两两集成,逐步进行D、集成后所得的、集成后所得的ER图中可能存在冗余数据和冗图中可能存在冗余数据和冗余联系,应予以全部清除。余联系,应予以全部清除。n下列属于逻辑结构设计阶段任务的是()nA、生成数据字典nB、集成局部ER图nC、将ER图转换为一组关系模式nD、确定数据存取方法n若在两个局部若在两个局部ER图中,实体图中,实体“商品商品”的的编号一个被定义为数值型,另一个被定编号一个被定义为数值型,另一个被定义为字符型,则称之为()义为字符型,则称之为()nA、属性冲突、属性冲突nB、命名

142、冲突、命名冲突nC、联系冲突、联系冲突nD、结构冲突、结构冲突n在数据库的概念设计和逻辑设计之间起在数据库的概念设计和逻辑设计之间起桥梁作用的是()桥梁作用的是()nA、数据结构图、数据结构图nB、功能模块图、功能模块图nC、实体联系图、实体联系图nD、数据流图、数据流图n将一个一对多联系型转换为一个独立关将一个一对多联系型转换为一个独立关系模式时,应取()为关键字。系模式时,应取()为关键字。nA、一端实体型的关键属性、一端实体型的关键属性nB、多端实体型的关键属性、多端实体型的关键属性nC、两个实体型的关键属性的组合、两个实体型的关键属性的组合nD、联系型的全体属性、联系型的全体属性n将一

143、个将一个M对对N(MN)的联系型转换为关系)的联系型转换为关系模式时,应()模式时,应()nA、转换为一个独立的关系模式、转换为一个独立的关系模式nB、与、与M端的实体型所对应的关系模式合并端的实体型所对应的关系模式合并nC、与、与N端的实体型所对应的关系模式合并端的实体型所对应的关系模式合并nD、以上都可以、以上都可以n在从在从ER图到关系模式的转化过程中,下列说法错图到关系模式的转化过程中,下列说法错误的是()误的是()nA、一个一对一的联系可以转换为一个独立的关系、一个一对一的联系可以转换为一个独立的关系模式模式nB、一个涉及到、一个涉及到3个以上实体的多元联系也可以转个以上实体的多元联

144、系也可以转换为一个独立的关系模式换为一个独立的关系模式nC、对关系模型优化时有些模式可能要进一步分解,、对关系模型优化时有些模式可能要进一步分解,有些模式可能要合并有些模式可能要合并nD、关系模式的规范化程度越高,查询的效率就越、关系模式的规范化程度越高,查询的效率就越高。高。n设在一个设在一个ER模型中有模型中有6个不同的实体集和个不同的实体集和9个个不同的二元联系,其中包括不同的二元联系,其中包括3个一对一联系、个一对一联系、3个一对多联系和个一对多联系和3个多对多联系,则将此个多对多联系,则将此ER模模型转换成关系模型时,至少得到()个关系模型转换成关系模型时,至少得到()个关系模式。式

145、。nA、6nB、9nC、12nD、15n对数据库的物理设计优劣评价的重点是()nA、时空效率nB、动态和静态性能nC、用户界面的友好性nD、成本和效益数据库的物理结构设计的目的是()数据库的物理结构设计的目的是()A、找到一个有效、可实现的数据库存储结构、找到一个有效、可实现的数据库存储结构B、导出特定的、导出特定的DBMS可以处理的数据库模式可以处理的数据库模式和外模式和外模式C、产生反映企业组织信息需求的数据库概念、产生反映企业组织信息需求的数据库概念结构结构D、收集支持系统目标的基础数据及其处理方、收集支持系统目标的基础数据及其处理方法法n不属于数据库物理结构设计阶段任务的()nA、确定

146、选用的DBMSnB、确定数据的存放位置nC、确定数据的存取方法nD、初步确定系统的配置画出画出ER图图n设有一商业企业的局部应用,包含3个实体:“顾客”、“商品”和“厂家”,且有如下事实:顾客可以根据自己的意愿选择要购买的商品;每种商品可以有多个厂家供应。若顾客的属性包括顾客姓名、电话号码,商品的属性包括代码、品名、单价,厂家的属性包括代码、名称、地址。试画出ER图。n设某百货公司下设若干连锁店,每家连锁店有若干职工,每个职工只能服务于一家连锁店,每家连锁店经营若干商品,各连锁店经营的商品不完全相同。试自行设计属性,画出该百货公司管理数据库的ER图,并将ER图转换为关系模型。n设有电影放映管理

147、系统的一个局部ER图,试将其转化为关系模型,并根据语义确定各关系模式的关键字。电影电影影院影院摄制单位摄制单位票房总额票房总额所在城市所在城市影院代码影院代码结束日期结束日期起始日期起始日期发行代号发行代号电影名称电影名称放映放映nm作业作业设某商业集团数据库中有设某商业集团数据库中有3个实体集。一是个实体集。一是“公司公司”实体实体集,属性有公司编号、公司名、地址等;二是集,属性有公司编号、公司名、地址等;二是“仓库仓库”实体集,属性有仓库编号、仓库名、地址等;三是实体集,属性有仓库编号、仓库名、地址等;三是“职工职工”实体集,属性有职工编号、姓名、性别等。实体集,属性有职工编号、姓名、性别等。公司与仓库间存在公司与仓库间存在“隶属隶属”联系,每个公司管辖若干仓联系,每个公司管辖若干仓库,每个仓库只能属于一个公司管辖;仓库与职工之库,每个仓库只能属于一个公司管辖;仓库与职工之间存在间存在“聘用聘用”联系,每个仓库可聘用多个职工,每联系,每个仓库可聘用多个职工,每个职工只能在一个仓库工作,仓库聘用职工有聘期和个职工只能在一个仓库工作,仓库聘用职工有聘期和工资。工资。(1)试画出)试画出ER图,并在图上注明属性、联系的类型图,并在图上注明属性、联系的类型(2)将)将ER图转换成关系模式集,并指出每个关系模式图转换成关系模式集,并指出每个关系模式的主键和外键。的主键和外键。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号