《同方第6章61信息系统与数据库》由会员分享,可在线阅读,更多相关《同方第6章61信息系统与数据库(41页珍藏版)》请在金锄头文库上搜索。
1、医学信息教研室同方教育第六章第六章 信息系统与数据库信息系统与数据库 计算机信息系统 什么是计算机信息系统 计算机信息系统 的类型 同方教育信息和数据(复习)信息和数据(复习)n数据是事实,概念或指令的一种可供计算机加工处理的特殊表示形式。n信息是对人们“有用”的数据。同方教育什么是计算机信息系统什么是计算机信息系统 计算机信息系统(Computer_based Information System ,简称信息系统)是一类以提供信息服务为主要目的的数据密集型、人机交互的计算机应用系统。n4个主要技术特点 数据量大,一般需存放在外存中 数据存储持久性 数据资源使用共享性 信息服务功能多样性 (管
2、理,检索,分析,决策等) 同方教育信息系统的结构信息系统的结构n基础设施n资源管理n业务逻辑n应用表现同方教育计算机信息系统计算机信息系统 的类型的类型 业务处理信息系统业务处理信息系统信息检索系统信息检索系统信息分析系统信息分析系统专家系统专家系统注意和书上总结的更加详细注意和书上总结的更加详细同方教育计算机信息系统计算机信息系统 的类型的类型 业务处理系统 信息检索系统 信息分析系统 一种高层次的信息系统,为管理决策人员掌握部门运行规律一种高层次的信息系统,为管理决策人员掌握部门运行规律和和 趋势,制订规划、进行决策的辅助系统。趋势,制订规划、进行决策的辅助系统。例如例如: 决策支持系统(
3、决策支持系统(DSS),专家系统专家系统 等等 将原始信息进一步处理并存储专门供检索用的将原始信息进一步处理并存储专门供检索用的DB中。中。用户检索匹配获得信息用户检索匹配获得信息. 例如例如: 中国科技文献库、专中国科技文献库、专利数据库、学位论文数据库,利数据库、学位论文数据库,DIALOG、ORBIT以及以及WE检索系统等检索系统等.企业业务流程信息化企业业务流程信息化同方教育发展趋势发展趋势n信息多媒体化n系统集成化n功能智能化n分布式结构同方教育随着计算机技术的发展,以及数据处理量随着计算机技术的发展,以及数据处理量的增长,计算机数据管理技术也在不断地发的增长,计算机数据管理技术也在
4、不断地发展。展。根据提供的数据独立性、数据共享性、数根据提供的数据独立性、数据共享性、数据完整性、数据存取等水平的高低,计算机据完整性、数据存取等水平的高低,计算机数据管理技术的发展可以分为三个阶段:数据管理技术的发展可以分为三个阶段:人工管理阶段人工管理阶段文件系统阶段文件系统阶段数据库系统阶段数据库系统阶段数据管理技术的发展数据管理技术的发展同方教育 人工管理阶段人工管理阶段在在世世纪纪年年代代中中期期之之前前,计计算算机机主主要要用用于于科科学学计计算,数据管理处于人工管理阶段。其特点主要是:算,数据管理处于人工管理阶段。其特点主要是:数数据据管管理理尚尚无无统统一一的的数数据据管管理理
5、软软件件,主主要要依依靠靠应应用用程程序序管管理理数数据据。程程序序设设计计人人员员不不仅仅要要规规定定数数据据的的逻逻辑辑结结构,而且要设计数据的物理存储结构、存取方式;构,而且要设计数据的物理存储结构、存取方式;数数据据是是面面向向应应用用程程序序的的,一一组组数数据据只只能能对对应应一一个个应应用用程序,数据不能共享;程序,数据不能共享;应应用用程程序序依依赖赖于于数数据据,不不具具有有数数据据独独立立性性,一一旦旦数数据据的结构发生变化,应用程序往往要做相应的修改。的结构发生变化,应用程序往往要做相应的修改。同方教育 文件系统阶段世世纪纪年年代代后后期期到到年年代代中中期期,随随着着操
6、操作作系系统统的的产产生生和和发发展展,程程序序设设计计人人员员可可以以利利用用操操作作系系统统提提供供的的文文件件系系统统功功能能,将将数数据据按按其其内内容容、用用途途和和结结构构等等组组织织成成若若干干个个互互相相独独立立的的数数据据文文件件。文文件件系系统统管管理理数数据据具具有以下特点:有以下特点:数据可以数据可以以以文件形式文件形式长期存储在辅助存储器中长期存储在辅助存储器中;程程序序与与数数据据之之间间具具有有相相对对的的独独立立性性,即即数数据据不不再再属属于于某某个特定的应用程序,可以重复使用;个特定的应用程序,可以重复使用;数数据据文文件件组组织织已已呈呈多多样样化化,有有
7、索索引引文文件件、连连接接文文件件、直直接存取文件等。接存取文件等。同方教育文件系统的的局限虽然用文件系统管理数据已有了长足的进步,但虽然用文件系统管理数据已有了长足的进步,但面对数据量大且结构复杂的数据管理任务面对数据量大且结构复杂的数据管理任务,文件系统,文件系统仍不能胜任。例如,数据文件之间相互独立、缺乏联仍不能胜任。例如,数据文件之间相互独立、缺乏联系;数据冗余度大且易产生数据不一致性;数据无集系;数据冗余度大且易产生数据不一致性;数据无集中管理,其安全性得不到保证,等等。中管理,其安全性得不到保证,等等。举例:一个举例:一个EXCEL表格多次修改且分开存放导致的管表格多次修改且分开存
8、放导致的管理困难(并且这种管理实际上是人工管理)理困难(并且这种管理实际上是人工管理)我们的想法是:尽可能的让计算机去做原来由人做的事我们的想法是:尽可能的让计算机去做原来由人做的事情而不是反之情而不是反之同方教育 数据库系统阶段在在世世纪纪年年代代后后期期以以来来,为为了了适适应应日日益益迅迅速速增增长长得得数数据据处处理理的的需需要要,数数据据库库系系统统应应运运而而生生。数数据据库库系系统统克克服服了了文文件件系系统统的的缺缺陷陷,其其主主要特点有以下四个方面:要特点有以下四个方面:采采用用数数据据模模型型表表示示复复杂杂的的数数据据结结构构。数数据据模模型型不不仅仅描描述述数数据据本本
9、身身的的特特征征,还还要要描描述述数数据据之之间间的的联联系系。因因此此数数据据不不再再面面向向特特定定的的某某个个应应用用,而而是是面面向向整整个个应应用用系系统统,且且数数据据冗冗余余明明显显减减少少,可实现可实现数据共享数据共享同方教育 数据库系统阶段有较高的有较高的数据独立性数据独立性。数据的结构分为逻辑结构。数据的结构分为逻辑结构与物理结构等不同的层次,用户以简单的逻辑结与物理结构等不同的层次,用户以简单的逻辑结构操作数据,而无需考虑数据的物理结构。构操作数据,而无需考虑数据的物理结构。提供了较高的提供了较高的数据安全性、完整性数据安全性、完整性等控制功能,等控制功能,以及对数据操作
10、的以及对数据操作的并发控制、数据的备份与恢复并发控制、数据的备份与恢复等功能。等功能。为用户提供了为用户提供了方便的用户接口方便的用户接口。目前,世界上已有数以万计的数据库系统在运行。目前,世界上已有数以万计的数据库系统在运行。数据库技术已经成为现代信息技术的重要组成部数据库技术已经成为现代信息技术的重要组成部分,是现代计算机应用系统的基础和核心。分,是现代计算机应用系统的基础和核心。同方教育 数据库系统的特点数据库系统的特点数据结构化。数据可共享数据独立于程序统一管理控制数据DBMS管理控制数据功能管理控制数据功能:安全性安全性,完整性完整性.并发控制并发控制,恢复恢复. 从全局分析和描述数
11、据,适应从全局分析和描述数据,适应多个用户、多种应用共享数据的多个用户、多种应用共享数据的需求。可减少数据冗佘,节省存需求。可减少数据冗佘,节省存储空间,保证数据的一致性储空间,保证数据的一致性. 数据面向全局应用,用数据模型数据面向全局应用,用数据模型描述数据和数据之间的联系。描述数据和数据之间的联系。逻辑独立性逻辑独立性:应用程序与应用程序与DB的逻辑的逻辑结构相互独立结构相互独立.物理独立性物理独立性:应用程序与应用程序与DB的存储的存储结构相互独立结构相互独立.同方教育 数据库系统的组成数数据据库库系系统统(Database System,简简称称DBS)是是实实现现有有组组织织地地、
12、动动态态地地存存储储大大量量关关联联数数据据,方方便便用用户户访访问问的的计计算算机机软软硬硬件资源组成的具有管理数据库功能的计算机系统。件资源组成的具有管理数据库功能的计算机系统。从从狭狭义义上上讲讲,数数据据库库系系统统由由数数据据库库、数数据据库库管管理理员员和和有有关关软软件件组组成成。这这些些软软件件包包括括数数据据库库管管理理系系统统、宿宿主主语语言言、开开发发工工具具和和应应用用程程序序。数数据据库库管管理理系系统统用用于于建建立立、使使用用、维维护护数数据据库库;宿宿主主语语言言是是可可以以嵌嵌入入数数据据库库语语言言的的程程序序设设计计语语言言;数数据据库库是是长长期期储储存
13、存在在计计算算机机中中有有组组织织的的大大量量的的、可可以以共共享享的的数数据据集集合合;数数据据库库管管理理员员负负责责创创建建、监监控控和和维护数据库。数据库系统的基本组成维护数据库。数据库系统的基本组成。同方教育数据库系统的组成数据库系统的组成 用户用户终端终端应用系统应用系统数据库管理员数据库管理员系统分析设计员系统分析设计员系统程序员系统程序员用户视图用户视图逻辑结构逻辑结构 存储结构存储结构DB数据和数据数据和数据结构结构DBMS操作系统操作系统软件系统软件系统同方教育数据库数据库数数据据库库()是是指指以以一一定定的的组组织织形形式式长长期期存存放放在在计计算机存储介质上的互相关
14、联的数据的集合。算机存储介质上的互相关联的数据的集合。数数据据库库中中的的数数据据按按一一定定的的数数据据模模型型组组织织、描描述述和和储储存存,具具有有较较小小的的冗冗余余度度,较较高高的的数数据据独独立立性性和和易易扩扩展展性性,并并可可以以供供各各种种用用户户共共享享。整整个个数数据据库库的的建建立立、运运用用和和维维护护由由数数据据库库管管理理系系统统统统一一管管理理、统统一一控控制制。用用户户能能方方便便地地定定义义数数据据和和操操纵纵数数据据,并并保保证证数数据据的的安安全全性性、完完整整性性、多用户对数据的并发使用及发生故障后的数据恢复。多用户对数据的并发使用及发生故障后的数据恢
15、复。同方教育数据库通常包括两部分内容:一是按一定的数据数据库通常包括两部分内容:一是按一定的数据模型组织并实际存储的所有应用需要的模型组织并实际存储的所有应用需要的数据数据;二;二是存放在数据字典中的各种是存放在数据字典中的各种描述信息描述信息,包括所有,包括所有数据的结构名、存储方式、完整性约束、使用权数据的结构名、存储方式、完整性约束、使用权限等信息,这些描述信息通常称为限等信息,这些描述信息通常称为“元数据元数据”。数据库按数据库按数据模型数据模型可分成可分成层次型数据库、网层次型数据库、网状数据库、关系数据库和面向对象数据库状数据库、关系数据库和面向对象数据库。数据库数据库同方教育 数
16、据库管理系统数数据据库库管管理理系系统统(Database Management System简简称称DBMS)是是用用于于建建立立、使使用用和和维维护护数数据据库库的的系系统统软软件件。它它对对数数据据库库进进行行统统一一的的管管理理和和控控制制,以以保保证证数数据据库库的的安安全全性性和和完完整整性性。用用户户通通过过DBMS访访问问数数据据库库中中的的数数据据,数数据据库库管管理理员员也也通过通过DBMS进行数据库的维护工作。进行数据库的维护工作。数据库数据库(Database)数据库管理员数据库管理员(Database Administrator )同方教育13 数据库系统的分级结构数
17、据库系统的分级结构为为了了实实现现数数据据库库的的独独立立性性,便便于于数数据据库库的的设设计计和和实实现现,美美国国国国家家标标准准局局(ANSI)计计算算机机与与信信息息处处理理委委员员会会(代代号号为为X3)以以及及标标准准规规划划和和要要求求委委员员会会(SPARC)在在1975年年将将数数据据库库系系统统的的结结构构定定义义为为三三级级模模式式结结构构:外外部部层层(单单个个用用户户的的视视图图)、概概念念层层(全全体体用用户户的的公公共共视视图图)和和内部层(存储视图)内部层(存储视图)。同方教育外外部部层层是是最最接接近近用用户户的的层层次次,它它是是数数据据库库的的“外外部部视
18、视图图”,是是各各个个用用户户所所看看到到的的数数据据库库。它它所所表表示示的的是是数数据据库的局部逻辑,是库的局部逻辑,是面向单个用户面向单个用户的的内内部部层层是是最最接接近近物物理理存存储储的的层层次次。它它是是数数据据库库的的“内内部部视视图图”或或“存存储储视视图图”。它它与与数数据据库库的的实实际际存存储储密密切切相相关关,可可以以理理解解为为机机器器“看到看到”的数据库的数据库。概概念念层层是是介介于于上上述述两两者者之之间间的的层层次次。它它是是数数据据库库的的“概概念念视视图图”,是是数数据据库库中中所所有有信信息息的的抽抽象象表表示示。它它既既抽抽象象于于物物理理存存储储的
19、的数数据据,也也区区别别于于各各个个用用户户所所见见到到的的局局部部数数据据库库。概概念念视视图图可可以以理理解解为为数数据据库库管管理理员员所所看看到到的的数数据库。据库。数据库系统结构的外部层、概念层和内部层分别对数据库系统结构的外部层、概念层和内部层分别对应于数据库模式的外模式、模式和内模式应于数据库模式的外模式、模式和内模式同方教育数据库系统结构分级对于提高数据独立性具数据库系统结构分级对于提高数据独立性具有重要意义。在三级结构间存在两级映射。概念有重要意义。在三级结构间存在两级映射。概念层与内部层之间的映射定义了概念视图与物理存层与内部层之间的映射定义了概念视图与物理存储之间的对应。
20、如果物理存储的结构发生了变化,储之间的对应。如果物理存储的结构发生了变化,可以相应地改变概念层与内部层之间映射,而使可以相应地改变概念层与内部层之间映射,而使概念视图保持不变,即将物理存储的变化隔离在概念视图保持不变,即将物理存储的变化隔离在概念层下,不反映在用户面前,因此应用程序可概念层下,不反映在用户面前,因此应用程序可以保持不变,这称为以保持不变,这称为数据的物理独立性数据的物理独立性。外部层。外部层与概念层映射定义了单个用户的外部视图与全局与概念层映射定义了单个用户的外部视图与全局的概念视图之间的对应。如果概念视图发生变化,的概念视图之间的对应。如果概念视图发生变化,可以改变外部层与概
21、念层之间的映射,而使用户可以改变外部层与概念层之间的映射,而使用户看到的外部视图保持不变,因此应用程序可以保看到的外部视图保持不变,因此应用程序可以保持不变,这称作持不变,这称作数据的逻辑独立性数据的逻辑独立性。同方教育 数据模型信信息息来来源源于于客客观观事事物物,然然后后通通过过人人们们加加工工处处理理再再用用来来控控制制客客观观事事物物。如如何何将将现现实实世世界界中中各各种种复复杂杂的的事事情情最最终终以以计计算算机机及及数数据据库库所所允允许许的的形形式式反反映映到到数数据据中中去去?这这需要一个逐步转化的过程。需要一个逐步转化的过程。一一般般地地讲讲,这这一一个个转转化化过过程程分
22、分为为三三个个阶阶段段,或或者者说说需需要要通通过过三三个个世世界界:首首先先将将现现实实世世界界中中客客观观的的事事物物抽抽象象为为信信息息世世界界中中的的实实体体,然然后后再再转转换换为为DBMS支支持持数数据据世世界中的数据它们之间的关系如图界中的数据它们之间的关系如图1-3所示。所示。信信息息的的这这一一循循环环经经历历了了三三个个领领域域:现现实实世世界界、观观念念世世界界和数据世界和数据世界。三个领域的内容及其联系可用图。三个领域的内容及其联系可用图1-3表示。表示。同方教育数数据据模模型型(Data Model)是是在在数数据据库库领领域域中中定定义义数数据据及及其其操操作作的的
23、一一种种抽抽象象表表示示。数数据据模模型型可可以以由由三三个个部部分分组组成成:实实体体及及实实体体间间联联系系的的数数据据结结构构描描述述,对对(表表示示实实体体和和联联系系的的)数数据据的的操操作作,以以及及数数据据的的完完整整性性约约束束条条件件。根据适用对象的不同、数据模型可以分为两类:根据适用对象的不同、数据模型可以分为两类:面面向向客客观观世世界界、面面向向用用户户的的称称为为概概念念数数据据模模型型(简简称称“概概念念模模型型”),这这类类数数据据模模型型描描述述用用户户和和设设计计者者都都能能理理解解的的信信息息结结构构,强强调调其其表表达达能能力力和和易易理理解解性性,如如E
24、-R模模型;型;面面向向数数据据库库管管理理系系统统的的,用用以以刻刻画画实实体体在在数数据据库库中中的的存存储储形形式式,称称为为逻逻辑辑数数据据模模型型(数数据据模模型型),如如层层次次模模型型、网状模型、关系模型、面向对象模型。网状模型、关系模型、面向对象模型。同方教育概念模型概概念念模模型型是是按按用用户户的的观观点点对对数数据据建建模模,它它是是对对现现实实世世界界的的第第一一层层抽抽象象,是是用用户户和和数数据据库库设设计计人人员员之之间间的的进进行行交交流流的的工工具具,强强调调其其语语义义表表达达能能力力,应应该该简简单单、清清晰晰、易易于于理理解解。长长期期以以来来,在在数数
25、据据库库设设计计中中广广泛泛使使用用的的概概念念模模 型型 当当 属属 “实实 体体 联联 系系 ”模模 型型 ( Entity-Relationship Model, 简称简称E-R模型)模型)。同方教育1E-R模型的基本概念E-R模型中有模型中有3个基本的抽象概念:个基本的抽象概念:实体、联实体、联系和属性。系和属性。实体(实体(Entity)是客观存在、可以互相区别的)是客观存在、可以互相区别的事物。实体可以是具体的对象事物。实体可以是具体的对象(例如一位学(例如一位学生、一本书),也可以是抽象的对象(例如生、一本书),也可以是抽象的对象(例如一次考试、一场比赛)。具有相同性质的实一次考
26、试、一场比赛)。具有相同性质的实体集合称为实体集,例如全校学生的集合组体集合称为实体集,例如全校学生的集合组成学生实体集。实体集中各个实体借助实体成学生实体集。实体集中各个实体借助实体标识符(称为关键字)加以区别,例如在学标识符(称为关键字)加以区别,例如在学生实体集中可以通过学号来区别每一个实体。生实体集中可以通过学号来区别每一个实体。同方教育联系(联系(Relationship)是实体集之间关系的)是实体集之间关系的抽象表示抽象表示。例如,教师实体集与学生实体集之间。例如,教师实体集与学生实体集之间存在存在“讲授讲授”联系,学生实体集与课程实体集之间联系,学生实体集与课程实体集之间存在存在
27、“选课选课”联系,等等。两个实体集之间的联系联系,等等。两个实体集之间的联系可以分为一对一联系、一对多联系或多对多联系。可以分为一对一联系、一对多联系或多对多联系。假设有两个实体集假设有两个实体集X和和Y:如果如果X与与Y中的每一个实体至多和另一个实体集中的每一个实体至多和另一个实体集中的一个实体有联系,则称中的一个实体有联系,则称X与与Y是是一对一联系一对一联系(简记为(简记为1:1)如果如果X中的每一个实体至多和中的每一个实体至多和Y中的任意个(包中的任意个(包括括0个)实体有联系,则称个)实体有联系,则称X与与Y是是一对多联系一对多联系(简记为(简记为1:m););如果如果X与与Y中的每
28、一个实体和另一个实体集中的中的每一个实体和另一个实体集中的任意个(包括任意个(包括0个)实体有联系,则称个)实体有联系,则称X与与Y是是多多对多联系对多联系(简记为(简记为m:m)。)。同方教育属性属性(属性(Attribute)是指实体或联系所具有的)是指实体或联系所具有的特征。特征。通常一个实体可以由多个属性来描述,通常一个实体可以由多个属性来描述,即实体可以用属性集来表示。例如,学生实即实体可以用属性集来表示。例如,学生实体可以用学号、姓名、性别、年龄、系别等体可以用学号、姓名、性别、年龄、系别等属性来描述,学生实体集与课程实体集间的属性来描述,学生实体集与课程实体集间的“选课选课”联系
29、可以有选课时间、所选课程代号、联系可以有选课时间、所选课程代号、课程名称、成绩等属性。课程名称、成绩等属性。对于实体集来说,对于实体集来说,能唯一标识实体集中某一实体的属性或属性能唯一标识实体集中某一实体的属性或属性组称为实体集的标识关键字(简称组称为实体集的标识关键字(简称“关键字关键字”)同方教育2E-R图E-R图图是是E-R模模型型的的图图形形表表示示法法,它它是是直直接接表表示示概概念念模模型型的的有有力力的的工工具具。在在E-R图图中中,用用矩矩形形框框表表示示实实体体集集,菱菱形形框框表表示示联联系系,椭椭圆圆形框表示属性。形框表示属性。例例如如,在在学学校校的的教教学学管管理理系
30、系统统中中存存在在学学生生、成成绩绩等等实实体体集集,可可用用E-R图图来来表表述述该该系系统统的的概概念模型。念模型。同方教育关系模型关系模型关关系系模模型型(Relational Model)以以关关系系代代数数理理论论为为基基础础,20世世纪纪70年年代代的的研研究究主主要要集集中中在在理理论论和和实实验验系系统统的的开开发发方方面面,到到80年年代代初初才才形形成产品,但很快得到广泛的应用和普及。成产品,但很快得到广泛的应用和普及。1关系与关系模式关系与关系模式关关系系是是以以二二维维表表结结构构来来表表示示实实体体集集及及其其实实体体间间的的联联系系。一一个个关关系系就就是是一一张张
31、二二维维表表,关关系系的的首首行行称称为为“属属性性”(在在关关系系数数据据库库中中称称为为“字字段段”),其其它它各各行行称称为为“元元组组”(在在关关系系数数据据库库中中称称为为“记录记录”)。)。同方教育关系模型的性质1、每一列的数据来自同一个域、每一列的数据来自同一个域(属于同一种数据类(属于同一种数据类型)型)2、每一列有唯一的字段名、每一列有唯一的字段名3、不允许出现完全相同的行、不允许出现完全相同的行4、行列的顺序是无所谓的、行列的顺序是无所谓的(即行列的顺序不影响数(即行列的顺序不影响数据操作)据操作)5、每个数据项都是不可再分的、每个数据项都是不可再分的其中,第其中,第5点性
32、质是最重要的,凡满足这一点的关系点性质是最重要的,凡满足这一点的关系称为符合称为符合第一范式第一范式的。以下表格不能作为关系模的。以下表格不能作为关系模型型同方教育关键字按按集集合合中中不不允允许许出出现现相相同同的的元元素素的的性性质质,二二维维表表中中也也不不允允许许出出现现相相同同的的记记录录。因因此此,一一张张表表中中的的一一列列或或若若干干列列能能够够把把不不同同的的记记录录区区分分开开来来,或或者者说说能能够够唯唯一一确确定定记录。记录。超超关关键键字字:二二维维表表中中能能唯唯一一确确定定记记录录的的一一个个列列或或几几个个列列的的组组被被称称为为“超超关关键键字字”(super
33、 key)。显显然然,二二维维表表的的全全体体字字段段必必然然构构成成它它的的一一个个超超关关键键字字。超超关关键键字字虽虽然然能能唯唯一一确确定定记记录录,但但是是它它所所包包含含的的字字段段可可能能是是有有多多余余的的。一一般般希希望望用用最最少少的的字字段段来来唯唯一一确确定定记记录录。如如果果是是用用单单一一的的列列构构成成关关键键字字,则则称称其其为为“单单一一关关键键字字(single key)”;如如果果是是用用两两个个或或两两个个以以上上的的列列构构成成关关键键字字,则则称其为称其为“合成关键字(合成关键字(composite key)”。同方教育关键字侯选关键字:侯选关键字:
34、 如果一个超关键字,去掉其中任何如果一个超关键字,去掉其中任何一个字段后不再能唯一确定记录,则称它为侯选关键一个字段后不再能唯一确定记录,则称它为侯选关键字字(candidate key)。侯选关键字既能唯一确定记录,侯选关键字既能唯一确定记录,它包含的字段又是最精练的。一个二维表中总存在超它包含的字段又是最精练的。一个二维表中总存在超关键字,因而也必存在侯选关键字。一个二维表中有关键字,因而也必存在侯选关键字。一个二维表中有几个侯选关键字呢?至少有一个,也可能有多个。几个侯选关键字呢?至少有一个,也可能有多个。主关键字:从二维表的侯选关键字中,选出一个主关键字:从二维表的侯选关键字中,选出一
35、个可作为主关键字(可作为主关键字(primary key)。)。 对于表中的每个对于表中的每个记录来说,主关键字必须包含一个不同于其他记录的记录来说,主关键字必须包含一个不同于其他记录的唯一的值。唯一的值。这就意味着主关键字的值不能为空这就意味着主关键字的值不能为空,否则,否则主关键字就起不了唯一标识记录的作用主关键字就起不了唯一标识记录的作用同方教育2关键字关键字外部关键字:当一个二维表(外部关键字:当一个二维表(A表)的主关键字被表)的主关键字被包含到另一个二维表(包含到另一个二维表(B表)中时,它就称为表)中时,它就称为B表的外表的外部关键字部关键字(foreign key)。例如,在学
36、生表中,。例如,在学生表中,“学号学号”是是主关键字,而在成绩表中,主关键字,而在成绩表中,“学号学号”便成了外部关键字。便成了外部关键字。在数据库结构设计中,应该指出各个二维表的主关在数据库结构设计中,应该指出各个二维表的主关键字,如果主关键字过于复杂,往往要增设一个字段,键字,如果主关键字过于复杂,往往要增设一个字段,这个字段的内容是该类事物的编号或代号,用这个字段这个字段的内容是该类事物的编号或代号,用这个字段来作为单一主关键字。如学号字段。来作为单一主关键字。如学号字段。大多数二维表中,只有一个侯选关键字,有的复杂大多数二维表中,只有一个侯选关键字,有的复杂的二维表中有多个侯选关键字。
37、在一般的应用中,找出的二维表中有多个侯选关键字。在一般的应用中,找出一个侯选关键字已够了,并以它一个侯选关键字已够了,并以它作为主关键字作为主关键字,不必找,不必找出全部侯选关键字。出全部侯选关键字。课程表课程表 成绩表成绩表“课程代号”可作为关键字“课程名”如没有重复,也可作为关键字成绩表的关键字应该是?“学号”+“课程代号”组合关键字“课程代号”和“课程名”都可作为“候选关键字”在“候选关键字”中可选出一个作为主关键字同方教育学生表课程表成绩表组合关键字主关键字主关键字外部关键字外部关键字AB同方教育关系模型关系模型用用二二维维表表表表示示实实体体集集,通通过过外外部部关关键键字字表表示示
38、实实体体间间联联系系的的数数据据模模型型称称为为关关系系模模型型。关关系系模模型型是是关关系系模模式式的的集集合合,它它一一般般有有三三个个组组成成部部分分:数数据据结结构构、数数据据操操作作和和完整性规则。完整性规则。数数据据结结构构:数数据据库库中中所所有有及及其其互互相相联联系系都都被被组组织织成成关关系系(二维表)的形式;(二维表)的形式;数数据据操操作作:提提供供一一组组完完备备的的关关系系运运算算(包包括括关关系系代代数数、关系演算),以支持对数据库的各种操作;关系演算),以支持对数据库的各种操作;完完整整性性规规则则:包包括括域域完完整整性性规规则则、实实体体完完整整性性规规则则
39、、参参照完整性规则和用户定义的完整性规则等。照完整性规则和用户定义的完整性规则等。同方教育关系数据模型结构关系数据模型结构关系模式的描述形式:其中:R为关系模式名,即二维表名。Ai(1in)是二维表中的列名表中的列名或者或者: R =(A1,A2,Ai,An)R(A1,A2,Ai,An) 同方教育关系数据模型结构关系数据模型结构这3个关系模式也可以用汉字定义为: 学生学生 (学号学号,姓名,系别,性别,出生日期,身高),姓名,系别,性别,出生日期,身高) 课程课程 ( 课程号课程号,课程名,学时,开课时间),课程名,学时,开课时间) 选课成绩选课成绩 (学号,课程号学号,课程号,成绩),成绩)
40、 同方教育关系数据模型结构关系数据模型结构 n.上述数据对象(上述数据对象(S和和C)以及数据对象之间的联系()以及数据对象之间的联系(SC)表示成关系模式分别为:表示成关系模式分别为: S (SNO,SNAME,DEPART,SEX,BDATE,HEIGHT) C (CNO,CNAME,LHOUR,SEMESTER) SC(SNO,CNO,GRADE) 同方教育规范化理论主要是以关系代数为基础,规范化理论主要是以关系代数为基础,研究关系模式中属性之间的依赖关系研究关系模式中属性之间的依赖关系从从1970年年IBM公公司司的的E.F.Codd发发表表的的著著名名论论文文“大大型型共共享享数数据
41、据库库的的数数据据关关系系模模型型”以以来来,关关系系模模型型理理论论和和关关系系数数据据库库得得到到了了全全面面的的发发展展。关关系系模模型型以以严严格格的的数数学学为为基基础础,并并形形成成了了一一整整套套的的关关系系数数据据库库理理论论规规范范化化理理论论。规规范范化化理理论论主主要要是是以以关关系系代代数数为为基基础础,研研究究关关系系模模式式中中属属性性之之间间的的依依赖赖关关系系。所所谓谓关关系系的的规规范范化化,就就是是对对关关系系模模式式应应当当满满足足的的条条件件的的某某种种处处理理,其其目目的的是是尽尽可可能能地地减减少少数数据据冗冗余余、消消除除异异常常现现象象、增增强强数数据据独独立立性性、便于用户使用等。便于用户使用等。