大型关系数据库

上传人:wt****50 文档编号:53592153 上传时间:2018-09-03 格式:PPT 页数:64 大小:293KB
返回 下载 相关 举报
大型关系数据库_第1页
第1页 / 共64页
大型关系数据库_第2页
第2页 / 共64页
大型关系数据库_第3页
第3页 / 共64页
大型关系数据库_第4页
第4页 / 共64页
大型关系数据库_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《大型关系数据库》由会员分享,可在线阅读,更多相关《大型关系数据库(64页珍藏版)》请在金锄头文库上搜索。

1、第2章 大型关系数据库,2.1 概述,数据处理是指对各种形式的数据进行收集、组织、加工、储存、抽取和传播的一系列活动的总和。 数据管理是指对数据的组织、存储、检索和维护,是数据处理的中心环节。主要围绕提高数据独立性、降低数据的冗余度、提高数据共享性、提高数据的安全性和完整性等方面来进行改进,使使用者能有效地管理和使用数据资源。 2.1.1 数据管理发展的三个阶段 1 手工管理阶段(50年代中期以前) 2 文件管理阶段(50年代后期-60年代中期)3 数据库系统管理阶段(60年代后期开始),1 手工管理阶段: 背景: 计算机主要用于科学计算(数据量小、结构简单,如高阶方程、曲线拟和等)。 外存只

2、有磁带、卡片、纸带等,没有磁盘等直接存取设备。 没有操作系统,没有数据管理软件(用户用机器指令编码)。,特点: 数据由人工保存 一组数据只能面向一个应用程序,不能实现多个程序的共享数据。 不同程序不能直接交换数据,数据没有任何独立性。,2 文件管理阶段: 用文件系统管理数据具有如下特点: (1) 一个应用程序对应一组文件,不同的应用系统之间可以经过转化程序共享数据;多个应用程序可以设计成共享一组文件,但多个应用程序不能同时访问共享文件组。,(2) 大量的应用数据以记录为单位可以长期保留在数据文件中,可以对文件中的数据进行反复地查询、增加、删除和修改等操作。 (3) 数据的独立性差 (4) 数据

3、的共享性差,冗余大,3 数据库系统管理阶段 主要的特点包括: (1) 数据库具有面向各种应用的数据组织和结构。 (2) 具有高度的数据独立性。数据结构可分为数据的物理存储结构和数据的逻辑结构。,图1-4,(3) 实现数据的高度共享并保证数据的完整性和安全性: DBMS要提供以下的四种控制机制: 多用户并发 数据完整性 数据安全性 数据库恢复机制,2.1.2 数据库的基本概念 1. 数据 Data 人们通常使用各种各样的符号来表示客观事物的特性和特征,这些符号及其组合就是数据。 数据的语义:数据所表示的含义。2. 数据库 DB(Data Base) 数据库是长期储存在计算机内的、有组织的、可共享

4、的数据集合,也是现实世界中相互关联的大量数据及数据间关系的集合。 数据库中的数据按一定的数据模型组织、描述和储存,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。3.数据库管理系统DBMS (Data Base Management System): 是对数据库中的数据进行存储和管理的软件系统。例如,ACCESS,dBASE,DB2,SQL SERVER,4. 数据库系统DBS ( Data Base System)一个数据库系统,应该包括数据库应用系统、数据库应用开发接口、数据库管理系统,操作系统、数据库、数据库管理员DBA和用户组成。,图1-1 数据库系统,数据库应用程序

5、 数据库用户数据库用户中有一个特殊的用户负责对DBMS进行集中的管理与控制,这个用户就是数据库管理员(Database Administrator,缩写为DBA)。,数据库管理系统在计算机系统中的地位如图1-2所示。,图12 数据库管理系统与计算机系统,2.1.3 数据库技术发展 1. 第一代:层次和网状数据库: (1) 层次数据库系统: IBM公司于1968年研制成功的数据库管理系统(IMS-Information Management System信息管理系统),层次数据库IMS是世界上第一个DBMS系统。(2) 网状数据库系统:典型的网状数据模型是DBTG(Data Base Task

6、Group)系统。 2. 第二代:关系数据库系统RDBMS(Relational DBMS) 1974年,IBM公司研制成功了关系数据库管理系统System R。目前我国应用较多的RDBMS有ORACLE, SQL SERVER,INFORMIX,DB2,SYBASE等。 3. 第三代:面向对象的数据库系统OODBMS(Object Oriented DBMS) 如:objectStore、ONTOS、VERSANT、GemStore等。,2.2 数据模型,数据模型是对现实世界中各种事物或实体特征的数字化模拟和抽象,用以表示现实世界中的实体及实体之间的联系,使之能存放到计算机中,并通过计算机软

7、件进行处理。 2.2.1数据视图和数据模式 1.数据视图 数据视图可分为三个层次: 外部层(视图层):数据的局部逻辑视图,是针对局部用户描述的数据库的部分内容,是用户看到的和直接操作的数据视图,也称用户个人视图。 概念层:数据的全局逻辑视图,也称全体用户视图。 内部层:是数据的物理存储层,是数据库的整体内部视图。也称内视图。,图2-1,2. 数据模式 在数据库中,对数据(实体)的具体描述称为数据模式。 数据模式也分为三个层次: 外模式:对数据库局部逻辑结构的描述。 外模式是用户与数据库系统的接口,用户使用数据操纵语言DML语句对数据库进行操作,实际上是对外模式描述的数据进行操作。 概念模式:对

8、数据库全局逻辑结构的描述,也称为逻辑模式。 是数据库所有外模式的联合(UNIN),概念模式包括概念实体的类型、实体之间的联系、数据完整性约束等。 内模式:对数据库数据物理存储结构内容的描述 。 它定义所有的数据存储和访问控制方面的细节,2.2.2数据库系统的三级模式结构,数据库设计的过程就是综合外模式, 产生概念模式,根据使用的DBMS产生物理模式。再由概念模式导出用户视图, 就是用户看到的逻辑数据。 外模式和概念模式的映射,定义了外模式和概念模式之间的对应关系,通常在外模式中给出描述。 概念模式和内部模式的映射,概念模式和内部模式之间的对应关系。,图 2-2 数据库系统的三级模式结构,2.2

9、.3 应用程序访问数据库数据的过程,图2-4 从数据库中读取数据记录的过程,2.2.4信息世界的描述 1. 现实世界: 存在于人们头脑之外的客观世界,称为现实世界。 2. 信息世界是现实世界在人们头脑中的反映,人们用文字、图形和符号等表示它们,构成信息世界。,图2-4 现实世界中客观对象的抽象过程,3. 机器世界对信息世界中的信息进行数据化,数据化后的信息称为数据。,表 2-1 教学管理系统在三种不同的范筹内使用不同的术语,2.2.4.1 信息世界的基本概念 1实体 一个实体是现实世界客观存在的一个事物。 实体分为强实体和弱实体。 强实体:独立于其他实体而存在的实体称为强实体。 弱实体:假如实

10、体只能存在于与其他实体的一个联系中,称这些实体为弱实体。当弱实体赖以联系的实体被删除时,该弱实体也要从数据库中删除之。弱实体常用于描述动态的关系。 2实体集 结构和特性相同的实体组成的集合称为实体集。 3实体类型 描述实体集的信息结构,通常包括类型名和实体的属性名集合。例如,学生(学号,姓名,性别,年龄,班级)。 4属性 描述实体或联系的特性。,5实体标识(码或键) 其值能唯一地标识每个实体的属性或属性集称为实体的标识。 6联系联系反映实体间的相互关系。 7联系集实体间相同类型的联系也构成联系集,2.2.4.2 实体之间联系的类型 实体间的各种联系按照联系涉及的群体可以划分为两类: 不同的实体

11、集中实体之间的联系 相同的实体集内实体之间的联系。,这两种联系都有三种不同的联系情况 1. 一对一联系:如果实体集EA中每个实体至多和实体集EB中的一个实体有联系,反之亦然,就称实体集EA和实体集EB的联系为“一对一联系”,记为“1:1”。 2. 一对多联系:如果实体集EA中每个实体与实体集EB中的任意多个(零个或多个)实体有联系,而EB中每个实体至多与实体集EA中的一个实体有联系,就称实体集EA对EB的联系为“一对多联系”,记为“1:N”。,图2-6 两个实体集之间的三种联系,3. 多对多联系:如果实体集EA中的每个实体与实体集EB中的任意个(零个或多个)实体有联系,反之,实体集EB中的每个

12、实体与实体集EA中的任意个(零个或多个)实体有联系,就称实体集EA和EB的联系为“多对多联系”,记为“M:N”联系,2.2.3 实体联系模型(E-R模型) 用于数据库设计,用实体和实体间联系描述现实世界。 1.实体联系模型的描述方法 实体-联系模型,使用一个图形表示方法:E-R图。 E-R模型图是直观的表示概念模型的有力工具,在软件工程和数据库设计过程中使用很普遍,是描述数据模型很方便的方法。 2. 在描述数据模型的E-R图中,使用的符号 1) 矩形框表示实体类型。 2) 菱形表示联系类型。 3) 椭圆框表示属性。 4) 用弧(连线)表示实体或实体类型之间的联系。,图2-6 两个实体集之间的三

13、种联系,图2-10 实体集之间的联系示例,图2-11 实体集内实体之间的联系示例,多重联系:2个实体之间存在多种联系。 多元联系:一种联系设计到多个实体,多个实体之间使用同一种联系。,图2-12 多重联系和多元联系的示例,实体属性E-R图:把一个实体和该实体具有的属性用E-R图表示出来。 联系属性E-R图:把实体之间的联系和联系的属性用E-R图表示出来。,图2-13 实体属性示例 图2-14 联系属性示例,图2-15 E-R模型示例,2.3 层次数据模型,2.3.1层次数据模型的概念 层次模型是数据库系统中最早出现的数据模型. IBM公司的IMS(Information Management

14、System)数据库管理系统,世界上第一个DBMS产品。 层次模型用树型(层次)结构来表示各类实体及实体间的联系。 在数据库中定义满足下面两个条件的基本层次联系的集合为层次模型: - 有且只有一个结点没有双亲结点,这个结点称为根结点; - 根以外的其他结点有且只有一个双亲结点。,2.3.2 层次数据模型数据的组织 层次数据库的组织特点: 是用有向树结构表示实体之间的联系。 树的每个结点表示一个记录类型,它是同类实体集合的(结构)定义。 记录(类型)之间的联系用结点之间的连线(有向边)表示。 上一层记录类型和下一层记录类型的联系是1:N联系。 层次数据库只能处理一对多的实体联系。,图2-16 系

15、的组织机构,图2-17 图2-16层次模型数据库中的一个值,2.4 网状数据模型,2.4.1网状数据模型的概念 网状模型的数据组织是有向图结构,每个结点可有多个上级(父)结点,也可以有多个下级(子)结点。 最典型的网状数据模型是DBTG(Data Base Task Group)系统 在数据库中定义满足下面两个条件的基本层次联系的集合为网状模型: - 允许一个以上的结点没有双亲结点; - 至少有一个结点可以有多于一个的双亲结点。,在网状数据模型中,虽然每个结点可以有多个父结点,但是每个双亲记录和子女记录之间的联系只能是1:N的联系,因此,在网状数据模型中,对于M:N的联系,必须把M:N的联系分

16、解为多个1:N的二元联系。,图2-21 学生/选课/课程的网状模型,网状数据模型特点: 优点:网状数据模型能够更为直接地描述现实世界,如一个结点可以有多个双亲结点;存储结构具有良好的导航性能,存取效率较高; 缺点:网状数据模型结构比较复杂,而且不能直接处理多对多的关系,2.5 关系数据模型,2.5.1 关系数据模型的概念 关系数据模型是由若干关系组成的集合,每个关系从结构上看实际上是一张二维表格,表中的每行表示一个实体对象,表的每列对应一个实体属性。,表 2-4 系的关系表,关系数据模型的主要术语: * 关系(Relation):一个关系就是一张二维表,每张表有一个表名,表中的内容是对应关系模式在某个时刻的值,称为一个关系。 * 元组(Tuple):表中的一行称为一个元组。* 属性( Attribute):表中的一个列称为关系的一个属性,即元组的一个数据项。*属性域(Domain):属性的取值范围。 * 主码( Key ):或称为关键字,表中的一个属性或几个属性的组合、其值能唯一地标识表中一个元组的称为关系的主码或关键字。*外部关键字(Forgien Key):在一个关系中含有的与另一个关系的关键字相对应的属性组称为该关系的外部关键字。*关系模式: 对一个关系的结构描述。关系模式的描述格式为:关系名( 属性1, 属性2, , 属性n )。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号