《第1章数据库概论》由会员分享,可在线阅读,更多相关《第1章数据库概论(90页珍藏版)》请在金锄头文库上搜索。
1、第1章数据库概论2目录上篇 基础篇第1章 数据库概论第2章 关系运算理论第3章 SQL语言第4章 规范化设计理论第5章 DBD与ER模型第6章 DB的存储结构第7章 系统实现技术下篇 发展篇第8章 ODBS第9章 DDBS第10章 ODBC技术第11章 XML技术第12章 现代信息 集成技术3数据库系统教程(第3版)v特点:理论性强(关系运算,模式设计)应用性强(SQL,数据库设计)可操作性(有很多题目)实用系统vDBMS:DB2,Sybase,Oracle, SQL server 开源:PostgreSQL、MySQL、HSQLv工具:PB,VB,Delphi4第1章 数据库概论5第1章 数
2、据库概论1.1 引言1.2 数据库的由来和发展1.3 数据描述1.4 数据抽象的级别1.5 数据库管理系统(DBMS)1.6 数据库系统(DBS)1.7 小结6本章的重要概念(1)(1)DB、DBMS和DBS的定义(2)数据管理技术的发展阶段:人工管理、文件系统、数据库和高级数据库等各阶段的特点。(3)数据描述:概念设计、逻辑设计和物理设计等各阶段中数据描述的术语,概念设计中实体间二元联系的描述(1:1,1:N,M:N)。7本章的重要概念(2)(4)数据抽象的级别:数据模型的定义,概念模 型,逻辑模型(层次模型、网状模型、关系 模型和对 象模型),外部模型,内部模型。三层模式和两级映像,数据独
3、立性。数据抽象中各个层次中记录的联系。(5) DBMS:DBMS的工作模式和主要功能。(6) DBS:DBS的组成,DBA,DBS的全局结构,DBS结构的分类。8前言1946年:第一台计算机ENIAC问世。60年代末:数据库技术发展。目前:完善,完整的理论体系和实用技术。91.1引言v最早的数据库系统:1963年,Honeywell公司的IDS(Integrated Data Store)。(设计者Charles Bachman获1973年Turing Award) v20世纪70年代:网状系统和层次系统。 v 层次系统:1968年IBM的IMS系统v 网状系统:1969年DBTG的报告v 关
4、系系统:1970年E.F.Codd 关系模型(202X Turing Award)v v20世纪80-90年代,关系数据库成为主流。 v进入21世纪:其它类型数据库出现。 101.2 数据库的由来和发展v1.2.1 人工管理阶段v1.2.2 文件系统阶段v1.2.3 数据库阶段v1.2.4 高级数据库阶段111.2数据库的由来和发展v磁盘容量的发展数据库的发展v内存数据库时间1956 1965 1971 1978 1981 1985 1995 2003 2008容量/轴5MB30MB100MB600MB1.2GB5GB10GB180GB1TB121.2.1人工管理阶段v50年代前:v计算机主要
5、用于科学计算。v外部存储器,没有磁盘等字节存取存储设备,只有磁带、卡片和纸带等v软件只有汇编语言。v数据处理的方式:批处理。v特点:数据不保存在计算机内。没有专用的软件对数据进行管理。只有程序(program)的概念,没有文件(file)的概念。数据面向程序。即一组数据对应一个程序。131.2.2文件系统阶段(1)v50年代末60年代中:v计算机用于科学计算,还用于信息管理。v数据结构和数据管理技术迅速发展。v磁盘、磁鼓等直接存取存储设备出现。v高级语言和操作系统。v数据处理的方式有批处理、联机实时处理。141.2.2文件系统阶段(2)v特点:数据以“文件”形式可长期保存在外部存储器的磁盘上。
6、数据的逻辑结构与物理结构有了区别,但比较简单。文件组织已多样化。有索引文件、链接文件和直接存取文件等。数据不再属于某个特定的程序,可以重复使用,即数据面向应用。对数据的操作以记录为单位。v151.2.2文件系统阶段(2)vv缺陷:数据冗余(redundancy)数据不一致(inconsistency)数据联系弱(poordatarelationship)16职工工资文件职工档案文件职工保健文件文件库数据库oooooo171.2.3数据库阶段(1)v数据管理技术进入数据库阶段的标志是20世纪60年代末的三件大事: 1968年美国IBM层次模型的IMS系统 。1969年美国CODASYL组织发布了
7、DBTG报告,提出网状模型。1970年美国IBM公司的E.F.Codd ,提出关系模型。 181.2.3 数据库阶段(3)数据库的整体逻辑结构用户的局部逻辑结构数据库的物理结构逻辑数据独立性物理数据独立性图1.2 数据库系统的结构返回191.2.3数据库阶段(2)v数据库阶段的数据管理具有以下特点: 数据模型。 高的数据独立性。 方便的用户接口。 数据控制功能:并发控制,恢复,完整性和安全性。 增加了系统的灵活性 ,操作单位为数据项。20v程序和数据的联系v文件系统阶段:程序为中心1.2.3 数据库阶段(4)应用程序n应用程序1数据库输入程序输出21v数据库阶段信息处理方式的演变1.2.3 数
8、据库阶段(5)联机终端 要求报表查询处理程序报表生成程序数据库应用程序应用程序输入输出输入输出DB、DBMS、DBS、DBT的区别?22231.2.3 数据库阶段(6)v定义1.1 数据库(Database,简记为DB):DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。 DB能为各种用户共享,具有较小冗余度、数据间联系紧密而又有较高的数据独立性等特点。问v我们是否直接对DB进行操作和访问?24251.2.3 数据库阶段(7)v定义1.2 数据库管理系统(DBMS):DBMS是位于用户与OS之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法,包括DB的建立、查询、更新及各
9、种数据控制。DBMS总是基于某种数据模型,可以分为层次型、网状型、关系型和面向对象型等。OS 用户DBMS261.2.3 数据库阶段(8)v定义1.3 数据库系统(Database System,简记为DBS): DBS是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即它是采用数据库技术的计算机系统。v定义1.4 数据库技术(DBT): 数据库技术是研究数据库的结构、存储、设计、管理和使用的一门软件学科。271.2.4高级数据库阶段(1)20世纪80年代的分布式数据库系统(DDBS)20世纪90年代的对象数据库系统(ODBS)开放数据库互联技术(O
10、DBC)21世纪初的Web数据库系统XML数据库技术现代信息集成(DW、OLAP、DM)281.2.4高级数据库阶段(2)1. 对象数据库系统主要有以下两个特点完整地描述现实世界的数据结构,能表达数据间嵌套、递归的联系。具有面向对象技术的封装性(把数据与操作定义在一起)和继承性(继承数据结构和操作)的特点,提高了软件的可重用性。29 1.2.4 高级数据库阶段(3)v分布式数据库系统通信网全局终端数据库局部处理机局部处理机局部终端局部终端数据库数据库301.2.4高级数据库阶段(4)2. 分布式数据库系统主要有下面三个特点物理上分布,逻辑上是一个整体。既可以执行局部应用,也可以执行全局应用。由
11、数据通信网络相联系。31 1.2.4 高级数据库阶段(5)3开放数据库互联(ODBC)技术一个公共的、与数据库管理系统无关的应用程序设计接口(API)。在使用API以后,同一个应用程序就可以访问不同的数据库服务器。Microsoft公司于202X年推出32 1.2.4 高级数据库阶段(6)4XML数据库技术XML:Internet数据交换标准。半结构化。支持嵌套,灵活。5现代信息集成技术数据仓库(DW)联机分析处理技术(OLAP)数据挖据(DM)331.3 数据描述v1.3.1 概念设计中的数据描述v1.3.2 逻辑设计中的数据描述v1.3.3 物理设计中的数据描述v1.3.4 数据联系的描述
12、341.3数据描述三个阶段 概念设计中的数据描述 逻辑设计中的数据描述 物理设计中的数据描述。351.3.1概念设计中的数据描述v实体(entity):客观存在,可以相互区别的事物。 v实体集(entity set):性质相同的同类实体的集合。v属性(attribute):实体的特性。值域,数据类型。 v实体标识符(identifier):能惟一标识实体的属性或属性集。有时也称为关键码(key),或简称为键。361.3.2逻辑设计中的数据描述(1)v字段(field):标记实体属性的命名单位称为字段,或数据项。它是可以命名的最小信息单位。 v记录(record):字段的有序集合。 v文件(fi
13、le):同一类记录的集合。 v关键码(key):能惟一标识文件中每个记录的字段或字段集(简称为键)。371.3.2逻辑设计中的数据描述(2)v术语的对应关系:概念设计逻辑设计 实体 记录 属性 字段(数据项) 实体集 文件 实体标识符 关键码381.3.3物理设计中的数据描述(1)v问:常见的存储介质有哪些? 391.3.3物理设计中的数据描述(1)(1)高速缓冲存储器(cache)(2)主存储器(main memory)(3)快擦写存储器(flash memory)(4)磁盘存储器(magnetic disk)(5)光存储器(optical storage)(6)磁带(tape storag
14、e)401.3.3物理设计中的数据描述(2)高速缓存内存快闪存储器磁盘存储器光存储器磁带存储器图1.6 存储介质层次辅助存储器第三级存储器411.3.3物理设计中的数据描述(3)v位(bit,比特):一个二进制位称为“位”。一位只能取0或1两个状态。 v字节(byte):8个比特称为一个字节,可以存放一个字符所对应的ASCII码。 v字(word):若干个字节组成一个字。一个字所含的二进制位的位数称为字长。 v块(block):又称为物理块或物理记录。块是内存和外存交换信息的最小单位,每块的大小,通常为210214字节。 v桶(bucket):外存的逻辑单位,一个桶可以包含一个物理块或多个在空
15、间上不一定连续的物理块。 v卷(volume):一个输入输出设备所能装载的全部有用信息,称为“卷”。 421.3.4数据联系的描述(1)v定义1.5 联系(relationship)是实体之间的相互关系。与一个联系有关的实体集个数,称为联系的元数。v定义1.6 二元联系有以下三种类型: 一对一联系 1:1 一对多联系 1:N 多对多联系:M:N乘客和座位什么联系?学生和班级什么联系?学生和课程什么联系?431.3.4数据联系的描述(2)v例1.2E2E1 E2座位E1乘客E1 E2E1E2学生课程E2E1 E2E1车间工人441.3.4数据联系的描述(3)v例零件MN飞机驾驶员航行班次N1M图
16、1.10 三元联系 图1.11 一元联系451.4 数据抽象的级别 1.4.1 数据抽象的过程 1.4.2 概念模型 1.4.3 逻辑模型 1.4.4 外部模型 1.4.5 内部模型 1.4.6 三层模式和两级映像 1.4.7 高度的数据独立性461.4.1 数据抽象的过程(1)v模型(model):对现实世界的抽象。v数据模型:表示实体类型及其联系的模型。v从现实世界的信息到数据库存储的数据以及用户使用的数据是一个逐步抽象过程。v根据数据抽象的级别定义了四种模型:概念数据模型、逻辑数据模型、外部数据模型和内部数据模型。471.4.1 数据抽象的过程(2)v定义1.7 v表达用户需求观点的数据全局逻辑结构的模型,称为“概念模型”。v表达计算机实现观点的DB全局逻辑结构的模型,称为“逻辑模型”。v表达用户使用观点的DB局部逻辑结构的模型,称为“外部模型”。v表达DB物理结构的模型,称为“内部模型”。481.4.1 数据抽象的过程(3)综合转换应用1应用3应用2逻辑模型内部模型外部模型3外部模型2外部模型1映像映像DB概念模型用户需求用户需求用户1用户3用户2用户需求图1.12 四种模型之