《数据库基本知识数据库系统原理与应用》由会员分享,可在线阅读,更多相关《数据库基本知识数据库系统原理与应用(34页珍藏版)》请在金锄头文库上搜索。
1、第第1章章 数据库基本知识数据库基本知识n1.1 1.1 信息、数据与数据处理信息、数据与数据处理n1.2 1.2 数据库系统数据库系统n1.3 1.3 数据模型数据模型1.1信息、数据与数据处理信息、数据与数据处理n1.1.1 1.1.1 数据与信息数据与信息n1.1.2 1.1.2 数据处理数据处理n1.1.3 1.1.3 数据处理的发展数据处理的发展n1.1.4 1.1.4 数据库技术的发展数据库技术的发展n1.1.5 1.1.5 数据库新技术数据库新技术返回首页返回首页1.1.1数据与信息数据与信息n数数据据的的概概念念包包括括两两个个方方面面,即即数数据据内内容容和和数数据据形形式式
2、。数数据据内内容容是是指指所所描描述述客客观观事事物物的的具具体体特特性性,也也就就是是通通常常所所说说的的数数据据的的“值值”;数数据据形形式式则则是是指指数数据据内内容容存存储储在在媒媒体体上上的的具具体体形形式式,也也就就是是通通常常所所说说的的数数据据的的“类类型型”。数数据据主主要要有有数数字字、文文字字、声声音音、图图形和图像等多种形式。形和图像等多种形式。n信信息息是是指指数数据据经经过过加加工工处处理理后后所所获获取取的的有有用用知知识识。信息是以某种数据形式表现的。信息是以某种数据形式表现的。n数数据据和和信信息息是是两两个个相相互互联联系系、但但又又相相互互区区别别的的概概
3、念念;数数据据是是信信息息的的具具体体表表现现形形式式,信信息息是是数数据据有有意意义义的的表现。表现。返回本节返回本节1.1.2数据处理数据处理n数数据据处处理理就就是是将将数数据据转转换换为为信信息息的的过过程程。数数据据处处理理的的内内容容主主要要包包括括:数数据据的的收收集集、整整理理、存存储储、加加工工、分分类类、维维护护、排排序序、检检索索和和传传输输等等一一系系列列活活动动的的总总和和。数数据据处处理理的的目目的的是是从从大大量量的的数数据据中中,根根据据数数据据自自身身的的规规律律和和及及其其相相互互联联系系,通通过过分分析析、归归纳纳、推推理理等等科科学学方方法法,利利用用计
4、计算算机机技技术术、数数据据库库技技术术等等技技术术手手段段,提提取取有有效效的的信信息息资资源源,为为进进一一步步分分析析、管管理理和和决决策策提提供供依依据。数据处理也称信息处理。据。数据处理也称信息处理。返回本节返回本节1.1.3数据处理的发展数据处理的发展1人工管理阶段人工管理阶段n早期的计算机主要用于科学计算,计算处理的数据早期的计算机主要用于科学计算,计算处理的数据量很小,基本上不存在数据管理的问题。从量很小,基本上不存在数据管理的问题。从50年代年代初,开始将计算机应用于数据处理。初,开始将计算机应用于数据处理。 2文件管理阶段文件管理阶段n从从50年代后期开始至年代后期开始至6
5、0年代末为文件管理阶段,应年代末为文件管理阶段,应用程序通过专门管理数据的软件即文件系统管理来用程序通过专门管理数据的软件即文件系统管理来使用数据。使用数据。 3数据库管理阶段数据库管理阶段n数据库管理阶段是数据库管理阶段是60年代末在文件管理基础上发展年代末在文件管理基础上发展起来的。起来的。图图1-1人工管理阶段程序与数据的关系人工管理阶段程序与数据的关系图图1-2文件管理阶段程序与数据的关系文件管理阶段程序与数据的关系图图1-3应用程序与数据之间的关系应用程序与数据之间的关系返回本节返回本节1.1.4数据库技术的发展数据库技术的发展n(1)1969年年IBM公司研制、开发了数据库管理系统
6、公司研制、开发了数据库管理系统商品化软件商品化软件IMS(InformationManagementSystem),),IMS的数据模型是层次结构的。的数据模型是层次结构的。n(2)美国数据系统语言协会)美国数据系统语言协会CODASYL(ConferenceOnDataSystemLanguage)下属的数据库任务组下属的数据库任务组DBTG(DataBaseTaskGroup)对数据库方法进行系统的讨论、研究,对数据库方法进行系统的讨论、研究,提出了若干报告,成为提出了若干报告,成为OBTG报告。报告。OBTG报告确报告确定并且建立了数据库系统的许多概念、方法和技术。定并且建立了数据库系统
7、的许多概念、方法和技术。 n(3)1970年年IBM公司公司SanJose研究实验室的研究员研究实验室的研究员E.F.Codd发表了著名的发表了著名的“大型共享系统的关系数据大型共享系统的关系数据库的关系模型库的关系模型”论文,为关系数据库技术奠定了理论文,为关系数据库技术奠定了理论基础。论基础。自自20世世纪纪70年年代代开开始始,数数据据库库技技术术有有了了很很大大的的发发展展,表现为:表现为:n(1)数数据据库库方方法法,特特别别是是OBTG方方法法和和思思想想应应用用于于各各种种计计算算机机系系统统,出出现现了了许许多多商商品品化化数数据据库库系系统统,它们大都是基于网状模型和层次模型
8、的。它们大都是基于网状模型和层次模型的。n(2)这这些些商商用用系系统统的的运运行行,使使数数据据库库技技术术日日益益广广泛泛地地应应用用到到企企业业管管理理、事事务务处处理理、交交通通运运输输、信信息息检检索索、军军事事指指挥挥、政政府府管管理理和和辅辅助助决决策策等等各各个个方方面面,深深入入到到生生产产、生生活活的的各各个个领领域域。数数据据库库技技术术成成为为实实现和优化信息系统的基本技术。现和优化信息系统的基本技术。n(3)关关系系方方法法的的理理论论研研究究和和软软件件系系统统的的研研制制取取得得了很大的成果。了很大的成果。 返回本节返回本节1.1.5数据库新技术数据库新技术n1分
9、布式数据库分布式数据库分分布布式式数数据据库库系系统统(Distributed DataBaseSystem,DDBS)是是在在集集中中式式数数据据库库基基础础上上发发展展起起来来的的,是是数数据据库库技技术术与与计计算算机机网网络络技技术术、分分布布处处理理技技术术相相结结合合的的产产物物。分分布布式数据库系统的主要特点如下:式数据库系统的主要特点如下:n(1)数据是分布的。)数据是分布的。 n(2)数据是逻辑相关的。)数据是逻辑相关的。n(3)结点的自治性。)结点的自治性。 n2面向对象数据库面向对象数据库n面面向向对对象象数数据据库库系系统统(Object-OrientedDataBas
10、eSystem,OODBS)是是将将面面向向对对象象的的模模型型、方方法法和和机机制制,与与先先进进的的数数据据库库技技术术有有机机地地结结合合而而形形成成的的新新型型数数据据库库系系统统。它它从从关关系系模模型型中中脱脱离离出出来来,强强调调在在数数据据库库框框架架中中的的发发展展类类型型、数数据据抽抽象象、继继承承和和持持久久性性;它它的的基基本本设设计计思思想想是是,一一方方面面把把面面向向对对象象语语言言向向数数据据库库方方向向扩扩展展,使使应应用用程程序序能能够够存存取取并并处处理理对对象象;另另一一方方面面扩扩展展数数据据库库系系统统,使使其其具具有有面面向向对对象象的的特特征征,
11、提提供供一一种种综综合合的的语语义义数数据据建建模模概概念念集集,以以便对现实世界中复杂应用的实体和联系建模。便对现实世界中复杂应用的实体和联系建模。 n3多媒体数据库多媒体数据库多多媒媒体体数数据据库库系系统统(Multi-MediaDataBaseSystem,MDBS)是是数数据据库库技技术术与与多多媒媒体体技术相结合的产物。技术相结合的产物。n(1)数据量大。)数据量大。n(2)结构复杂。)结构复杂。n(3)时序性。)时序性。n(4)数据传输的连续性。)数据传输的连续性。 n从从实实际际应应用用的的角角度度考考虑虑,多多媒媒体体数数据据库库管管理理系系统统(MDBMS)应具有如下基本功
12、能:应具有如下基本功能:n(1)应应能能够够有有效效地地表表示示多多种种媒媒体体数数据据,对对不不同同媒媒体体的的数数据据,如如文文本本、图图形形、图图像像、声声音音等等能能够够按按应应用的不同,采用不同的表示方法。用的不同,采用不同的表示方法。n(2)应应能能够够处处理理各各种种媒媒体体数数据据,正正确确识识别别和和表表现现各各种种媒媒体体数数据据的的特特征征、各各种种媒媒体体间间的的空空间间或或时时间间的的关联。关联。n(3)应应能能够够像像其其他他格格式式化化数数据据一一样样对对多多媒媒体体数数据据进行操作。进行操作。n(4)应应具具有有开开放放功功能能,提提供供多多媒媒体体数数据据库库
13、的的应应用用程序接口等。程序接口等。n4数据仓库数据仓库n数数据据仓仓库库可可以以提提供供对对企企业业数数据据方方便便访访问问和和具具有有强强大大分分析析能能力力的的工工具具,从从企企业业数数据据中中获获得得有有价价值值的的信信息息,发发掘掘企企业业的的竞竞争争优优势势,提提高高企企业业的的运运营营效效率率和和指指导导企企业业决决策策。数数据据仓仓库库作作为为决决策策支支持持系系统统(DecisionSupportSystem,DSS)的的有有效效解解决决方方案案,涉涉及及三三方方面面的的技技术术内内容容:数数据据 仓仓 库库 技技 术术 、 联联 机机 分分 析析 处处 理理 ( On-Li
14、neAnalysisProcessing,OLAP)技技术术和和数数据据挖挖掘掘(DataMining,DM)技术。技术。返回本节返回本节1.2数据库系统数据库系统n1.2.1 1.2.1 数据库系统的组成数据库系统的组成n1.2.2 1.2.2 数据库系统体系结构数据库系统体系结构n1.2.3 1.2.3 数据库管理系统的功能数据库管理系统的功能n1.2.4 1.2.4 数据库管理系统的组成数据库管理系统的组成n1.2.5 1.2.5 数据库系统的特点数据库系统的特点返回首页返回首页1.2.1数据库系统的组成数据库系统的组成n1计算机硬件计算机硬件n2数据库管理系统数据库管理系统n3数据库数
15、据库n4应用程序应用程序n5数据库用户数据库用户返回本节返回本节1.2.2数据库系统体系结构数据库系统体系结构n1模式模式模模式式又又称称概概念念模模式式或或逻逻辑辑模模式式,对对应应于于概概念念级级。它它是是由由数数据据库库设设计计者者综综合合所所有有用用户户的的数数据据,按按照照统统一一的的观点构造的全局逻辑结构。观点构造的全局逻辑结构。 n2外模式外模式外外模模式式又又称称子子模模式式,对对应应于于用用户户级级。它它是是某某个个或或某某几几个个用用户户所所看看到到的的数数据据库库的的数数据据视视图图,是是与与某某一一应应用用有关的数据的逻辑表示。有关的数据的逻辑表示。 n3内模式内模式内
16、内模模式式又又称称存存储储模模式式,对对应应于于物物理理级级。它它是是数数据据库库中中全全体体数数据据的的内内部部表表示示或或底底层层描描述述,是是数数据据库库最最低低一一级级的的逻逻辑辑描描述述,它它描描述述了了数数据据在在存存储储介介质质上上的的存存储储方方式式和和物物理理结结构构,对对应应着着实实际际存存储储在在外外存存储储介介质质上上的数据库。的数据库。 n4数据库系统的二级映射数据库系统的二级映射数数据据库库系系统统的的三三级级模模式式是是数数据据在在三三个个级级别别(层层次次)上上的的抽抽象象,使使用用户户能能够够逻逻辑辑地地、抽抽象象地地处处理理数数据据而而不不必关心数据在计算机
17、中的物理表示和存储。必关心数据在计算机中的物理表示和存储。 图图1-5数据库系统的体系结构数据库系统的体系结构返回本节返回本节1.2.3数据库管理系统的功能数据库管理系统的功能n1数据库定义(描述)功能数据库定义(描述)功能n2数据库操纵功能数据库操纵功能n3数据库运行管理功能数据库运行管理功能n4数据组织、存储和管理数据组织、存储和管理n5数据库的建立和维护数据库的建立和维护n6通信功能通信功能返回本节返回本节1.2.4数据库管理系统的组成数据库管理系统的组成n1数据定义语言及其编译处理程序数据定义语言及其编译处理程序n2数据操作语言及其编译程序数据操作语言及其编译程序n3数据库运行控制程序
18、数据库运行控制程序n4实用程序实用程序返回本节返回本节1.2.5数据库系统的特点数据库系统的特点n1数据共享数据共享 n2减少数据冗余减少数据冗余n3具有较高的数据独立性具有较高的数据独立性 n(1)物理数据独立:)物理数据独立: n(2)逻辑数据独立:)逻辑数据独立: n4增强了数据安全性和完整性保护增强了数据安全性和完整性保护 返回本节返回本节1.3数据模型数据模型n1.3.1 1.3.1 现实世界的数据描述现实世界的数据描述n1.3.2 1.3.2 数据模型数据模型n1.3.3 1.3.3 关系的基本概念及其特点关系的基本概念及其特点返回首页返回首页1.3.1现实世界的数据描述现实世界的
19、数据描述1信息处理的三个层次信息处理的三个层次n(1)现实世界。)现实世界。n(2)信息世界。)信息世界。n(3)数据世界。)数据世界。 2信息世界中的基本概念信息世界中的基本概念 n(1)实体。)实体。n(2)属性。)属性。 n(3)域。)域。 n(4)实体型和实体值。)实体型和实体值。 n(5)实体集。)实体集。n(6)实体联系。)实体联系。 n3实体模型实体模型实实体体模模型型又又称称概概念念模模型型,它它是是反反映映实实体体之之间间联联系系的的模模型型。数数据据库库设设计计的的重重要要任任务务就就是是建建立立实实体体模模型型,建建立立概概念念数数据据库库的的具具体体描描述述。在在建建立
20、立实实体体模模型型时时,实实体体要要逐逐一一命命名名以以示示区区别别,并并描描述述它它们们之之间间的的各各种种联联系系。实实体体模模型型只只是是将将现现实实世世界界的的客客观观对对象象抽抽象象为为某某种种信信息息结结构构,这这种种信信息息结结构构并并不不依依赖赖于于具具体体的的计计算算机机系系统统,E-R图图是是目目前前常常用用的的概概念念模模型型的的表表示方法。示方法。返回本节返回本节1.3.2数据模型数据模型n1层次模型(层次模型(HierarchicalModel)用用树树形形结结构构表表示示实实体体和和实实体体间间联联系系的的数数据据模模型称为层次模型。型称为层次模型。层次模型的基本特
21、点:层次模型的基本特点:n(1)有有且且仅仅有有一一个个结结点点无无父父结结点点,称称其其为为根结点。根结点。n(2)其他结点有且只一个父结点。)其他结点有且只一个父结点。n2网状模型(网状模型(NetworkModel)用网状结构表示实体和实体之间关系的数据模用网状结构表示实体和实体之间关系的数据模型称为网状模型。网状模型的基本特点:型称为网状模型。网状模型的基本特点:n(1)一个以上结点无父结点。)一个以上结点无父结点。n(2)至少有一结点有多于一个的父结点。)至少有一结点有多于一个的父结点。n3关系模型(关系模型(RelationalModel)用用二二维维表表来来表表示示实实体体和和实
22、实体体间间联联系系的的数数据据模模型型称称为为关关系系模模型型。例例如如,在在关关系系模模型型中中可可用用如如表表1-1的的形形式式表表示示学学生生对对象象。关关系系不不但但可可以以表表示示实实体体间间一一对对多多的的联联系系,也也可可以以方方便地表示多对多的联系。便地表示多对多的联系。学号学号姓名姓名性别性别班级名班级名系别代号系别代号地址地址出生日期出生日期是否团员是否团员备注备注011110李建国李建国男男计计012101湖北武汉湖北武汉1984-9-28是是011103李宁李宁女女电电013402江西九江江西九江1985-5-6否否011202赵娜赵娜女女英英011203广西南宁广西南
23、宁1984-2-21否否011111赵琳赵琳女女计计012101江苏南京江苏南京1985-11-18是是021405罗宇波罗宇波男男英英011203江苏南通江苏南通1985-12-12否否表表1-1 学生基本情况表学生基本情况表返回本节返回本节1.3.3关系的基本概念及其特点关系的基本概念及其特点1 1关系的基本概念关系的基本概念n(1 1)关关系系:一一个个关关系系就就是是一一张张二二维维表表,通通常常将将一一个个没没有有重重复复行行、重重复复列列的的二二维维表表看看成成一一个个关关系系,每每个个关系都有一个关系名。关系都有一个关系名。 n(2 2)元组:二维表的每一行在关系中称为元组。)元
24、组:二维表的每一行在关系中称为元组。n(3 3)属属性性:二二维维表表的的每每一一列列在在关关系系中中称称为为属属性性,每每个个属属性性都都有有一一个个属属性性名名,属属性性值值则则是是各各个个元元组组在在该该属性上的取值。属性上的取值。n(4 4)域:属性的取值范围称为域。)域:属性的取值范围称为域。 2 2关系模型的主要优点关系模型的主要优点关系模型具有如下优点:关系模型具有如下优点:n(1 1)数数据据结结构构单单一一。关关系系模模型型中中,不不管管是是实实体体还还是是实实体体之之间间的的联联系系,都都用用关关系系来来表表示示,而而关关系系都都对对应一张二维数据表,数据结构简单、清晰。应一张二维数据表,数据结构简单、清晰。n(2 2)关关系系规规范范化化,并并建建立立在在严严格格的的理理论论基基础础上上。关关系系中中每每个个属属性性不不可可再再分分割割,构构成成关关系系的的基基本本规规范范。同同时时关关系系是是建建立立在在严严格格的的数数学学概概念念基基础础上上,具具有有坚坚实的理论基础。实的理论基础。n(3 3)概念简单,操作方便。)概念简单,操作方便。 返回本节返回本节