第六章数据资源管理技术

上传人:桔**** 文档编号:567633784 上传时间:2024-07-21 格式:PPT 页数:25 大小:178KB
返回 下载 相关 举报
第六章数据资源管理技术_第1页
第1页 / 共25页
第六章数据资源管理技术_第2页
第2页 / 共25页
第六章数据资源管理技术_第3页
第3页 / 共25页
第六章数据资源管理技术_第4页
第4页 / 共25页
第六章数据资源管理技术_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《第六章数据资源管理技术》由会员分享,可在线阅读,更多相关《第六章数据资源管理技术(25页珍藏版)》请在金锄头文库上搜索。

1、第六章第六章 数据资源管理技术数据资源管理技术科学管理依赖信息,信息是一个组织重要的资源。科学管理依赖信息,信息是一个组织重要的资源。数据库技术的使用是数据库技术的使用是 MIS 成熟的重要标志。成熟的重要标志。数据管理技术的发展数据管理技术的发展数据人工管理阶段:数据人工管理阶段:没有软件支持,只有程序文件的概念没有软件支持,只有程序文件的概念数据处理后程序和数据的内存空间一起被释放。数据和程序相互依赖;数据处理后程序和数据的内存空间一起被释放。数据和程序相互依赖;数据结构的变化、修改,导致整个程序的修改。数据结构的变化、修改,导致整个程序的修改。最大的问题是编程效率低,程序依赖数据,不灵活

2、,容易出错。最大的问题是编程效率低,程序依赖数据,不灵活,容易出错。文件管理阶段:文件管理阶段:有分离的程序文件和数据文件,文件系统管理数据。有分离的程序文件和数据文件,文件系统管理数据。程序使用数据文件名访问数据,不必关心其物理位置和细节。便于程序程序使用数据文件名访问数据,不必关心其物理位置和细节。便于程序访问数据,有索引文件,链接文件和散列文件等等。访问数据,有索引文件,链接文件和散列文件等等。数据不属于某个特定程序,允许重复使用,但数据文件的结构仍取决于数据不属于某个特定程序,允许重复使用,但数据文件的结构仍取决于特定的应用,程序与数据间的依赖关系并未根本改变。具有数据设备独特定的应用

3、,程序与数据间的依赖关系并未根本改变。具有数据设备独立性,但不能体现用户观点下的数据逻辑结构独立于数据在外存上物理立性,但不能体现用户观点下的数据逻辑结构独立于数据在外存上物理结构的要求,在数据物理结构修改时,仍需修改用户应用程序。结构的要求,在数据物理结构修改时,仍需修改用户应用程序。文件管理方式是数据资源管理的一大进步,它也是数据库的基础。文件管理方式是数据资源管理的一大进步,它也是数据库的基础。文件系统的缺陷:数据冗余(文件系统的缺陷:数据冗余(redundancy),每个应用程序有对应的数),每个应用程序有对应的数据文件,文件间缺乏联系,同样的数据可能重复出现。冗余浪费存储空据文件,文

4、件间缺乏联系,同样的数据可能重复出现。冗余浪费存储空间,且数据修改稍有不谨慎可能造成数据不一致性(间,且数据修改稍有不谨慎可能造成数据不一致性(inconsistency););其次,数据文件面向应用,当数据结构改变时,程序维护成为系统的主其次,数据文件面向应用,当数据结构改变时,程序维护成为系统的主要矛盾。要矛盾。征头慨毁嗓迫位烫救贩尿粕姻浩否逢映灵篙邻蹈堰琴卓悯广颓缨究就音篱第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据管理技术的发展数据管理技术的发展数据库阶段:数据库阶段:数据存储在数据库中,数据资源使用数据库管理系统数据存储在数据库中,数

5、据资源使用数据库管理系统的专门软件管理。的专门软件管理。数据库用数据结构描述了数据,数据间的联系。数据面向整个应用系统,数据库用数据结构描述了数据,数据间的联系。数据面向整个应用系统,减少冗余,真正实现数据在不同应用中共享。减少冗余,真正实现数据在不同应用中共享。数据库管理系统(数据库管理系统(DBMS,Database Management System)的三级模式,)的三级模式,有物理数据独立性,数据库只根据系统需求独立设计;逻辑数据独立性,有物理数据独立性,数据库只根据系统需求独立设计;逻辑数据独立性,特定用户以逻辑结构(视图)操作数据,大大提高了编程效率。特定用户以逻辑结构(视图)操作

6、数据,大大提高了编程效率。DBMS 提供方便操作的用户接口,数据库的恢复,并发控制,数据完整提供方便操作的用户接口,数据库的恢复,并发控制,数据完整性、安全性等控制功能,保证数据的安全,可靠性。性、安全性等控制功能,保证数据的安全,可靠性。数据库系统以记录为单位操作数据,也可操作数据项,增加系统灵活性。数据库系统以记录为单位操作数据,也可操作数据项,增加系统灵活性。从文件系统发展到数据库系统是信息处理领域中的一个重大变化,从文件系统发展到数据库系统是信息处理领域中的一个重大变化,以数据为中心。应用程序设计退居为外围地位。以数据为中心。应用程序设计退居为外围地位。程序A程序B程序CDBMS数据库

7、文 件 管理系统文件B程序A程序B程序C文件A2文件A1文件C杨龙肠沸晾色汪夺槛涟漓横陨堡盯熬辨枷珐咳豫霓磨神又钝约皮歧鞭隘饺第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术访问远程数据资源访问远程数据资源 计算机网络中有多台计算机访问数据资源,系统由三部分组成:计算机网络中有多台计算机访问数据资源,系统由三部分组成:客户机(客户机(Client)用户操作的多台个人(用户操作的多台个人(PC)计算机;)计算机;服务器(服务器(Server)数据集中存储的计算机。通常只有一台服务器,有些数据集中存储的计算机。通常只有一台服务器,有些系统配置有多台服务器;

8、系统配置有多台服务器;通信网络通信网络连接客户机和服务器的通信线路。连接客户机和服务器的通信线路。传统的文件方式:传统的文件方式:客户机应用程序访问远程数据资源时,将文件服务客户机应用程序访问远程数据资源时,将文件服务器上的数据文件装载到客户机上,应用程序在数据文件中找到它所需器上的数据文件装载到客户机上,应用程序在数据文件中找到它所需的数据,处理后再将整个数据文件回送文件服务器。的数据,处理后再将整个数据文件回送文件服务器。整个远程数据资源访问过程都不可见,但占据了时间和网络总线的带宽。整个远程数据资源访问过程都不可见,但占据了时间和网络总线的带宽。要求有较大内存容量,较强的处理能力的客户机

9、。要求有较大内存容量,较强的处理能力的客户机。客户机客户机/ /服务器(服务器(C/SC/S,Client/ServerClient/Server)方式:)方式:客户机的应用程序请求客户机的应用程序请求服务器查找它所需的数据,服务器将数据文件中匹配的数据返回。服务器查找它所需的数据,服务器将数据文件中匹配的数据返回。节省时间和网络的开销。节省时间和网络的开销。发挥了服务器较强的处理功能,客户机只集中处理用户界面。发挥了服务器较强的处理功能,客户机只集中处理用户界面。在两层在两层C/S结构中,客户机必须配置访问的各种数据库的驱动程序,成本结构中,客户机必须配置访问的各种数据库的驱动程序,成本高;

10、用户还必须考虑配置和软件维护问题。三层高;用户还必须考虑配置和软件维护问题。三层C/S结构中,插入中间件结构中,插入中间件服务器,客户机仅需与中间件服务器驱动程序通信,中间件服务器完成与服务器,客户机仅需与中间件服务器驱动程序通信,中间件服务器完成与服务器的不同数据库的驱动问题。服务器的不同数据库的驱动问题。季病青姆拧耗价厄喜蹲移跨逗丈辨黎台酱踪捍谗出背网前翌伴器跃丫通逢第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术访问远程数据资源访问远程数据资源分布式客户分布式客户/服务器结构用于更复杂的和更有弹性的系统,系统中有服务器结构用于更复杂的和更有弹性的

11、系统,系统中有多个分布配置的服务器,执行不同的功能或某些特殊功能。多个分布配置的服务器,执行不同的功能或某些特殊功能。浏览器浏览器/ /服务器(服务器(B/SB/S,Browser/ServerBrowser/Server)方式:)方式:随着网络技术和随着网络技术和Web技术的发展,使用数据源的数据量剧增,开发技术的发展,使用数据源的数据量剧增,开发Web数据库系统十数据库系统十分有意义。分有意义。在在Internet和和Intranet上,如网上银行、在线购物、产品信息、市场调查上,如网上银行、在线购物、产品信息、市场调查分析、联机数据库查询等,到处可看到分析、联机数据库查询等,到处可看到W

12、eb数据库的应用。数据库的应用。Web数据库基于数据库基于C/S结构的三层模式,即结构的三层模式,即Browser/Web server/DB server,客户层是统一界面的浏览器,数据服务器为服务层,中间层是,客户层是统一界面的浏览器,数据服务器为服务层,中间层是Web服服务器和应用服务。用户通过浏览器的务器和应用服务。用户通过浏览器的Web页上输入信息,并发送到页上输入信息,并发送到Web服务器,通过应用程序访问数据库,将结果以图形、图像、文本或表的服务器,通过应用程序访问数据库,将结果以图形、图像、文本或表的形式返回浏览器。形式返回浏览器。一一种种特特别别感感兴兴趣趣的的网网络络计计算

13、算机机:没没有有磁磁盘盘驱驱动动器器或或其其它它当当地地数数据据存存储储设设备备的的PC机机,使使网网络络管管理理简简化化,又又能能处处理理图图形形用用户户界界面面,需需要要的的是是能能在在任任何何计计算算机机上上运运行行的的图图形形用用户户界界面面,在在服服务务器器上上修修改改某某个个驱驱动动程程序序或或应应用用程程序序时时,可可以以在在该该服服务务器器的的每每个个网网络络计计算算机机客客户户机机上上运行。运行。面面向向对对象象的的程程序序设设计计语语言言Java,使使应应用用程程序序独独立立于于异异构构网网络络上上的的多多种种平平台,提供在任何计算机上运行的图形用户界面设计。台,提供在任何

14、计算机上运行的图形用户界面设计。认实畸影扎涅枷帖泞洋又硒湃秽销谬徒荚叛邵会驭黑热润箱菇樱玩梭实葵第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据描述数据描述现实世界:现实世界:现实世界是在人们头脑以外的客观世界(现实世界是在人们头脑以外的客观世界(real world),),对信息系统而言,组织的业务活动涉及的物流、人、事、单位以及对信息系统而言,组织的业务活动涉及的物流、人、事、单位以及相关的数据,如库存管理,涉及货物的存放、进出、搜查等业务活相关的数据,如库存管理,涉及货物的存放、进出、搜查等业务活动。业务活动中抽取的数据为管理活动提供报表、汇

15、总、统计分析动。业务活动中抽取的数据为管理活动提供报表、汇总、统计分析图等。图等。信息世界:信息世界:人的认知一是从特殊到一般的归纳,二是从一般到特殊人的认知一是从特殊到一般的归纳,二是从一般到特殊的演绎。将现实世界中客观存在相互区别的事物或事件抽象为实体的演绎。将现实世界中客观存在相互区别的事物或事件抽象为实体集。实体集具有组成实体的共同的性质(属性)集。实体集具有组成实体的共同的性质(属性)如学生实体集有姓名、如学生实体集有姓名、年龄、性别等共同属性。年龄、性别等共同属性。实体集中的具体实例实体集中的具体实例称实体,有具体的属性称实体,有具体的属性值,如某个学生姓名叫值,如某个学生姓名叫李

16、四,年龄李四,年龄22岁,性别岁,性别为男等,属性值的不同为男等,属性值的不同用来区别不同的实体。用来区别不同的实体。实体标识符是某个属实体标识符是某个属性(代码)或一组属性,性(代码)或一组属性,唯一标别每个实体。唯一标别每个实体。属性字段现实世界现实世界信息世界信息世界计算机世界计算机世界事物类事物类实体集实体集事物事物性质性质实体实体属性属性文件文件记录记录字段字段掠浮钒粒康却殊琐畜馋惰蜕篮嘘需支贱卿蕾故凌剑酸茎碴搽堤香祥洒据港第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据描述数据描述计算机世界:计算机世界:是数据存储形式,在计算机中数据以

17、文件方式存储,是数据存储形式,在计算机中数据以文件方式存储,并分下列层次:并分下列层次:字段(字段(field)或称数据项:字段可以命名的最小数据单位,字段名表示)或称数据项:字段可以命名的最小数据单位,字段名表示实体的属性。字段值表示每个具体属性值或数据,一般分两大类型:数实体的属性。字段值表示每个具体属性值或数据,一般分两大类型:数值型和字符型。值型和字符型。记录(记录(record):记录结构是字段有序集合,记录描述一个具体实体,):记录结构是字段有序集合,记录描述一个具体实体,是字段值有序集合,实体属性的数据描述。是字段值有序集合,实体属性的数据描述。例例 实体集:实体集: 学生(学号

18、,学生(学号, 姓名,年龄,姓名,年龄, 性别,性别, ) 实体:实体: 99064111 李四李四 22 男男 文件(文件(file):文件是同一实体集的所有记录的集合,所有的学生记录组):文件是同一实体集的所有记录的集合,所有的学生记录组成一个学生文件。成一个学生文件。其中,主关键字(其中,主关键字(key)简称主键,是能唯一标识文件中每个记录的字段)简称主键,是能唯一标识文件中每个记录的字段或字段集,与信息世界中实体标识符的概念相对应。或字段集,与信息世界中实体标识符的概念相对应。数据库是数据层次最高一层,它是综合的、相关的文件集合,它表示一数据库是数据层次最高一层,它是综合的、相关的文

19、件集合,它表示一个应用项目中相关的实体集的集合及实体集间的关联。个应用项目中相关的实体集的集合及实体集间的关联。我们可以不必关心数据的存储结构和具体实现方式,因为数据库系我们可以不必关心数据的存储结构和具体实现方式,因为数据库系统的目标之一,是用户能简单、方便地访问数据库中的数据。统的目标之一,是用户能简单、方便地访问数据库中的数据。河凿贷拇绍缕龄弯予亭税诊刁攒准畴沏伟限诈厚敌啄花濒百园诈颧品斌噶第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据库数据模型:逻辑模型和物理模型。数据库数据模型:逻辑模型和物理模型。逻辑模型逻辑模型不涉及数据的表示、物理

20、实现,只描述从系统需求到信息世界的不涉及数据的表示、物理实现,只描述从系统需求到信息世界的高层抽象的信息模型。高层抽象的信息模型。创建数据逻辑模型的工具是实体联系(创建数据逻辑模型的工具是实体联系(E-R)图。)图。物理模型物理模型面向信息模型所采用的具体数据结构,第二层抽象。数据的物理面向信息模型所采用的具体数据结构,第二层抽象。数据的物理模型有严格形式化定义,便于计算机中实现数据的存储和访问。模型有严格形式化定义,便于计算机中实现数据的存储和访问。实体间的联系:实体间的联系:其联系方式不外乎三种:其联系方式不外乎三种:一对一(一对一(1:1)联系:)联系:在两个实体集中,一方的一个实体最多

21、与另一方对应的一在两个实体集中,一方的一个实体最多与另一方对应的一个实体相联系。例如,已婚男性集合和已婚女性集合间实体关系是一对一的联系。个实体相联系。例如,已婚男性集合和已婚女性集合间实体关系是一对一的联系。一对多(一对多(1:M)联系:)联系:在两个实体集中,一方的一个实体与另一方对应的若干个在两个实体集中,一方的一个实体与另一方对应的若干个实体相联系;反之,另一方的一个实体最多对应一方的一个实体,称一对多联系。实体相联系;反之,另一方的一个实体最多对应一方的一个实体,称一对多联系。例如,一个组织部门和职工,在一个具体部门工作的职工有若干个,而一个职工只在一例如,一个组织部门和职工,在一个

22、具体部门工作的职工有若干个,而一个职工只在一个部门工作,工作将部门和职工两个实体联系在一起,是一对多的联系。个部门工作,工作将部门和职工两个实体联系在一起,是一对多的联系。多对多(多对多(M:N)联系:)联系:若两个实体集中,任何一方的一个实体都对应另一方的若若两个实体集中,任何一方的一个实体都对应另一方的若干个实体,称多对多联系。干个实体,称多对多联系。例如,在教学管理中学生和课程,一个具体学生可选修若干门课程,反之,一门课程可例如,在教学管理中学生和课程,一个具体学生可选修若干门课程,反之,一门课程可以被若干个同学选修,选修将学生和课程两个实体联系在一起,是多对多的联系。以被若干个同学选修

23、,选修将学生和课程两个实体联系在一起,是多对多的联系。实体有属性,联系也有属性。实体有属性,联系也有属性。例如,学生和课程的选修多对多的联系有成绩属性。例如,学生和课程的选修多对多的联系有成绩属性。除多对多联系的属性外,一对一和一对多联系的属性,一般都可归併相应的实体属性中。除多对多联系的属性外,一对一和一对多联系的属性,一般都可归併相应的实体属性中。递归联系是一个实体与自身相联系,也有一对一,一对多和多对多的联系。例如一个组递归联系是一个实体与自身相联系,也有一对一,一对多和多对多的联系。例如一个组件可以由多个零件组装而成,而一个零件又可以在多个组件中组装使用,这就是多对多件可以由多个零件组

24、装而成,而一个零件又可以在多个组件中组装使用,这就是多对多的递归联系,组装使用数量则是联系的属性。的递归联系,组装使用数量则是联系的属性。对对1:1(m)递归联系,事实上是超类与子类的联系,如职工与干部、领导的联系。)递归联系,事实上是超类与子类的联系,如职工与干部、领导的联系。凄彦罩崭衍晤叭宴丘谦煌遗梧其翅逼呻站圃低株位阔膊疙纱华波兴趾按懂第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据库数据模型数据库数据模型实实体体联联系系E ER R图图(Entity Relationship Diagram):数数据据的的逻逻辑辑模模型型强强调调语语义义表

25、表达达功功能能,概概念念简简单单、清清晰晰,易易于于理理解解,便便于于数数据据库库设设计计人人员员和和用用户户交交流流,启发、检验、返回补充系统需求。启发、检验、返回补充系统需求。E-R图使用图形符号表示组织业务活动涉及的实体及实体间联系。图使用图形符号表示组织业务活动涉及的实体及实体间联系。矩矩形形框框表表示示实实体体,两两部部分分分分别别表表示示实实体体标标识识及及其其属属性性;菱菱形形表表示示实实体体间间的的联联系系,带有联系方式的直线相关的实体连接,关系有属性直接附于菱形框。带有联系方式的直线相关的实体连接,关系有属性直接附于菱形框。在实际系统中往往有多个相互关联的实体,作图也比较复杂

26、。在实际系统中往往有多个相互关联的实体,作图也比较复杂。例例 仓仓库库主主要要管管理理零零件件入入库库、出出库库及及采采购购等等事事项项。工工程程项项目目需需要要仓仓库库提提供供零零件件,仓库需要向零件供应商采购零件,仓库需要向零件供应商采购零件,建立建立E-R图过程:确定实体集;确定实体间关系;确定实体集名称和属性。图过程:确定实体集;确定实体间关系;确定实体集名称和属性。工工程程项项目目 (项项目目编编号号J#,项项目目名名称称Jname,开工日期开工日期DATE)零零件件 (零零件件编编号号P#,零零件件名名称称Pname,规规格格Psize,重量,重量Pweight)供供应应商商 (供

27、供应应商商代代号号S#,姓姓名名Sname,地地址址SADR)锹范糜弗态缎特综让幕憋丛万末球络溶衰震提荣陌照镜戮瘦腆崇管觅鲍嘛第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据库数据模型数据库数据模型数据的物理模型数据的物理模型数据库的数据结构。数据库的数据结构。层层次次或或树树状状模模型型:用用倒倒树树结结构构表表示示实实体体及及实实体体间间关关系系。树树的的结结点点是是记记录录类类型型,非根结点只有一个父结点,上层与下层间是一对多的关系。非根结点只有一个父结点,上层与下层间是一对多的关系。特特点点是是记记录录间间的的联联系系依依靠靠指指针针,查查

28、询询效效率率高高。缺缺点点是是只只能能表表示示一一对对多多的的联联系系,多多对多联系实现复杂困难;数据查询、更新复杂、编程比较复杂。对多联系实现复杂困难;数据查询、更新复杂、编程比较复杂。网网状状模模型型:用用有有向向图图表表示示实实体体及及实实体体间间关关系系。有有向向图图的的结结点点是是记记录录类类型型,有有向边从箭尾端记录类型到箭头端记录类型是一对多关系。向边从箭尾端记录类型到箭头端记录类型是一对多关系。特特点点是是记记录录之之间间的的联联系系用用指指针针,多多对对多多的的关关系系亦亦可可拆拆成成两两个个一一对对多多的的关关系系。模模型型易易于于实实现现,查查询询效效率率较较高高,缺缺点

29、点是是编编写写程程序序比比较较复复杂杂,程程序序员员必必须须熟熟悉悉数数据据库库的的逻辑结构。逻辑结构。关系模型:关系模型:用二维表格表达实体集,外键表示实体间关系。用二维表格表达实体集,外键表示实体间关系。与层次网状模型相比,简单易懂,编程与层次网状模型相比,简单易懂,编程方便方便,集合论是关系模型的数学基础。,集合论是关系模型的数学基础。关关系系数数据据库库的的标标准准化化语语言言SQL已已得得到到广广泛泛应应用用。典典型型关关系系数数据据库库管管理理系系统统DBMS产产 品品 有有 DB2, ORACELE, SYBASE, INFORMIX和和 微微 机机 产产 品品 FOXPRO,A

30、CCESS等。等。 概概念念简简单单,易易于于理理解解,多多对对多多的的关关系系可可简简单单地地分分解解二二个个一一对对多多的的关关系系。实实体体集集的的主键用直线下划线表示,则上节仓库管理的实体及实体间关系可表示:主键用直线下划线表示,则上节仓库管理的实体及实体间关系可表示:工程项目工程项目(J#, Jname, Date) 零件零件(P#, Pname, Psize, Pweight) 供应商供应商(S#, Sname, Saddr) 供需关系供需关系 (J#, p#, Total) 需供关系需供关系 (P#, S#, Quantity)是缨峪涕薯适晋劝眉群疙辨砒薪惊市颠囊思加囚罪皋阑翱存

31、貌瑞经披等勒第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据库管理系统数据库管理系统 DBMS DBMS DBMS DBMS 是一个提供对共享数据可靠管理用的软件,数据库系统的核心。是一个提供对共享数据可靠管理用的软件,数据库系统的核心。DBMS DBMS 对数据库定义、提供用户视图、查询、更新等一切操作,用作数据库与应用对数据库定义、提供用户视图、查询、更新等一切操作,用作数据库与应用程序之间,或数据库与用户之间的接口。程序之间,或数据库与用户之间的接口。三级模式结构:三级模式结构:内模式、概念模式和外模式。内模式、概念模式和外模式。外模式(外模

32、式(external schema):):单个用户使用的数据视图,是概念模式的一个子集。单个用户使用的数据视图,是概念模式的一个子集。概念模式(概念模式(conceptual):):所有用户的数据定义,系统的、全局的数据视图。所有用户的数据定义,系统的、全局的数据视图。内模式(内模式(internet):):涉及的数据存储结构,物理存储数据视图,又称存储模式。涉及的数据存储结构,物理存储数据视图,又称存储模式。数据据库数据的三个抽象级别,使用户只要抽象地处理数据,不必关心数据的表示数据据库数据的三个抽象级别,使用户只要抽象地处理数据,不必关心数据的表示和存储,数据的具体组织、管理工作交给和存储

33、,数据的具体组织、管理工作交给DBMS,减轻用户使用系统的负担。,减轻用户使用系统的负担。数据在三级模式间差别很大,数据在三级模式间差别很大, DBMS DBMS 在三级模式间提供两个层次的映射在三级模式间提供两个层次的映射外模式到外模式到概念模式、概念模式到内模式映射。概念模式、概念模式到内模式映射。两级数据独立性:两级数据独立性:数据库的逻辑独立性:数据库的逻辑独立性:概念模式的修改不影响外模式,只需改变外模式到概念模式概念模式的修改不影响外模式,只需改变外模式到概念模式的映射关系,从而保证子模式不变,应用程序亦无须修改。数据的逻辑独立性,简的映射关系,从而保证子模式不变,应用程序亦无须修

34、改。数据的逻辑独立性,简化了数据库系统应用程序的设计工作。化了数据库系统应用程序的设计工作。数据库的物理独立性:数据库的物理独立性:内模式的修改不影响概念模式,只需改变概念模式到存储模内模式的修改不影响概念模式,只需改变概念模式到存储模式的映射关系。使数据库只需根据系统需求独立设计,又因为有数据库的逻辑数据式的映射关系。使数据库只需根据系统需求独立设计,又因为有数据库的逻辑数据独立性,从而保证对于外模式和应用程序不受存储模式影响,简化了数据库系统应独立性,从而保证对于外模式和应用程序不受存储模式影响,简化了数据库系统应用系统的开发、设计工作。用系统的开发、设计工作。两级独立性简化应用系统的开发

35、,提高开发效率。两级独立性简化应用系统的开发,提高开发效率。概念模式能导出不同应用的多种子模式,减少数据冗余,保证数据的一致性,有利于数概念模式能导出不同应用的多种子模式,减少数据冗余,保证数据的一致性,有利于数据共享。应用程序只操作自己的子模式范围内的数据,把数据库中其他用户的数据隔离,据共享。应用程序只操作自己的子模式范围内的数据,把数据库中其他用户的数据隔离,用户对数据库概念模式和存储模式的数据都不可见,有利于数据的安全性和保密性。用户对数据库概念模式和存储模式的数据都不可见,有利于数据的安全性和保密性。 译胖样瑰重彻濒压曾踊韧蔽济旷狐凸效须踩谜市童价蓖陋气篆赌亭和帕漫第六章数据资源管理

36、技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据库管理系统的组成:数据库管理系统的组成:查询处理器和存储管理器。查询处理器和存储管理器。查询处理器:查询处理器:查询处理器主要包括有查询处理器主要包括有DDL编译器、编译器、DML编译器、嵌入型编译器、嵌入型DML预编译器、查询运行核心程序。预编译器、查询运行核心程序。数据描述语言数据描述语言DDL(Data Description Language):定义数据库的三级结构及其):定义数据库的三级结构及其相互之间的映射,定义数据完整性、安全控制等约束。数据库系统中存储三级结相互之间的映射,定义数据完整性、安全控制等约束

37、。数据库系统中存储三级结构定义的数据库称数据字典(构定义的数据库称数据字典(data dictionary,DD)。)。数据操纵语言数据操纵语言DML(Data Manipulation Language):实现数据操作。基本的操):实现数据操作。基本的操作有查询、插入、删除、更新等四种。作有查询、插入、删除、更新等四种。DML分交互型和嵌入型两种。分交互型和嵌入型两种。DML语言分:过程性的语言分:过程性的DML必需指示必需指示“做什么做什么”和和“怎么做怎么做”,层次、网状的,层次、网状的DML属过程性属过程性DML。非过程性的。非过程性的DML,如关系型的,如关系型的DML,只需指示,只

38、需指示“做什么做什么”就可,就可,操作简单、使用方便,深受广大用户欢迎。操作简单、使用方便,深受广大用户欢迎。存储管理器:存储管理器:存储管理器主要包括有授权和完整性管理器、事务管理器、文存储管理器主要包括有授权和完整性管理器、事务管理器、文件管理器、缓冲管理器等,提供数据库保护功能如数据恢复、并发控制、数件管理器、缓冲管理器等,提供数据库保护功能如数据恢复、并发控制、数据库完整性和安全性控制。据库完整性和安全性控制。安全性保护:安全性保护:规定用户访问数据库的权限防止非法用户窃取的安全、保密保护措规定用户访问数据库的权限防止非法用户窃取的安全、保密保护措施。系统可采取多种措施,如鉴定用户身份

39、、口令、数据编密码等安全性保护。施。系统可采取多种措施,如鉴定用户身份、口令、数据编密码等安全性保护。完整性管理:完整性管理:完整性指数据的正确性和一致性,通过对数据及数据间的逻辑关系完整性指数据的正确性和一致性,通过对数据及数据间的逻辑关系施加约束条件来实现。如对字段值类型、取值范围、精度等约束,对实体唯一性施加约束条件来实现。如对字段值类型、取值范围、精度等约束,对实体唯一性约束,对实体间联系的约束等。约束,对实体间联系的约束等。故障恢复:故障恢复:数据库在运行过程中难免会造成数据库被破坏,如磁盘损坏、病毒、数据库在运行过程中难免会造成数据库被破坏,如磁盘损坏、病毒、或操作不当等偶然因素使

40、数据丢失,系统能恢复到破坏前的状态称故障恢复。或操作不当等偶然因素使数据丢失,系统能恢复到破坏前的状态称故障恢复。在使用故障恢复功能时,数据备份,事务管理必不可少。在使用故障恢复功能时,数据备份,事务管理必不可少。并发控制:并发控制:在多用户或网络应用中的数据库,多个用户操作同一数据时,必须控在多用户或网络应用中的数据库,多个用户操作同一数据时,必须控制不合理的时差有可能造成数据出错现象。制不合理的时差有可能造成数据出错现象。栋监漏贸吱丝询鹏囊唬左谤鞭对温辣萌亭芥痒仰纹慕按绒临蹬品睹伸争鳞第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据库管理系统的

41、组成数据库管理系统的组成存储管理器:存储管理器:并发错误解决方法是控制相关进程互斥地访问数据库,如用加锁和开锁控制。用并发错误解决方法是控制相关进程互斥地访问数据库,如用加锁和开锁控制。用户程序中使用锁,就可能存在死锁问题。编写应用程序时,必须采取预防死锁的户程序中使用锁,就可能存在死锁问题。编写应用程序时,必须采取预防死锁的措施。措施。数据库的维护功能提供数据库管理员运行数据库的维护功能提供数据库管理员运行DB系统时使用。如数据导入、备份、文系统时使用。如数据导入、备份、文件重组、性能监控等,确保数据库保持最佳工作状态。件重组、性能监控等,确保数据库保持最佳工作状态。用户界面:用户界面:用户

42、是指使用管理信息系统应用程序的联机终端用户。程序员用用户是指使用管理信息系统应用程序的联机终端用户。程序员用程序设计语言(称宿主语言),设计数据库应用程序或用户界面,编写数据程序设计语言(称宿主语言),设计数据库应用程序或用户界面,编写数据库应用系统。库应用系统。DBMS 主要由数据定义语言主要由数据定义语言DDL和数据操作语言和数据操作语言DML组成,是基于记录模式的语组成,是基于记录模式的语言,程序设计语言是基于整数、实数、字符、记录、数组等数据类型的运算模式言,程序设计语言是基于整数、实数、字符、记录、数组等数据类型的运算模式的语言,两者之间有的语言,两者之间有“缝隙缝隙”。例如,例如,

43、SQL语言不能直接使用指针,数组等数据结构,程序设计语言也没有语言不能直接使用指针,数组等数据结构,程序设计语言也没有DDL、DML。有二种处理方式:一是扩充宿主语言的编译程序,使之能处理有二种处理方式:一是扩充宿主语言的编译程序,使之能处理 SQL语句,如语句,如VC+、VB 等。另一种是自含语言,等。另一种是自含语言,DBMS 有自己的编译器,也有程序控制命令,有自己的编译器,也有程序控制命令,可直接用于编写数据库应用程序,如可直接用于编写数据库应用程序,如 VFP、DELPHI 等,使用方便,很受欢迎。等,使用方便,很受欢迎。市亚料砰棠珐囤伶声摘皂暴蚁狱矗瞩庐威纶汐脆隅吠吃怎丁卓恬妈迄戎

44、枢第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关系型数据库关系型数据库关关系系模模型型的的特特点点:数数据据结结构构是是二二维维表表格格,简简单单易易理理解解;集集合合论论是是其其理理论基础论基础有严密的关系运算理论和关系模式设计理论:有严密的关系运算理论和关系模式设计理论:关关系系模模型型面面向向集集合合处处理理,一一次次可可操操作作多多个个元元组组,层层次次、网网状状模模型型一一次次只只能操作一个元组;能操作一个元组;关关系系模模型型有有视视图图等等工工具具,应应用用不不随随数数据据库库改改变变而而改改变变,有有数数据据逻逻辑辑独独立立性;性;

45、RDBMS 只只需需指指出出“做做什什么么”不不必必指指出出“怎怎么么做做”,层层次次、网网状状模模型型必必须须在在应用程序中用指针指出数据访问路径。应用程序中用指针指出数据访问路径。关系型数据库的基本概念关系型数据库的基本概念数数据据库库的的数数据据结结构构是是一一个个由由元元组组行行和和属属性性列列组组成成的的关关系系,或或直直接接称称作作二二维维表表或或表表,用以表示实体集。用外键实现实体集间的联系。用以表示实体集。用外键实现实体集间的联系。关关系系的的定定义义:关关系系是是元元组组的的集集合合,元元组组是是集集合合中中的的元元素素,一一个个元元组组为为K(K=1)个属性的集合。关系有如

46、下限制:)个属性的集合。关系有如下限制:1)关系中每一个属性值不可分解,即不允许)关系中每一个属性值不可分解,即不允许“表中套表表中套表”,也不允许出现重复值。,也不允许出现重复值。2)属属性性的的取取值值范范围围称称值值域域,每每个个属属性性对对应应一一个个值值域域,不不同同属属性性可可对对应应同同一一值值域域。关关系系中中各各属属性性的的次次序序不不改改变变关关系系的的实实际际意意义义。元元组组中中属属性性理理论论上上是是无无序序的的,但但在在用用户户使使用用时时应考虑其有序排列。应考虑其有序排列。3)关系中元组代表具体实体,不允许出现相同元组。元组的顺序不改变关系的意义。)关系中元组代表

47、具体实体,不允许出现相同元组。元组的顺序不改变关系的意义。实实际际上上,关关系系、元元组组和和属属性性等等术术语语来来自自于于关关系系数数学学,多多数数人人习习惯惯直直接接将将关关系系称称为为表,元组称为记录或行,属性称为字段或列。表,元组称为记录或行,属性称为字段或列。滓欺贼题耳寒师示弱若趣花苗琳植了甲志泥田勇快洋琅包勒泣葵何蛋炉忘第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关系型数据库关系型数据库键键(keykey)又又称称关关键键字字关关系系模模型型的的一一个个重重要要概概念念,键键是是由由一一个个或或多多个个属属性性组组成。有下列几种键:成

48、。有下列几种键:超键(超键(super key):):在关系模式中,能标识唯一元组的属性集。在关系模式中,能标识唯一元组的属性集。侯选键(侯选键(candidate key):):能标识唯一元组又无多余属性的属性集。能标识唯一元组又无多余属性的属性集。主主键键(主主关关键键字字):用用户户选选择择使使用用的的标标识识唯唯一一元元组组的的一一个个侯侯选选键键。主主键键必必须须唯唯一一,不能为空(不能为空(NULL),以保证标识唯一元组。),以保证标识唯一元组。外外键键:如如果果关关系系R中中的的主主键键又又是是另另一一个个关关系系P的的侯侯选选键键的的组组成成部部分分,则则它它是是关关系系P的外

49、部主键或简称外键。外键不是关系的外部主键或简称外键。外键不是关系P的主键,但用它构成关系的主键,但用它构成关系R和和P的联系。的联系。次键又称次关键字:次键又称次关键字:用以标识一类元组的一个或多个属性。用以标识一类元组的一个或多个属性。关系数据模型的完整性规则关系数据模型的完整性规则字字段段(用用户户定定义义)完完整整性性:针针对对某某个个具具体体数数据据项项的的约约束束条条件件,取取决决于于环环境境。系系统统提供定义和检验完整性的机制,无需应用程序承担,保证收集数据的准确性。提供定义和检验完整性的机制,无需应用程序承担,保证收集数据的准确性。如学生年龄定义为两位数,可进一步限制为如学生年龄

50、定义为两位数,可进一步限制为1530之间,保证系统收集准确的数据。之间,保证系统收集准确的数据。记记录录(实实体体)完完整整性性:要要求求关关系系中中元元组组在在主主键键的的属属性性值值不不能能为为空空,否否则则不不能能起起到到唯一标识元组的作用;取决环境,要求元组中某些属性之间的相互约束条件。唯一标识元组的作用;取决环境,要求元组中某些属性之间的相互约束条件。如在职工实体集中,职工的年龄应大于等于工龄如在职工实体集中,职工的年龄应大于等于工龄+16,否则为非法记录。,否则为非法记录。引引用用完完整整性性又又称称参参照照完完整整性性:关关系系数数据据库库中中依依靠靠外外码码实实现现表表间间的的

51、联联系系,不不允允许许引引用不存在的元组。否则将导致插入或删除异常现象,出现孤立无联系的元组。用不存在的元组。否则将导致插入或删除异常现象,出现孤立无联系的元组。如如插插入入一一个个职职工工,外外码码车车间间号号是是允允许许置置为为空空(NULL),但但不不允允许许车车间间号号的的值值不不在在车车间间表表中中。若若要要删删除除车车间间表表中中某某个个元元组组,对对职职工工表表中中对对应应的的车车间间号号是是必必须须采采取取三三种种方方法法之之一一才才能能保保证证引引用用完完整整性性:一一是是删删除除职职工工表表中中相相关关的的元元组组;二二是是将将职职工工表表中中相相关关元元组组车车间间号号为

52、空,或其它存在的车间号;三是若职工表中存在要删除车间号时,禁止删除。为空,或其它存在的车间号;三是若职工表中存在要删除车间号时,禁止删除。兰伞邮唬讹椎越幽懒贝尹袁馏赔诧挠暗仅学饰拳询酵瞻野墓奶猩啃掐宰挚第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关系模型的操作关系模型的操作关关系系模模型型集集中中反反映映在在关关系系代代数数上上,它它允允许许用用户户在在整整个个关关系系范范围围内内进进行行操操作作,非关系模型所支持的语言一般只能操作数据库的一个记录。非关系模型所支持的语言一般只能操作数据库的一个记录。关关系系模模型型的的操操作作分分为为两两类类:代

53、代数数操操作作和和关关系系操操作作。投投影影、筛筛选选和和联联结结是是所所有有RDBMS必备的关系操作,称关系数据库的特征操作。必备的关系操作,称关系数据库的特征操作。投投影影(projection):投投影影操操作作从从关关系系中中垂垂直直地地选选择择指指定定的的列列,消消去去一一些些列列,并并重重新新安安排排列列的的顺顺序序构构成成的的关关系系。即即关关系系进进行行重重点点减减维维,满满足足某某些些属属性性要要求求,重新组成的关系。重新组成的关系。筛筛选选(select):筛筛选选操操作作从从关关系系中中水水平平地地选选择择出出满满足足条条件件要要求求的的元元组组子子集集构成的关系。构成的

54、关系。联联结结(join):联联结结是是双双目目操操作作,它它把把两两个个关关系系联联结结成成一一个个新新关关系系,笛笛卡卡儿儿积是基础。积是基础。笛笛卡卡儿儿积积(cartesian product):设设关关系系R和和S的的元元数数分分别别为为r和和s ,则则R和和S 的的笛笛卡卡儿儿积积是是一一个个(r+s)元元的的元元组组集集合合,每每个个元元组组前前r个个分分量量来来自自R的的一一个个元元组组,后后s个个分分量量来来自自S的的一一个个元元组组。笛笛卡卡儿儿积积联联结结所所得得的的表表(元元组组和和列列数数)往往往往十十分分庞庞大大,而实际意义不大。而实际意义不大。条件联结:条件联结:

55、是关系是关系R和和S的笛卡儿积中选出满足的笛卡儿积中选出满足条件两个关系的元组。条件两个关系的元组。自自然然联联结结(natural join):是是实实用用价价值值很很大大的的一一种种联联结结,它它要要求求被被联联结结的的两两个个关关系系有有若若干干相相同同的的属属性性(字字段段)名名。在在公公共共属属性性上上具具有有相相等等值值为为依依据据,进进行行元元组组合合并并构构成成的的关关系系。自自然然联联结结先先做做RS计计算算,再再从从公公共共属属性性上上具具有有相相等等值值为为条条件件筛筛选选,提取满足条件的元组,去掉重复的公共属性,得到自然联结的结果。提取满足条件的元组,去掉重复的公共属性

56、,得到自然联结的结果。教光正帕手清电消彰阳几霸厉帕绵皮缎阳狗隔杀曲药卉挖灿通皑玲护虏摇第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关系型数据库关系型数据库结构化查询语言结构化查询语言SQLSQL(Structured Query Language)查询命令查询命令SQL确确定定为为美美国国国国家家标标准准和和国国际际标标准准的的关关系系数数据据库库语语言言。目目前前所所有有的的关关系系型型数数据据库库管理系统,从大型数据库到微机关系型数据库管理系统都支持管理系统,从大型数据库到微机关系型数据库管理系统都支持SQL。程程序序设设计计人人员员和和终终端

57、端用用户户,使使用用SQL语语言言对对数数据据库库中中的的数数据据进进行行检检索索、修修改改、定定义义和管理。和管理。SQL包括:数据定义、数据查询、数据操纵和数据控制。包括:数据定义、数据查询、数据操纵和数据控制。特特点点:SQL语语言言既既是是自自含含式式语语言言,又又是是嵌嵌入入式式语语言言。可可用用于于联联机机交交互互使使用用方方式式,便便于于数数据据库库管管理理员员维维护护数数据据库库和和提提取取信信息息,又又可可嵌嵌入入程程序序设设计计高高级级语语言言的的程程序序中中,便便于于编编写写数数据据库库应应用用程程序序;SQL语语言言是是面面向向问问题题型型的的语语言言,在在进进行行数数

58、据据操操作作时时,只只需需指指出出“做做什什么么”,不不必必指指出出“怎怎么么做做”,大大大大减减轻轻了了用用户户的的负负担担;加加之之功功能能丰丰富富,语语法法简单、易学易用,深受用户欢迎。简单、易学易用,深受用户欢迎。查询是查询是SQL的核心,的核心,Foxpro 数据库查询命令格式数据库查询命令格式:SELECT ALL/DISTINCT别名别名.选择项选择项AS 别名别名,别名别名.选择项选择项AS 别名别名 FROM 表名表名表别名表别名,表名,表名表别名表别名 INTO 目目标标表表名名/TO FILE 文文件件名名ADDITIVE/TO PRINTERPROMPT/TO SCRE

59、ENWHERE 条件条件GROUP BY 分组列分组列,分组列,分组列HAVING 过滤条件过滤条件UNION ALL SELECT 命令命令ORDER BY 排序项排序项 ASC/DESC,排序项,排序项 ASC/DESC 该查询命令共有七个子句,除该查询命令共有七个子句,除SELECT和和FROM子句外,其它可以任选。子句外,其它可以任选。撵楔陈销烽追饰痕渐琵误衣服菠旁垮绕唬怖贿短倦赚缄剐星辱篙仗营艰垒第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关系型数据库关系型数据库SQLSQL查询命令查询命令Foxpro 数数据据库库查查询询命命令令格格式

60、式:FROM子子句句用用来来指指明明查查询询出出自自一一个个或或多多个个表表的的表表名名;INTO短短语语指指明明查查询询结结果果目目标标表表的的去去向向,忽忽略略INTO短短语语表表明明查查询询结结果果出出现现在在BROWSE浏浏览览窗窗口口中中。SELECT子子句句指指明明查查询询表表(一一个个或或多多个个表表)投投影影字字段段,选选择择项项还还可可以以是是常常量量、表表达达式式和和系系统统函函数数,如如AVG,MAX,MIN,COUNT和和SUM等等用用以以建建立立目目标标表表的的新新字字段段,用用“AS 别别名名”指指定定新新字字段段名名。WHERE子子句句指指明明查查询询表表记记录录

61、筛筛选选条条件件和和查查询询表表为为多多个个表表时时的的联联接接条条件件,多多表表条条件件筛筛选选选选中中记记录录构成目标表的记录集合。忽略构成目标表的记录集合。忽略WHERE子句表明无筛选或联接条件。子句表明无筛选或联接条件。GROUP BY子子句句将将查查询询结结果果分分组组;HAVING子子句句和和GROUP BY子子句句联联用用通通过过“过过滤滤条条件件” 进进一一步步说说明明分分组组;UNION 子子句句中中,由由SELECT命命令令组组成成另另一一个个子子查查询询,将当前查询结果与子查询的结果进行并操作;将当前查询结果与子查询的结果进行并操作;ORDER BY将查询结果排序。将查询

62、结果排序。例例 查查询询“职职工工工工资资”表表、显显示示女女职职工工而而且且基基本本工工资资大大于于300元元的的职职工工名名单单,要要求求显显示示职职工工姓姓名名,性性别别,工工作作部部门门,工工作作日日期期,基基本本工工资资和和应应发发工工资资。其其中中应应发发工工资是新添字段,应发工资资是新添字段,应发工资=基本工资基本工资+煤粮补贴煤粮补贴+副食补贴。查询命令:副食补贴。查询命令:SELECT 职职工工姓姓名名,性性别别,工工作作部部门门,工工作作日日期期,基基本本工工资资,基基本本工工资资+煤煤粮粮补补贴贴+副副食食补补贴贴 as 应应发发工工资资 FROM 职职工工工工资资 WH

63、ERE 性性别别=女女 AND 基基本本工工资资300抗晒付啤腕芯抹喀撕肖厅答份池鲁厩变冷氓恰疹舒瞩雕愁坤置匀奠舱谍耪第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关系型数据库关系型数据库关关系系数数据据库库设设计计:数数据据库库应应用用系系统统可可以以分分步步实实施施,但但数数据据库库设设计计必必须须先先行行,且且一一定定要要以以系系统统的的、全全局局的的观观念念进进行行设设计计。数数据据库库设设计计好好坏坏直直接接影影响响应用系统性能,最坏可导致应用系统无法实现。应用系统性能,最坏可导致应用系统无法实现。数数据据库库逻逻辑辑设设计计步步骤骤:用用

64、户户需需求求分分析析;E-R模模型型设设计计,确确定定实实体体;确确定定实实体属性及表间的联系;优化设计。体属性及表间的联系;优化设计。关关系系数数据据库库实实体体联联系系模模型型:在在用用户户需需求求的的驱驱动动下下,可可用用E-R图图确确定定了了系系统统所须的实体和实体间的联系。所须的实体和实体间的联系。1:1的的联联系系:将将任任何何一一个个关关系系的的主主键键,加加入入另另一一关关系系作作为为外外键键,即即可可两两个个关关系系间的联系。间的联系。例例 学校与校长两个实体集如下:学校与校长两个实体集如下: 学校学校S(学校名称学校名称,地址,电话),地址,电话) 校长校长P(校长姓名校长

65、姓名,性别,年龄,职称),性别,年龄,职称)学校与校长间存在学校与校长间存在1:1联系,建立联系后的关系模型为:联系,建立联系后的关系模型为: 学校学校S(学校名称学校名称,校长姓名校长姓名,地址,电话),地址,电话) 校长校长P(校长姓名校长姓名,性别,年龄,职称),性别,年龄,职称)或或 学校学校S(学校名称学校名称,地址,电话),地址,电话) 校长校长P(校长姓名校长姓名,学校名称学校名称,性别,年龄,职称),性别,年龄,职称)注:直线下划线表示关系的主键,波浪线下划线表示外键。注:直线下划线表示关系的主键,波浪线下划线表示外键。牌弘蔬妻遂歹寄咏姆密峡锣旋漆注寅华刚衫飞鸿桨孩磋蚤滨明未兆

66、邹丑枢第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关系数据库实体联系关系数据库实体联系模型:模型:1:M联系:联系:在在M端关系中加入端关系中加入1端关系的主键作外键构成联系。端关系的主键作外键构成联系。如果将如果将1端关系的主键加入端关系的主键加入M端关系中作外键构成端关系中作外键构成1:M联系,会造成外键很多冗余。联系,会造成外键很多冗余。例例 车间和职工两个实体集如下:车间和职工两个实体集如下: 车间车间W(车间号车间号,车间名称,电话),车间名称,电话) 职工职工E(职工号职工号,姓名,性别,年龄,聘期),姓名,性别,年龄,聘期)车间聘用职

67、工是车间聘用职工是1:M的联系,建立联系后的关系模型为:的联系,建立联系后的关系模型为: 车间车间W(车间号车间号,车间名称,电话),车间名称,电话) 职工职工E (职工号职工号,车间号车间号,姓名,性别,年龄,聘期),姓名,性别,年龄,聘期)M:N联联系系:关关系系型型数数据据库库不不支支持持多多对对多多的的联联系系,引引入入纽纽带带将将其其分分解解为为两两个个一一对对多的联系。纽带表分别将二个关系的主键,联系的属性置于纽带表中构成。多的联系。纽带表分别将二个关系的主键,联系的属性置于纽带表中构成。例例 教学模型中,学生和课程两个实体集为:教学模型中,学生和课程两个实体集为: 学生学生S (

68、学号学号,姓名,性别),姓名,性别) 课程课程C (课号课号,课名,学分,开课学期,学时数),课名,学分,开课学期,学时数)学学生生和和课课程程两两个个实实体体集集间间,由由学学生生选选课课建建立立M:M联联系系,选选课课联联系系有有成成绩绩、积积点点属属性性,建立联系后的关系模型为:建立联系后的关系模型为: 学生学生S (学号学号,姓名,性别),姓名,性别) 课程课程C (课号课号,课名,学分,开课学期,学时数),课名,学分,开课学期,学时数) 选课选课SC(学号学号,课号课号,成绩,绩点),成绩,绩点)选课联系的属性置于称选课的纽带表中,不合适置于学生或课程关系中。选课联系的属性置于称选课

69、的纽带表中,不合适置于学生或课程关系中。假设用户所需的子模式:假设用户所需的子模式: 成绩子模式成绩子模式G(学号学号,姓名,姓名,课名课名,成绩,绩点),成绩,绩点)子模式子模式G反映了用户使用的数据视图,对应的数据来自关系模式的反映了用户使用的数据视图,对应的数据来自关系模式的s和和sc。 架鳖交误竣届桌涣狸髓悲团郡邢砰滓旨蠕疲话男藉缉誓雹扩漂童舆两潞节第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术关关系系数数据据库库规规范范化化理理论论(Normal Form,简简称称范范式式NF) :研研究究从从多种组合中选取一个性能好的关系集合,减少数据冗

70、余和便于维护。多种组合中选取一个性能好的关系集合,减少数据冗余和便于维护。范范式式理理论论对对操操作作数数据据库库设设计计十十分分重重要要,用用于于确确定定表表的的属属性性定定义义,表表的的分分解解。表表的的范范式式可可分分5个个等等级级,且且满满足足较较高高等等级级范范式式者者必必须须满满足足较较低低等等级级范范式式。一一般,满足前三个范式即已有比较满意的性能。般,满足前三个范式即已有比较满意的性能。1NF如如果果关关系系模模式式中中的的关关系系R,其其所所有有属属性性的的值值域域中中每每一一个个值值不不可可再再分分解解,称称R满足第一范式(满足第一范式(1NF),否则将其分解。),否则将其

71、分解。表表是是一一个个简简表表,任任何何一一字字段段不不能能为为子子表表,或或字字段段值值不不能能是是数数组组、集集合合、枚枚举举量量。RDBMS 不支持数组、列表和嵌套的原因。不支持数组、列表和嵌套的原因。例例 工资(工号,姓名,基本工资,加班补贴,交通补贴,工资(工号,姓名,基本工资,加班补贴,交通补贴,)在在工工资资表表套套有有补补贴贴表表,而而且且补补贴贴项项是是枚枚举举量量,非非1NF的的关关系系。如如果果可可能能全全部部列列举举,有有的的职职工工可可能能有有其其中中的的几几项项,有有的的可可能能一一项项也也没没有有,空空白白项项浪浪费费存存储储空空间间十十分分可可观观。如如果果采用

72、其它补贴一是无法清楚表达究竟是些什么补贴,二是必须介入人工计算。采用其它补贴一是无法清楚表达究竟是些什么补贴,二是必须介入人工计算。将补贴表从工资表分离,对应的两个符合将补贴表从工资表分离,对应的两个符合1NF关系为:关系为: 工资(工资(工号工号,姓名,基本工资),姓名,基本工资) 补贴(补贴(补贴名称补贴名称,补贴数),补贴数)2NF满满足足1NF的的关关系系R,且且R中中每每一一个个非非主主属属性性完完全全函函数数依依赖赖于于主主键键属属性性,则则称称R满足第二范式。即每一个非主属性不能函数依赖主键属性的一部分。满足第二范式。即每一个非主属性不能函数依赖主键属性的一部分。例例 学生社团(

73、学生社团(学号,社团代号学号,社团代号,姓名,性别,社团名称),姓名,性别,社团名称)满满足足1NF,但但不不满满足足2NF,学学生生姓姓名名、性性别别只只依依赖赖于于学学号号,和和社社团团无无关关。社社团团名名称称只只依依赖于社团代号,和学号无关。赖于社团代号,和学号无关。寨却犊时钵荆谆狸异洗蛀侣健去鞠侥尺公况秦瞅讶喷篙冻谢刺厅斯野疼姓第六章数据资源管理技术第六章数据资源管理技术关系数据库规范化理论关系数据库规范化理论不不满满足足2NF关关系系,会会引引起起数数据据冗冗余余和和插插入入、删删除除异异常常现现象象。例例如如插插入入新新社社团团而而缺缺少少学学号号无无法法添添加加;当当删删去去某

74、某个个学学生生信信息息时时,可可能能会会丢丢失失有有关关的的社社团团信信息息。解解决决方方法法:将将非非函数依赖部分分解成二个或多个满足要求第二范式(函数依赖部分分解成二个或多个满足要求第二范式(2NF)的关系。)的关系。 学生(学生(学号学号,姓名,性别),姓名,性别) 社团(社团(社团代号社团代号,名称),名称) 学生社团(学生社团(学号学号,社团代号社团代号)3FN满满足足第第二二范范式式的的关关系系R,且且非非主主链链属属性性都都不不传传递递依依赖赖主主链链属属性性,则则R满满足足第三范式的关系。第三范式的关系。例例 产品供销(产品供销(产品代码产品代码,名称,规格,供应商名,供应商地

75、址),名称,规格,供应商名,供应商地址)非非3FN关系同样存在冗余和更新异常问题。解决方法,分解成多个满足关系同样存在冗余和更新异常问题。解决方法,分解成多个满足3FN的关系。的关系。 产品(产品(产品代码产品代码,名称,规格,名称,规格,供应商名供应商名) 供应商(供应商(供应商名供应商名,供应商地址),供应商地址)关关系系规规范范化化实实际际上上是是关关系系分分解解,关关系系属属性性确确定定的的过过程程,通通过过分分解解使使关关系系达达到到较较高高的范式。分解可有多种可能性,但必须遵循关系分解的基本原则:的范式。分解可有多种可能性,但必须遵循关系分解的基本原则:无损分解原则,即分解后不丢失

76、信息;无损分解原则,即分解后不丢失信息;独独立立关关系系分分解解原原则则,即即分分解解后后的的关关系系必必须须相相互互独独立立,避避免免对对一一个个关关系系的的修修改改,涉涉及到另一个关系。及到另一个关系。关关系系型型数数据据库库最最大大特特点点之之一一,它它有有坚坚实实的的理理论论基基础础。关关系系代代数数以以集集合合代代数数为为基基础础,以关系(表)为分散对象的一组分散集合。以关系(表)为分散对象的一组分散集合。第六章第六章 数据资源管理技术数据资源管理技术标雁驼夏糜褂孝布旧乱觉半铺阳渠朔朵擞果赏福娶猿襟犬栅徐宫夕痘王衔第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理

77、技术数据资源管理技术数据库数据库技术技术的发展的发展分布式数据库系统:分布式数据库系统:是数据库是数据库DB技术与网络技术结合的产物。技术与网络技术结合的产物。集集中中式式数数据据库库系系统统:数数据据集集中中在在一一台台服服务务器器上上,完完成成数数据据管管理理和和数数据据处处理理。集集中中数数据据易易于于管管理理,可可减减少少冗冗余余,应应用用程程序序与与数数据据间间有有较较高高的的独独立立性。但系统不灵活,安全性差,数据服务器发生故障,导致系统瘫痪。性。但系统不灵活,安全性差,数据服务器发生故障,导致系统瘫痪。分分布布式式数数据据库库系系统统:将将数数据据库库分分散散在在多多台台服服务务

78、器器上上,通通过过网网络络通通信信连连接接构构成成逻逻辑辑整整体体,分分布布式式DBMS管管理理分分布布环环境境下下逻逻辑辑集集成成数数据据的的存存取取、一一致性、有效性和完整性的软件。致性、有效性和完整性的软件。分分布布式式数数据据库库系系统统灵灵活活、可可扩扩展展性性好好、可可靠靠性性高高、局局部部应应用用响响应应速速度度快快,特特别别适适合合分分布布式式管管理理和和控控制制的的机机构构。但但数数据据安安全全性性和和保保密密性性处处理理困困难难,远远程程访访问问时时,化化费费在在通通信信上上的的开开销销较较大大,如如系系统统并并发发控控制制、故故障障恢恢复复和和远程数据访问技术复杂。远程数

79、据访问技术复杂。分布式数据库系统是非常实用、有发展前景的数据库系统。分布式数据库系统是非常实用、有发展前景的数据库系统。面向对象数据库:面向对象数据库:是面向对象技术与数据库技术结合的产物。是面向对象技术与数据库技术结合的产物。RDBMS只只能能处处理理格格式式化化数数据据,不不能能处处理理非非格格式式化化多多媒媒体体数数据据,如如图图形形、图图象象、声声音音、正正文文等等,也也不不支支持持新新的的数数据据类类型型和和嵌嵌套套、递递归归的的数数据据结结构构,难难以以满满足足计计算算机机应应用用领领域域的的拓拓宽宽的的需需要要,如如CAD/CAM、CIMS、CASE、OA等领域的应用。等领域的应

80、用。有有两两种种模模型型:对对象象关关系系模模型型ORDBMS是是在在传传统统关关系系数数据据库库上上,扩扩充充SQL语语言言,支支持持处处理理非非结结构构化化数数据据的的结结构构。面面向向对对象象模模型型OODBMS是是在在程程序序设计语言设计语言OOPL上扩充能操作持久性数据,处理数据库。上扩充能操作持久性数据,处理数据库。獭站步窥覆椽触胸宵盈师痕止镰鄙游被逃婿球序谗沮逸粱垮瓦舆途眷腋躁第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术数据库数据库技术技术的发展的发展数数据据集集市市和和数数据据仓仓库库:一一个个组组织织或或企企业业在在运运转转时时,

81、系系统统数数据据库库应应该该随随时时收收集集数数据据,称称操操作作数数据据库库,它它为为联联机机事事务务处处理理OLTP提提供供服服务务。数数据据仓仓库库(Data Warehouse)的的目目的的是是巩巩固固、存存储储和和管管理理从从数数据据库库中中抽抽取取的的数数据据,用用以以分分析析、解解释释,用用业业务务所所积积累累的的数数据据作作指指导导,支支持趋势、分析、解释和组织的决策。持趋势、分析、解释和组织的决策。数数据据仓仓库库是是一一个个面面向向主主题题的的、集集成成的的、稳稳定定的的数数据据集集合合,主主要要用用于于非非结结构构化化决决策策的的联联机机分分析析处处理理OLAP,是是操操

82、作作数数据据库库的的数数据据库库。数数据按主题组织,具有时间片的、历史数据,不被更改。据按主题组织,具有时间片的、历史数据,不被更改。因因为为,非非结结构构化化决决策策所所遇遇到到的的问问题题具具有有不不确确定定性性,数数据据仓仓库库必必须须有有较操作数据库大得多的容量,适应联机分析处理、决策支持的所需。较操作数据库大得多的容量,适应联机分析处理、决策支持的所需。数数据据仓仓库库可可以以很很快快成成长长为为一一个个大大系系统统,经经常常是是千千兆兆字字节节的的信信息息,任任何何特特殊殊或或不不经经常常使使用用的的分分析析查查询询对对数数据据访访问问都都会会成成为为问问题题。数数据据集集市市(D

83、ata Mart)是是一一个个部部门门或或小小的的数数据据仓仓库库,被被一一个个小小组组织织优优化化和和维维护护,以以满满足足他他们们的的需需求求。数数据据集集市市可可以以认认为为是是部部门门仓仓库库或或小小仓仓库库,是主仓库的子仓库。是主仓库的子仓库。癣京家鼻淆剂箕勇殆凰厕烂弥尾辛途公鄂迅屁骋诡悯殃峨蛾壤莱恰孺务撬第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术在在没没有有任任何何解解释释时时,数数据据本本身身没没有有多多大大意意义义,数数据据及及对对数数据据的的解解释释、分分析构成信息。信息是一种价值高于原数据的资源。析构成信息。信息是一种价值高于

84、原数据的资源。操作数据库:操作数据库:保障组织业务的运作,跟踪组织运作的整过程,其特点:保障组织业务的运作,跟踪组织运作的整过程,其特点:集中在某个特定时间,针对少量不连续的记录集中在某个特定时间,针对少量不连续的记录要求操作数据尽可能和实际情况的变化同步更新要求操作数据尽可能和实际情况的变化同步更新要求系统对所有用户的每项操作提供实时响应要求系统对所有用户的每项操作提供实时响应OLTP应应用用程程序序允允许许用用户户在在任任何何时时间间操操作作其其个个人人/少少数数人人的的数数据据,操操作作数数据据库库关键是规范化,消除操作数据库的冗余,提供快速响应能力关键是规范化,消除操作数据库的冗余,提

85、供快速响应能力适适用用于于事事务务管管理理,确确保保在在更更新新多多个个数数据据表表时时保保持持表表间间数数据据一一致致性性,虽虽然然增增加了数据库的开销,但对经常发生数据变化的数据库十分必要加了数据库的开销,但对经常发生数据变化的数据库十分必要分分析析型型数数据据库库:解解决决数数据据分分析析问问题题,它它能能对对大大数数据据量量、复复杂杂的的查查询询作作出出快速反映。适用于快速反映。适用于OLAP。其特点:。其特点:多维数据结构、集成的存储数据多维数据结构、集成的存储数据能够预先汇总和求平均值,即时查询涉及成千上万条记录也能迅速响应能够预先汇总和求平均值,即时查询涉及成千上万条记录也能迅速

86、响应两种数据库设计两种数据库设计比较:比较:操作型数据库采用规范化技术尽量减少和消除冗余,便于数据修改操作型数据库采用规范化技术尽量减少和消除冗余,便于数据修改分分析析型型数数据据库库数数据据不不仅仅可可以以接接受受冗冗余余,而而且且鼓鼓励励使使用用冗冗余余,保保留留重重复复信信息息,查查询询处处理理器器只只需需要要数数据据库库的的一一部部分分就就能能够够查查询询到到要要求求的的相相关关信信息息,改改善善系系统性能。统性能。哈幢旋朋砍居蕾抑忘阿符琐它碱深挤针切修殖杭廊罪淆丹祖沿夯怀民殊怪第六章数据资源管理技术第六章数据资源管理技术第六章第六章 数据资源管理技术数据资源管理技术OLTP与与OLA

87、P数据库设计需求对照数据库设计需求对照事务型数据库(事务型数据库(OLTP) 分析型数据库(分析型数据库(OLAP)处理个别记录处理个别记录 关注一般趋势关注一般趋势高生产率(每天数百万事务处理)高生产率(每天数百万事务处理) 低生产率(每天只有数十或数百记录)低生产率(每天只有数十或数百记录)系统的操作改变数据系统的操作改变数据 系统的操作可以回答问题系统的操作可以回答问题查询只涉及几条记录查询只涉及几条记录 查询经常波及整个数据库查询经常波及整个数据库许多操作更改源数据许多操作更改源数据 大多数操作是只读,不可更改大多数操作是只读,不可更改支持事务处理支持事务处理 不支持事务处理,支持决策不支持事务处理,支持决策需要完全时实更新需要完全时实更新 经常批量更新(例如晚上或周末)经常批量更新(例如晚上或周末)能很快反应新数据能很快反应新数据 最终反应新数据最终反应新数据蝇熔奥惟邦王苹枕房素杏坷沤岗东闹诧篷喊珠忽微衙廷亨柿拜屠突充蛋睁第六章数据资源管理技术第六章数据资源管理技术

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号